Социальная физика. Как Большие данные помогают следить за нами и отбирают у нас частную жизнь - страница 6



Социальная физика как всеохватывающая социальная наука

Большинство существующих общественных наук базируется либо на лабораторных исследованиях, либо на демографических данных – то есть средних величинах и стереотипах. Эти подходы не учитывают сложности реальной жизни, где одновременно вступают в силу все странности нашей психики. Они также упускают из виду тот крайне важный факт, что детали, имеющие отношение к людям, с которыми мы взаимодействуем, и к тому, как происходит это взаимодействие, играют не менее важную роль, чем рыночные силы и классовые системы. Социальные явления на самом деле складываются из миллионов маленьких транзакций между отдельными индивидами: люди обмениваются не только товарами и деньгами, но также информацией, замыслами и даже слухами. В этих индивидуальных транзакциях просматриваются шаблоны, вызывающие такие явления, как финансовый крах или «арабская весна». Нам необходимо понять эти микроалгоритмы, поскольку их нельзя просто свести к средним коэффициентам, поддерживающим классическое понимание общественного устройства. Большие данные дают нам возможность рассматривать общество во всей его сложности, посредством миллионов ниточек, протягивающихся от человека к человеку в процессе социального взаимодействия.

Если бы у нас было всевидящее око, мы, возможно, могли бы прийти к истинному пониманию того, как устроено общество, и предпринять шаги к решению наших проблем. К сожалению, как видно на рис. 1, практически все данные, добытые в рамках традиционных общественных наук (под номером 1), уместились рядом с координатой (0,0). Это означает, что эти наборы данных представляют собой информацию, полученную меньше чем от сотни людей и всего лишь в течение нескольких часов. Исследования под номером 2 и 3 – одни из самых крупных общественно-научных исследований на данный момент[13]. За последние десять лет социологи, работающие в области вычислений, узнали, как можно задействовать большие данные, и начали использовать пакеты информации, полученные, например, от операторов сотовой связи и компаний, занимающихся социальными сетями. Типичные примеры таких исследований представлены под номером 4. Увы, даже эти большие наборы данных скудны, так как они измеряют лишь по несколько переменных за раз. Таким образом, они дают очень ограниченное представление о человеческой природе.


Рис. 1. Квалитативный обзор наблюдений и экспериментов в области общественных наук. Горизонтальная ось показывает продолжительность сбора данных, вертикальная ось – объем и качество полученной информации. Показаны следующие комплексы данных: (1) Большинство научных экспериментов в области общественных наук; (2) Midwest Field Station (Barker 1968); (3) Framingham Heart Study (Dawber 1980); (4) Данные, полученные от телефонных операторов (Gonzalez et al. 2008; Eagle et al. 2010; Hidalgo and Rodriquez-Sickert 2008); (5) Исследования Reality Mining («добыча реальности») (Eagle and Pentland 2006); (6) Социальное развитие (Madan et al. 2012); (7) Друзья и родственники (Aharony et al. 2011); (8) данные электронных бейджей (Pentland 2012b); (9) «Данные в целях развития» (D4D, http://www.d4d.orange.com/home); (10) общее направление развития.


Социальная физика стремится получить как можно более глубокие и всеохватные количественные описания. Исследования под номерами 5, 6 и 7 проводились моей собственной исследовательской группой, которая использовала смартфоны для сбора информации; они использовали «социометры», или «умные» электронные бейджи с именами, для сбора данных для исследования номер 8 (подробности см. в Приложении 1: Добыча реальности); а для исследования под номером 9 – набор «данных в целях развития» (D 4D), охватывающих всю территорию Кот-д’Ивуар.