Big Data, цифровая революция и конец свободного мира

О Мудрейший
Декабрь 7, 2016

В половине девятого утра 9 ноября Михал Козинский проснулся в цюрихском отеле Sunnehus. 34-летний ученый приехал для того, чтобы выступить в Федеральной высшей технической школе (ETH) с докладом на конференции об опасности Big Data и так называемой «цифровой революции». С подобными лекциями Козинский разъезжает по всему миру: ведь он является ведущим экспертом в психометрии — разделе психологии, основанном на анализе данных. Включив тем утром телевизор он понял: бомба разорвалась. Дональд Трамп избран президентом США, несмотря на все прогнозы социологов.

Козинский долго смотрит новости о триумфе Трампа, о результатах голосования по разным штатам. Он подозревает, что произошедшее как-то связано с его научными разработками. Козинский вздыхает и выключает телевизор.

В тот же день доселе малоизвестная лондонская фирма рассылает пресс-релиз следующего содержания: «Мы поражены тем, что наш революционный подход к основанным на данных коммуникациям внес такой существенный вклад в победу Дональда Трампа». Пресс-релиз подписан неким Александром Джеймсом Эшбернером Никсом. Ему 41 год, он британец и возглавляет компанию Cambridge Analytica. Никс всегда носит костюм, модные роговые очки, а свои светлые волнистые волосы обычно зачесывает назад.

Задумчивый Козинский, прилизанный Никс и широко улыбающийся Трамп — первый сделал цифровую революцию возможной, второй осуществил ее, последний стал благодаря ей победителем.

Насколько опасна Big Data?

Сейчас каждый, кто не жил на Луне последние пять лет, знаком с термином Big Data. Этот термин значит и то, что все, что мы делаем — в интернете или «офлайн» — оставляет цифровой след. Покупка по кредитке, запрос в Google, прогулка со смартфоном в кармане, каждый лайк в соцсети: все это сохраняется. Долгое время никто не мог понять, для чего хорошего могли бы пригодиться эти данные — ну лишь кроме тех случаев, когда в ленте Facebook всплывает реклама средств от гипертонии, потому что недавно мы искали в Google «как понизить давление». Непонятно было и то, чем же является Big Data для человечества — большой опасностью или большим достижением? Но с 9 ноября мы знаем на это ответ. Ведь и за предвыборной кампанией Трампа в интернете, и за кампанией в поддержку Brexit стоит одна и та же компания, исследующая Big Data: Cambridge Analytica и ее директор Александр Никс. Кто хочет понять природу этих голосований (и природу того, что ожидает Европу в ближайшие месяцы), должен начать с примечательного события, произошедшего в 2014 году в британском Кембриджском университете. А именно, на кафедре психометрии Козинского.

Психометрия, которую иногда зовут психографией, представляет собой попытку измерить человеческую личность. В современной психологии стандартом является так называемый «метод океана» (по буквам OCEAN, анаграмму пяти измерений на английском языке). В 1980-е годы два психолога доказали, что каждая черта характера может быть измерена при помощи пяти измерений. Это так называемая «большая пятерка»: открытость (насколько вы готовы к новому?), добросовестность (насколько вы перфекционист?), экстраверсия (как вы относитесь к социуму?), доброжелательность (насколько вы дружелюбны и готовы к сотрудничеству?) и нейротизм (насколько легко вас вывести из себя?) На основе этих измерений можно точно понимать, с каким человеком имеешь дело, в чем его желания и страхи, наконец, как он себя может вести. Проблема была в сборе данных: чтобы что-то понять о человеке, от него требовалось заполнить огромный опросник. Но потом появился интернет, затем Facebook, затем Козинский.

В 2008 году студент из Варшавы Михал Козинский начал новую жизнь: он поступил в престижный английский Кембридж, в Центр психометрии, лабораторию Кэвендиш, самую первую лабораторию по психометрии в мире. Со своими однокурсниками он придумал и запустил приложение для Facebook под названием MyPersonality. Пользователю предлагалось ответить на огромный список вопросов («легко ли вас вывести из себя в состоянии стресса? Есть ли у вас склонность критиковать окружающих?»), получив затем свой «профиль личности», а создатели приложения получали бесценные личные данные. Вместо ожидавшихся данных по дюжине однокурсников, создатели получили информацию по сотням, тысячам, а затем и миллионам людей. Два докторанта собрали тем самым крупнейший «урожай» данных в истории психологических исследований.

Процесс, который Козинский сотоварищи разработал за последующие несколько лет, достаточно прост. Во-первых, тестируемый получает список вопросов, онлайн-тест. Из ответов на него ученые вычисляют личные ценности испытуемого. Далее, Козинский с командой изучают действия испытуемого: лайки и репосты в Facebook, а также его пол, возраст и место жительства. Так исследователи получают связи. Из простого анализа данных в сети могут получится необычные выводы. Например, если мужчина подписан на страничку бренда косметики MAC, он с высокой вероятностью является геем. Наоборот, сильный показатель гетеросексуальности — если человек поставил лайк хип-хоп группе Wu-Tang Clan из Нью-Йорка. Поклонник Леди Гаги с высокой долей вероятности экстраверт, а человек, ставящий «нравится» философским постам — интроверт.

Анализа 68 лайков в Facebook достаточно, чтобы определить цвет кожи испытуемого (с 95% вероятностью), его гомосексуальность (88% вероятности) и приверженность Демократической или Республиканской партии
Козинский и его коллеги беспрестанно совершенствовали свою модель. В 2012 году Козинский доказал, что анализа 68 лайков в Facebook достаточно, чтобы определить цвет кожи испытуемого (с 95% вероятностью), его гомосексуальность (88% вероятности) и приверженность Демократической или Республиканской партии США (85% вероятности). Но процесс идет дальше: интеллектуальное развитие, религиозные предпочтения, пристрастие к алкоголю, курению или наркотикам. Данные даже позволяли узнать, развелись ли родители испытуемого до его совершеннолетия или нет. Модель оказалась настолько хороша, что стало возможным предугадывать ответы испытуемого на определенные вопросы. Опьяненный успехом, Козинский продолжал: скоро модель смогла лучше узнавать личность после десяти изученных лайков, нежели его коллеги по работе. После 70 лайков — лучше, чем друг. После 150 лайков — лучше, чем родители. После 300 лайков — лучше, чем партнер. С еще большим количеством изученных действий можно было бы узнать о человеке лучше, чем он сам. В день, когда Козинский опубликовал статью о своей модели, он получил два звонка: жалобу и предложение работы. Оба звонка были из компании Facebook.

Только для друзей

Теперь на Facebook можно отмечать свои посты как открытые и приватные, «подзамочные»: во втором случае просматривать их могут лишь определенный круг друзей. Но для сборщиков данных и это не проблема. Если Козинский всегда запрашивал соглашения пользователей Facebook, современные тесты требуют доступа к персональным данным как обязательного условия для их прохождения.

Но речь не только об отметках «нравится» в Facebook: Козинский и команда могут оценивать людей по Большой пятерке критериев исходя из их юзерпика, фотографии в соцсетях. Или даже по числе друзей: хороший показатель экстраверсии! Но мы также сдаем личные данные, когда находимся не в сети. Датчик движения в смартфоне показывает, размахиваем ли мы рукой с ним, как далеко ездим (коррелирует с эмоциональной нестабильностью). Как замечает Козинский, смартфон — это огромный психологический опросник, который мы вольно или невольно заполняем. Что особенно важно, это работает и в обратную сторону: можно не только создавать из данных психологический портрет, вы можете искать среди этих портретов нужные. Например, обеспокоенные папаши, озлобленные интроверты, не определившиеся с выбором сторонники демократов. По сути, Козинский изобрел поисковую систему по людям.

Все явственнее Козинский понимал и потенциал, и опасность своей работы.

Всемирная сеть для него всегда казалась даром небес. Всегда хочется «вернуться», «поделиться». Это дух нового поколения, начало новой эпохи без физических границ. Но что случится, думал Козинский, если кто-то решит воспользоваться этой поисковой системой по людям, чтобы ими манипулировать? Он начинает ставить предупреждения на всех своих научных публикациях. Предупреждения о том, что его методы «могут нести угрозу благополучию, свободе или даже жизни людей». Но никто, кажется, не понимал, к чему он ведет.

Примерно в это время, в начале 2014 года, к Козинскому обратился молодой ассистент профессора по имени Александр Коган. У него был запрос от некой фирмы, заинтересованной в методе Козинского. Предложение состояло в том, чтобы проанализировать путем психометрии 10 млн американских пользователей Facebook. С какой целью, собеседник не сказал из соображений конфиденциальности. Козинский сначала согласился, ведь речь идет о больших суммах в пользу его института, но потом начал медлить с согласием. В итоге, он выжал из Когана название фирмы: SCL, Strategic Communications Laboratories («Лаборатории стратегических коммуникаций»). Козинский погуглил название компании. «Мы являемся глобальной компанией по управлению предвыборными кампаниями», — гласил сайт фирмы, предлагая маркетинг на основе психологии и логики. Фокус на влиянии на исход выборов. Козинский недоуменно щелкал по страничкам сайта, раздумывая, чем же может заниматься эта фирма в США.

Чего Козинский на тот момент еще не знал: за SCL стоит сложная корпоративная система, завязанная на «налоговых гаванях»: позднее это было показано в «Панамских документах» и разоблачениях Wikileaks. Часть этой системы ответственна за кризисы в развивающихся странах, другая помогала НАТО разрабатывать методы психологической манипуляции гражданами Афганистана. Одна из дочерних компаний SCL — та самая Cambridge Analytica, зловещая маленькая компания, организовавшая интернет-кампании в поддержку Brexit и Трампа.

Козинский ничего об этом не знает, но подозревает неладное. Проводив изучение, он узнал, что Александр Коган создал тайную компанию, которая ведет дела с SCL. Из документа, который есть в распоряжении Das Magazin, следует, что SCL получила данные о методе Козинского именно из рук Когана. Внезапно Козинского осенило, что Коган мог скопировать или выстроить заново его систему, чтобы затем продать ее политтехнологам из SCL. Ученый незамедлительно разрывает связь с Коганом и информирует о ситуации своего институтского начальника. Внутри института зреет конфликт, учреждение опасается за свою репутацию. Коган переехал в Сингапур, женился и начал именовать себя доктором Спектром. Козинский переехал в Штаты, начав работать в Стэнфорде.

Больше года все идет спокойно, но в ноябре 2015 года лидер радикальных сторонников Brexit Найджел Фарадж объявил, что его сайт подключает к работе со своей интернет-кампанией некую компанию, специализирующуюся на Big Data, а именно, Cambridge Analytica. Ключевая компетенция фирмы: политический маркетинг нового типа — так называемый «микротаргетинг» — основанный на «методе океана».

Козинский начинает получать множество писем — учитывая слова «Кембридж», «океан» и «аналитика», многие думают, что он как-то с этим связан. Однако только тогда он сам узнает о существовании такой компании. С ужасом он просматривает сайт фирмы. Кошмар стал былью: его методология используется в большой политической игре.

В июле 2016 году, уже после референдума по Brexit, на его голову начинают обрушиваться проклятия. Дескать, посмотрите, что вы сделали! Каждый раз Козинскому приходится оправдываться и доказывать, что к той фирме он не имеет никакого отношения.

Вначале Brexit, затем Трамп

Прошло десять месяцев. На календаре 19 сентября 2016 года, избирательная кампания в США в самом разгаре. Зал нью-йоркского отеля Grand Hyatt, выполненный в темно-синих тонах, наполняют гитарные риффы: играет песня Bad Moon Rising группы Creedence Clearwater Revival. Проходит ежегодный саммит Concordia, мировой экономический форум в миниатюре. Приглашены сильные мира сего, даже действующий президент Швейцарии Йоханн Шнайдер-Амманн. «Прошу приветствовать Александра Никса, директора Cambridge Analytica», — раздается приятный женский голос. На сцену поднимается долговязый мужчина в темном костюме. В зале царит тишина. Многие уже знают, что перед ними новый digital-специалист Трампа. «Скоро вы будете называть меня Мистер Brexit», — таинственно написал Трамп в своем Twitter несколькими неделями ранее. Действительно, политологи уже писали тогда о сходстве программ у Трампа и у сторонников выхода Великобритании из ЕС. И лишь немногие знали о связи Трампа с малоизвестной Cambridge Analytica.

Директор Cambridge Analytica Александр Никс

До тех пор digital-кампания Трампа состояла более-менее из одного человека: Брэда Парскейла. Маркетинговый энтузиаст и основатель одного провалившегося стартапа, он создал для Трампа простенький веб-сайт за $1500. 70-летнего Трампа едва ли можно назвать человеком цифровой эпохи: на его рабочем столе даже компьютера нет. Как однажды поведала его персональная ассистентка, нет даже такого явления, как электронное письмо от Трампа. Сама ассистентка приучила его к смартфону — с которого он с тех пор льет потоки мыслей в Twitter.

Хиллари Клинтон, напротив, опиралась на наследие Барака Обамы как первого «президента соцсетей». У нее были адресные листы Демократической партии, миллионы подписчиков, поддержка Google и Dreamworks. Когда в июне 2016 года Трамп нанял Cambridge Analytica, многие в Вашингтоне скорчили мину. Иностранные чуваки в костюмах, которые ничего в этой стране не понимают? Серьезно?

«Это честь для меня, уважаемые дамы и господа, рассказывать вам сейчас о силе Big Data и психометрии в избирательной кампании», — говорил на саммите Никс. За его спиной в тот момент появился слайд с логотипом его фирмы: изображение мозга, составленное из сетей, подобно карте. «Еще пару месяцев назад Тед Круз был одним из наименее одобряемых кандидатов, — говорил блондин с английским акцентом, да таким, что присутствовавшие американцы ощущали себя подобно швейцарцам, которые слышат литературный немецкий. — Всего 40% электората знали его имя». Все присутствовавшие помнили историю стремительного взлета сенатора-консерватора Круза, едва ли не самое необъяснимое событие предвыборной гонки. Последний из серьезных оппонентов Трампа внутри Республиканской партии буквально выскочил из ниоткуда. «Ну и как же так произошло?» — вопрошал Никс. В конце 2014 года Ccambridge Analytica вошла в предвыборную кампанию в США именно как советник Теда Круза, которого финансировал миллиардер Роберт Мерсер. До тех пор, утверждал Никс, предвыборные кампании велись по демографическим критериям: «Глупейшая идея, если всерьез об этом подумать: все женщины получают одинаковый месседж, потому что они одного пола, все афроамериканцы получают другой посыл, исходя из их расы». Таким дилетантским способом (и тут даже Никсу можно ничего не добавлять) вела кампанию команда Клинтон: разделить общество на формально гомогенные группы, подсказанные социологами. Теми самыми, что до самого конца отдавали ей победу.

Тед Круз - клиент Cambridge Analytica — Тед Круз – клиент Cambridge Analytica

И тут Никс щелкает на другой слайд: пять лиц, каждое соответствует определенному профилю личности, Большая пятерка измерений. «Мы в Cambridge Analytica разработали модель, которая позволит высчитать личность каждого совершеннолетнего гражданина США», — продолжает Никс. В зале полная тишина. Маркетинговый успех Cambridge Analytica основан на трех китах. Это психологический поведенческий анализ, основанный на «модели океана», изучение Big Data и таргетированная реклама. Последнее означает персонализированную рекламу, а также такую рекламу, которая максимально близко подстраивается под характер отдельного потребителя.

Никс искренне объясняет, как его компания этим занимается (лекция доступна на YouTube). Его фирма закупает персональные данные из всех возможных источников: кадастровые списки, бонусные программы, телефонные справочники, клубные карты, газетные подписки, медицинские данные. В США возможно купить почти любые персональные данные. Если вы хотите узнать, допустим, где живут женщины-еврейки, можно спокойно купить базу данных. Затем Cambridge Analytica скрещивает эти данные со списками зарегистрированных сторонников Республиканской партии и данными по лайкам-репостам в Facebook — вот и получается личный профиль по «методу океана». Из цифровых данных вдруг возникают люди со страхами, стремлениями и интересами — и с адресами проживания.

Процедура идентична разработанной Козинским модели. Cambridge Analytica также использует IQ-тесты и прочие небольшие приложения, чтобы получать осмысленные лайки от пользователей Facebook. И компания Никса делает то, от чего предостерегал Козинский: «У нас есть психограммы всех совершеннолетних американцев, это 220 млн человек. Наш контрольный центр выглядит так, прошу внимания», — говорит Никс, щелкая слайды. Появляется карта Айовы, где Тед Круз собрал неожиданно большое число голосов на праймериз. На карте видны сотни тысяч маленьких точек: красные и синие, по партийным цветам. Никс выстраивает критерии. Республиканцы — и синие точки исчезают. Еще не определились с выбором — точек становится меньше. Мужчины — еще меньше, и так далее. В итоге, появляется имя одного человека: с возрастом, адресом, интересами, политическими предпочтениями. Но как Cambridge Analytica обрабатывает отдельных людей своим месседжем?

В другой презентации Никс рассказал, как на примере закона о свободном распространении оружия: «Для боязливых людей с высоким уровнем нейротизма мы представляем оружие как источник безопасности. Вот, на левой картинке изображена рука взломщика, который разбивает окно. А на правой картинке мы видим мужчину с сыном, которые идут по полю с винтовками навстречу закату. Очевидно, утиная охота. Эта картинка для богатых консерваторов-экстравертов».

Как удержать электорат Клинтон от голосования

Противоречивая натура Трампа, его беспринципность и исходящая из этого целая прорва различных сообщений внезапно сыграла ему на руку: для каждого отдельного избирателя свой месседж. «Трамп действует как идеальный оппортунистский алгоритм, который опирается лишь на реакцию публики», — отмечала в августе математик Кэти О’Нил. В день третьих дебатов между Трампом и Клинтон команда Трампа отправила в соцсети (преимущественно, Facebook) свыше 175 тыс. различных вариаций посланий. Они различались лишь в мельчайших деталях, чтобы максимально точно психологически подстроиться под конкретных получателей информации: заголовки и подзаголовки, фоновые цвета, использование фото или видео в посте. Филигранность исполнения позволяет сообщениям находить отклик у мельчайших групп населения, пояснил Das Magazin сам Никс: «Таким способом мы можем дотянуться до нужных деревень, кварталов или домов, даже до конкретных людей». В квартале Маленький Гаити в Майами была запущена информация об отказе Фонда Клинтон участвовать в ликвидации последствий землетрясения в Гаити — чтобы разубедить жителей отдавать свои голоса Клинтон. Это было еще одной целью: удержать электорат Клинтон (например, сомневающихся леваков, афроамериканцев и молодых девушек) от урны для голосования, «подавлять» их выбор, по выражению одного из сотрудников Трампа. Использовались и так называемые «темные посты» Facebook: платные объявления посреди ленты новостей, которые могли попадаться только определенным группам лиц. Например, афроамериканцам показывали посты с видео, на котором Клинтон сравнивала чернокожих мужчин с хищниками.

Хиллари Клинтон - жертва Cambridge Analytica — Хиллари Клинтон – жертва Cambridge Analytica

«Мои дети не смогут больше объяснить, что значит рекламный плакат с одинаковым сообщением для всех и каждого», — завершает Никс свое выступление на саммите Concordia, благодарит за внимание и спускается со сцены.

Насколько американское общество в данную конкретную минуту обрабатывается специалистами Трампа, сказать трудно, ведь они крайне редко атакуют на центральных телеканалах, а чаще всего используют социальные сети и цифровое ТВ. И пока команда Клинтон, работавшая по лекалам социологов, пребывает в летаргии, в Сан-Антонио, где располагается «цифровой штаб» Трампа, возникает, по словам корреспондента Bloomberg Саши Иссенберга, «вторая штаб-квартира». Всего дюжина сотрудников Cambridge Analytica получила от Трампа в июле $100 тыс., в августе еще $250 тыс., в сентябре еще $5 млн. По подсчетам Никса, общая сумма оплаты услуг составила $15 млн.

Но и проводимые мероприятия тоже радикальны: с июля 2016 года волонтеры кампании Трампа получили приложение, которое подсказывает политические предпочтения и личностные типы жителей того или иного дома. Соответственно, волонтеры-агитаторы модифицировали свой разговор с жителями исходя из этих данных. Обратную реакцию волонтеры записывали в это же приложение — и данные отправлялись прямиком в аналитический центр Cambridge Analytica.

Фирма выделяет у американских граждан 32 психотипа, сконцентрировавшись лишь на 17 штатах. И как Козинский выяснил, что мужчины-поконники косметики MAC скорее всего являются гомосексуалами, в Cambridge Analytica доказали, что приверженцы американского автопрома однозначно являются потенциальными сторонниками Трампа. Помимо прочего, подобные открытия помогли самому Трампу понять, какие послания где лучше всего применять. Решение предвыборного штаба сконцентрироваться в последние недели на Мичигане и Висконсине было принято на основе анализа данных. Кандидат стал моделью применения системы.

Чем занимается Cambridge Analytica в Европе?

Но насколько велико было влияние психометрии на результат выборов? Cambridge Analytica не спешит предъявлять доказательства успешности своей кампании. Вполне возможно, что это вообще вопрос без ответа. Хотя вот, есть один факт: благодаря поддержке Cambridge Analytica Тед Круз превратился из ничего в серьезнейшего конкурента Трампа на праймериз. Вот рост голосов сельских жителей. Вот сокращение электоральной активности афроамериканцев. Даже тот факт, что Трамп потратил на проект так мало денег, может говорить об эффективности персонализированного продвижения. И даже то, что он пустил три четверти рекламного бюджета в цифровую сферу. Facebook превратился в совершенное оружие и лучшего помощника на выборах, как написал в Twitter один из сподвижников Трампа. К слову, в Германии антиэлитарная «Альтернатива для Германии» имеет в Facebook больше подписчиков, чем ведущие партии ХДС и СДПГ вместе взятые.

Кроме того, ни в коей мере нельзя утверждать, что социологи, статистики, проиграли выборы, потому что сильно ошиблись со своими прогнозами. Верно обратное: статистики выиграли, но лишь те, что использовали новейшие методы. Шутка истории: Трамп постоянно критиковал эту науку, но выиграл во многом благодаря ней.

Второй победитель — компания Cambridge Analytica. Издатель главного консервативного рупора Breitbart Стив Бэннон входит также в совет директоров этой фирмы. Недавно он был назначен старшим стратегом в команде Трампа. Марион Марешаль Ле Пен, активистка французского «Национального фронта» и племянница лидера партии, уже радостно сообщила о сотрудничестве с компанией, на внутреннем корпоративном видео которой изображено совещание по теме «Италия». По словам Никса, сейчас им заинтересованы клиенты со всего мира. Уже были запросы на сотрудничество из Швейцарии и Германии.

Мари Ле Пен - будущий клиент Cambridge Analytica? — Мари Ле Пен – будущий клиент Cambridge Analytica?

Все это наблюдает и Козинский из своего кабинета в Стэнфорде. После выборов в США в университете все стоит вверх дном. На развитие событий Козинский отвечаем самым острым оружием из доступных исследователю: научным анализом. Вместе со своей коллегой Сандрой Матц он провел серию тестов, результаты которых скоро будут опубликованы. Некоторые из этих выводов, которыми учены поделился с Das Magazin, шокируют. Например, психологическое таргетирование, подобно тому, что использовали в Cambridge Analytica, повышают число кликов на рекламе в Facebook на 60%. Вероятность же того, что после просмотра персонализированной рекламы люди перейдут к действиям (купят ту или иную вещь или проголосуют за нужного кандидата) возрастает на 1400%.

Теперь мир перевернулся: Brexit состоялся, в Америке скоро будет правит Трамп. Все это началось с человека, который хотел предупредить нас об опасности. Сейчас он снова получает кучу жалоб на рабочую почту. «Нет, — говорит Козинский. — Тут нет моей вины. Это не я соорудил бомбу, я лишь показал, что они существуют».

Источник

“Мы не заметим, как мир захватит искусственный интеллект” – продолжение темы из другого источника … :mail:

Британская компания Cambridge Analytica помогла Дональду Трампу выиграть президентские выборы в США с помощью технологий Больших данных и персонально таргетированной рекламы в интернете. До этого та же фирма работала со сторонниками Brexit в Британии, а теперь заключила контракт с французским “Национальным фронтом”. Правда ли, что неожиданные исходы голосований в разных странах – не провал социологии, а победа социологии нового типа? Собеседник Радио Свобода Михал Косински, исследования которого косвенно связаны с деятельностью Cambridge Analytica, считает, что это преувеличение, но технологии Больших данных и снижение приватности сулят миру глобальные перемены.

Еще в конце сентября, в разгар выборов, выступая в Нью-Йорке на саммите Concordia, ежегодном мероприятии для влиятельных политиков и бизнесменов со всего мира, основатель Cambridge Analytica Александр Никс рассказывал, как новая технология позволила повысить эффективность кампании соперника Трампа по республиканской номинации Тэда Круза, к началу гонки практически никому не известного кандидата. Никс рассказывал, как, например, людям разного склада характера стоит по-разному преподносить мнение кандидата по поводу закона о свободном распространении оружия: боязливым людям с высоким уровнем нейротизма оружие можно представить как источник безопасности, а богатым консерваторам-экстравертам показать картинку утиной охоты.

Позже Cambridge Analytica помогала уже самому Трампу, причем, по оценкам Никса, за относительно скромное вознаграждение, в общей сложности, порядка 15 миллионов долларов. С помощью анализа данных, которые оставляют в сети все пользователи интернета, специалистам компании удалось найти неочевидные связи и паттерны (например, что люди, предпочитающие машины американского производства, – готовые избиратели Трампа) и использовать их для таргетирования рекламы в интернете, для персонализации посланий, исходящих из штаба республиканского кандидата. Жителям квартала Маленький Гаити в Майями показывали информацию об отказе Хиллари Клинтон участвовать в ликвидации последствий землетрясения на Гаити, афроамериканцам – видео, где Клинтон сравнивает темнокожих мужчин с хищниками. Волонтеры Трампа получили подробный профайл жителей домов, где они собирались вести прямую агитацию.

Сложно сказать, насколько велико влияние, которое работа Cambridge Analytica оказала на исход выборов в США, но эта кампания – не единственный пример, когда в победителях оказываются именно те, кто нанял эту фирму. Так, еще в 2015 году услугами Cambridge Analytica начал пользоваться радикальный сторонник Brexit Найджел Фарадж. Швейцарское издание Das Magasin, недавно опубликовавшее расследование о деятельности Cambridge Analytica, рассказывает, что теперь компания получила контракт с французским “Национальным фронтом”, кроме того, в сотрудничестве заинтересованы некоторые политические силы в Швейцарии, Германии и, возможно, Италии.

Один из героев публикации Das Magasin – Михал Косински, исследователь польского происхождения, в прошлом – заместитель директора Центра психометрии Кембриджского университета, а в настоящее время – доцент Стэнфордского университета США. На протяжении нескольких лет Косински с коллегами по Кембриджу разрабатывали систему, которая на основе активности пользователя в социальной сети составляет подробный психологический профиль человека. Система способна не только описывать особенности характера, но и предсказывать, среди прочего, пол, сексуальную ориентацию, цвет кожи и даже политические предпочтения пользователя.

Швейцарские журналисты рассказывают, что в начале 2014 года к Косински обратился коллега, Александр Коган, который предложил молодому исследователи применить созданную им модель для анализа нескольких миллионов профилей американских граждан по заказу некой компании. Как стало ясно позже, эта компания была связана с Cambridge Analytica. Косински отказался от сотрудничества, но методы, которые Cambridge Analytica применяла в ходе референдума в Британии и президентских выборов в США, как минимум очень напоминают модели, придуманные Михалом Косински.

Радио Свобода дозвонилось Косински в Калифорнию и расспросило его о том, что именно можно сказать о человеке по его “цифровому следу”, насколько стоит доверять громким заявлениям Cambridge Analytica, проиграна ли война за приватность и опаснее ли искусственный интеллект Дональда Трампа.

– Что такое психометрия? Чем вы занимаетесь как исследователь?

– Сама по себе психометрия – древняя наука, думаю, ей два или три тысячелетия. В сущности, это наука психологических измерений, попыток как можно точнее установить различные психологические аспекты, личность, интеллектуальные способности, счастье, склонность к депрессии и так далее. Традиционно такие измерения производились с помощью опросников, психологических тестов, но относительно недавно я и некоторые другие психометристы поняли, что их можно делать, оценивая цифровой след человека, – и тогда никакие вопросы можно не задавать, никаких опросников и тестов не нужно. И это революционный момент. Важность истории Cambridge Analytica, о которой написало издание Das Magasin, на самом деле не в том, что компания помогла Трампу в предвыборной гонке. Это коммерческая фирма, у них есть технология, они хотят зарабатывать деньги, здесь все ясно. Важно то, что если раньше вы хотели составить чей-то психологический профиль, вы должны были попросить человека заполнить опросник, пройти тест – и испытуемый хорошо понимал, что вот сейчас, в этот самый момент, кто-то измеряет его психологические характеристики. А теперь можно делать то же самое, но человек не узнает, что его самые интимные особенности прямо сейчас кто-то оценивает и измеряет. Достаточно посмотреть на цифровой след: записи в социальных сетях, лайки, историю просмотра страниц в интернете, историю поисковых запросов. На основе этих данных можно составить невероятно точный психологический портрет. С одной стороны, это кажется чем-то пугающим, с другой, в этом может быть и много пользы. Например, какая-нибудь интернет-платформа может предложить наиболее подходящую по вашему характеру и способностям работу или посоветовать фильм, который вам наверняка понравится. Это нормально. Но когда вы открываете вашу страницу в “Фейсбуке” и видите там рекламу, персонально направленную, таргетированную для вас на основе вашего подробного психологического профиля, который был составлен без вашего ведома и согласия, это уже не очень нормально.

– Вот лично вы могли бы составить мой полный психологический профиль, зная только мое имя, на основе следа, который я оставил в интернете?

– Я ученый и просто не стал бы этим заниматься. Если бы вы добровольно захотели помочь моему исследованию и предоставили свои данные, я бы с удовольствием включил их в свою базу данных, анонимизировал и пообещал никогда никому не продавать и не передавать. Но многие компании, конечно, постоянно собирают информацию о вас без спроса и используют ее, например, для таргетированной рекламы.

– Эта информация, конечно, не хранится в одном месте – одной компании известны данные моей геолокации, другой – финансовые транзакции, третьей – лайки в “Фейсбуке”. Все это можно собрать воедино?

Достаточно десяти лайков, чтобы система смогла лучше распознать вашу личность, чем коллега по работе

– Ну, во-первых, это обычно и не нужно. Обычно для построения точного профиля вполне достаточно чего-то одного – ваших интересов в “Фейсбуке”, например, или истории посещений страниц из браузера. Во-вторых, компании, собирающие информацию о вас, обычно обмениваются ей друг с другом или просто продают на общем рынке данных. Есть проекты, вроде Acxiom, которые все собирают воедино и продают фирмам типа Cambridge Analyticа. Ты просто можешь прийти и сказать – мне нужны данные на 10 миллионов американцев из такого-то региона, и они эти данные с удовольствием продадут. В-третьих, для того чтобы вести кампанию с личным таргетингом, вовсе необязательно иметь именно индивидуальные данные пользователей. Можно использовать так называемое поведенческое таргетирование. Например, вы не можете попросить “Фейсбук” показать определенную рекламу для всех людей, склонных к определенному типу поведения. Но у вас может быть модель, связывающая этот тип поведения с каким-то психологическим профилем, причем эту модель вы даже могли вполне честно построить – заплатили нескольким десяткам тысяч людей небольшой гонорар за заполнение опросника. И когда модель построена, вы спрашиваете ее: как мне найти эмоциональных экстравертов? Модель отвечает – нет проблем, это те, кто лайкнул такие-то десять книг, такие-то десять фильмов и такие-то десять музыкантов. Теперь вы снова идете в “Фейсбук” со своей рекламой, только вам уже не нужно просить показать ее именно эмоциональным экстравертам, чего “Фейсбук” бы делать не стал. Вместо этого вы просите показать рекламу тем, у кого есть определенный набор лайков. В итоге получается, что у вас не было никаких персональных данных, но вы провели персонально таргетированную рекламу.

– Есть ли компании, которые стремятся составить психологический профиль всего человечества, во всяком случае всех, кто оставляет цифровые следы?

– Вряд ли кто-то мыслит в настолько глобальных категориях, но до некоторой степени этим занимается Facebook, Google, Microsoft, Visa, Mastercard, тот же Acxiom. И все эти данные широко торгуются на рынке.

– То есть где-то на рынке продается, например, и мой психологический профиль, причем невероятно точный. Вы сказали в комментарии для издания Das Magazin, что достаточно всего нескольких лайков в “Фейсбуке”, чтобы система узнала вас лучше, чем ближайший друг. Это действительно так?

– Да, об этом было интересное исследование. Достаточно десяти лайков (интересов), чтобы система смогла лучше распознать вашу личность, чем коллега по работе, а по 230–240 лайкам компьютер будет знать о вас больше, чем ваш супруг или супруга.

– Но что именно это значит – знать больше?

– Это значит, что если попросить компьютер заполнить вместо вас психологический опросник, он ошибется меньше, чем ваша жена.

– Это ответы на вопросы вроде “Боитесь ли вы темноты”?

– Да, типичные вопросы психологических опросников. Так что действительно, где-то на рынке можно купить очень точную информацию о вашей личности, в том числе о ваших политических пристрастиях, о вашей религиозности, о вашей сексуальной ориентации, о вашем IQ. Примерно понять, что о вас известно по вашим интересам на “Фейсбуке”, можно с помощью сайта Applymagicsauce.com, но это, конечно, далеко не полная картина.

– Давайте обратимся к истории с Cambridge Analytica. Скажите, вы действительно не имеете никакого отношения к этой компании?

– Нет, и никогда не имел. Я услышал о ее существовании из прессы.

– Александр Коган, который, как утверждает издание Das Magazin, предложил Cambridge Analytica технологию психологического профайлинга, был вашим коллегой?

– Да, он был моим коллегой, точнее, он был доцентом на психологическом факультете Кембриджского университета в то время, когда я был там же аспирантом. Но наши пути давно разошлись, он основал небольшую компанию и, насколько я понял из прессы, продавал данные Cambridge Analytica, а я остался в академическом мире.

– Можно ли предположить, что Cambridge Analytica использует разработанные вами модели?

– Я бы сказал, что они используют похожие модели, но, видите ли, чтобы разработать такую модель, не нужно особенно глубокой науки, в этом нет никакой магии. Это может сделать любой человек, у которого есть базовые навыки программирования, немного денег и компьютер, подключенный к интернету, – собственно, именно это и делает проблему такой значительной. Здесь используются самые стандартные статистические методы, ничего особенного. Главная мысль моих публикаций в том, что это легко, важно лишь изменить фокус: для психометрии больше не нужны опросники и тесты, достаточно иметь цифровой след человека. И это дает огромные преимущества, можно улучшить маркетинг, карьерное планирование, методы психологической помощи, много чего еще. Но ту же технологию можно использовать и против людей. Я уверен, что Александр Коган был в курсе моих исследований и, хотя об этом я могу судить только по сообщениям журналистов, он сделал ровно то, что я предлагал, и продал результат компании Cambridge Analytica. Я много раз говорил и явно указывал в своих статьях, что не хотел никого вдохновить на такого рода деятельность, более того, я уверен, что люди занимались цифровым психологическим профайлингом задолго до меня, просто не рассказывали об этом так активно, как Cambridge Analytica. Я как раз призываю разработать политику, процедуры, которые бы определяли этичное использование этой технологии.

– Как вы думаете, Cambridge Analytica действительно могла существенно повлиять на результаты американских президентских выборов?

Вместо того, чтобы ввязываться в очередную битву за приватность, стоит признать, что уже проиграна война

– Честно говоря, я не знаю. Ясно, что Cambridge Analytica заинтересована в том, чтобы как можно громче трубить о своем успехе, но в конечном итоге результаты выборов определяют не методы Больших данных, а кандидаты, да еще, как теперь особенно хорошо видно, избиратели, не ходящие на выборы. Возможно, деятельность Cambridge Analytica стала той самой последней каплей, которая предопределила окончательный результат, но скорее всего, этого наверняка не знает и сам Александр Никс. С другой стороны, мы должны отдавать себе отчет, что технология есть, и защититься от нее практически невозможно. Вы можете перестать пользоваться “Фейсбуком”, но все равно будете писать электронные письма. Решите пользоваться голубиной почтой – не обойдетесь без кредитной карты. Может быть, страны могли бы принимать законы, ограничивающие такие методы, но и это может не сработать. Между прочим, я не знаю наверняка, но слышал, что то, что делали Cambridge Analytica для Трампа, противоречило действующему американскому законодательству, и поэтому непосредственный анализ данных они делали в Британии. Знаете, я ученый, я занимаюсь психометрикой, я не специалист в политике, демократии и свободе, но мне кажется, нам придется принять тот факт, что никакой приватности не останется. Вместо того, чтобы ввязываться в очередную битву за приватность, стоит признать, что уже проиграна война, и лучше озаботиться тем, чтобы мир стал благоприятной средой для человека, лишенного приватности.

– Любопытно, до какой все-таки степени построение психологического профиля, использование персонального таргетинга может повлиять на реальный мир.

– С научной точки зрения об этом рассуждать сложно, потому что сложно ставить эксперименты. То есть если вы торгуете каким-нибудь гелем для душа, вы можете сравнить количество кликов, но оценить, например, эффективность методов Больших данных в политической кампании, которая скорее похожа на продвижение бренда, чем на кампанию по повышению продаж, очень сложно. Мы провели кое-какие эксперименты, не с политиками, потому что я считаю это неэтичным, а с конкретными потребительскими товарами, и получилось, что персональный таргетинг, то есть использование индивидуального рекламного месседжа на основе психологического профиля удваивает эффективность рекламы. И это невероятный результат, обычно борьба идет за повышение эффективности на какие-нибудь три процента, и даже это экономит компаниям сотни миллионов долларов. А тут в два раза!

– Странно, что вы еще не стали миллиардером.

– У меня и так прекрасная жизнь. Кстати, есть много психологических работ, которые доказывают, что для счастья нужно не так уж много денег, ну, надо, конечно, чтобы хватало на отпуск. На самом деле, все, наверное, не так просто, как мне как ученому кажется, просто я готов говорить об этих вещах открыто, а другие работают над реальными проектами, никому ничего не рассказывая.

– Мне идея психологического профайлинга на основе цифрового следа кажется достаточно естественной, уверен, очень многие уже используют ее в рекламе. Наш мир, возможно, уже сильно изменился, просто мы этого пока не особенно замечаем.

У нас были изобретения и пострашнее, чем Большие данные
– Наверное, и я эти изменения скорее приветствую. У нас были изобретения и пострашнее, чем Большие данные, мы справились с ядерной энергией – как-нибудь справимся и с этим, хотя, наверное, и не без жертв. Как я уже сказал, мне кажется, война за приватность уже проиграна, мы живем в мире постприватности, а значит, стоит вложить усилия в то, чтобы у всех были равные права и возможности, так что и скрывать ничего никому не захочется. Надеюсь, большая толерантность может решить проблему отсутствия приватности.

– Но ведь проблема не только в том, что окружающие узнают все секреты человека и начнут к нему иначе относиться, но и в том, что появился мощный инструмент для манипулирования.

Легко манипулировать теми, кто мало знает, кто мало читает, кто мало путешествует
– С этим, по-моему, должно справляться просвещение. Легко манипулировать теми, кто мало знает, кто мало читает, кто мало путешествует. Такому человеку можно сказать, что в Сирии нет никакой войны, да и вообще все сирийцы – чертовы преступники, и он в это с готовностью поверит.

– По-моему, манипулировать можно и образованными людьми, с помощью тщеславия и секса, например.

– Не думаю. Вот вы, наверное, неплохо знаете свою жену, вам ею от этого становится легко манипулировать?

– Не знаю, у меня, пожалуй, просто нет такой цели, но наверняка найдется много людей, которым было бы интересно как можно эффективнее манипулировать мной так, чтобы я пошел и проголосовал, например, за Путина.

– Конечно, найдется, и это все время происходит, вся реклама, весь маркетинг – манипуляция такого рода, и я не вижу, что мы можем с этим поделать. И все же манипулировать образованными, открытыми и счастливыми людьми сложно. А отказываться от “Фейсбука”, электронной почты, кредиток уже поздно, да и просто глупо. “Фейсбук” – прекрасная штука, вот я много в своей жизни рассказывал о рисках его использования, но пользуюсь сам, и с удовольствием, и я бы даже за него платил, если бы пришлось.

– Вам ведь, кстати, предлагали работу в “Фейсбуке”?

– Да, это правда. Меня устраивает моя работа в университете, но вообще-то, для человека, занимающегося исследованием поведения и желающего изменить жизнь людей к лучшему, карьера в компании вроде “Фейсбука” или “Гугла” – прекрасный путь. Я придумываю модели и изучаю их, а если бы я работал в “Фейсбуке”, я мог бы в действительности с их помощью изменять жизни миллионов людей, и совсем не обязательно им при этом что-то продавать.

– Страшно, что можно парой кликов изменить жизнь миллионов людей.

– Действительно, чтобы повлиять на миллионы людей, раньше нужно было быть авторитарным диктатором, а теперь вы можете быть инженером, работающим в какой-нибудь интернет-компании. Но страшно не это. Все эти алгоритмы – поиск в “Гугле”, системы рекомендаций и так далее – основаны на самой простой математике, но она применяется к огромным массивам данных. И в конечном итоге никто не понимает, как все это в сущности работает, даже сами разработчики. Вот в России есть какие-то законы, которые все считают плохими, но это явные законы, которые можно исправить. А компьютерные алгоритмы самообучаются и становятся настолько сложными, что если они работают как-то не так, непонятно, что и где в них исправлять.

– Так ли далеки мы от момента, когда какая-нибудь такая вышедшая из-под контроля, недоступная для нашего понимания система устроит ядерную войну?

Когда миром станет править искусственный интеллект, мы можем этого не заметить

– Знаете, пока что у Дональда Трампа куда больше возможностей и шансов уничтожить человечество, чем у Больших данных, но в будущем… Смотрите, есть голуби и муравьи, думаете, они знают, что миром правит человек? Догадываются, что Дональд Трамп может нажать на красную кнопку? Нет, конечно. Стоит помнить об этом, потому что когда миром станет править искусственный интеллект, мы вполне можем этого точно так же не заметить. Мы ведь уже не можем осмыслить и проанализировать те объемы данных, которые сами же и производим, – и нам приходится доверяться компьютеру. Вы можете спросить у машины: можешь что-то предсказать на основе этих данных? Она ответит: да, конечно. Вы спросите: а как ты это делаешь? Она скажет: прости, но ты не поймешь. И все это – уже реальность. Вы знаете, что американские суды используют компьютерные системы, принимая решения об условно-досрочном освобождении заключенных? Компьютеры решают, дать вам кредит или нет. Компьютер сажает на землю самолет, и это здорово, потому что люди легко могут наделать бед. Жизнь 800 пассажиров “Боинга-787” находится в руках компьютера, а не человека, и это сегодняшняя реальность.

Источник

В эпоху Big Data Оруэлла пора переписывать

Больше всего информации о нас собирают корпорации, но государство их скоро догонит. Википедия определяет Большие данные (англ. Big Data) в информационных технологиях как «совокупность подходов, инструментов и методов обработки структурированных и неструктурированных данных огромных объемов и значительного многообразия».

Википедия и сама по себе проект эпохи Больших данных, где они отлично структурированы и потому работать с ними может любой пользователь. А вот, например, анализ огромного массива фотографий человека, разбросанный по социальным сетям в хаотическом порядке, — сложная задача не только для человека, но и для компьютера. Сегодня с ней прекрасно научились справляться, и это для технологий Big Data — далеко не предел.

О возможностях, которые дает государству и крупным корпорациям анализ Больших данных, «Новой газете» рассказал Иван Бегтин, директор некоммерческого партнерства «Информационная культура», ведущий многочисленных проектов в области так называемого «Открытого государства». Важнейшие темы его исследований: информационные системы, архитектура ПО, управление проектами, IT, электронное государство.

Манипуляции общественным мнением и слежка, использующие анализ так называемых Больших данных, ставят перед обществом проблемы в нескольких важных аспектах. В первую очередь это этическая проблема сбора информации о личности из закрытых и открытых источников. Большие изменения, которые массовый потребитель пока не замечает, происходят в системах хранения.

Впервые в истории человечества вся информация хранится вечно.

Еще недавно период хранения данных с камер наблюдения был всего два часа, но все видео с сервисов типа YouTube, размещенное еще в начале века, там так и осталось. Это принципиально другая ситуация. Человеку теперь даны механизмы постоянной фиксации жизни. А все фото, сохраненные в соцсетях, остаются там навечно.

По конкретным прецедентам понятно, что, если человек удаляет свои записи, они все равно хранятся на серверах (и к ним теоретически можно получить доступ. — Ред.). Даже в Германии, где закон очень жестко защищает персональные данные, такие случаи уже были (конкретно — с фейсбуком).

Всех нельзя, каждого — можно. Хакеры и сотрудники спецслужб — о возможности взломать мессенджеры по заказу государства
Люди могут фиксировать свою жизнь очками виртуальной реальности. В 80-х годах встречались фрики с камерами на головах, их сегодняшние наследники — мотоциклисты с видеорегистраторами на шлемах. В некоторых странах даже автомобильные видеорегистраторы запрещены. Поэтому в России падение метеоритов в Челябинской области записано множеством устройств, а кое-где это было бы категорически невозможно.

Имеет ли право человек фиксировать на видео все, что видит глазами? Пока такой коллизии еще нет, но она возникнет очень скоро.
Если вы смотрите, как человек набирает пин-код в банкомате, вы можете не запомнить последовательность действий. Но придя домой, вы легко восстановите все нажатия в покадровом воспроизведении в очках виртуальной реальности.

А ведь все эти устройства загружают данные в облачные сервисы, где они могут попасть в распоряжение других людей независимо от желания снимавшего. В рамках маркетинговых соглашений к видеохостингу имеет технический доступ множество совершенно неожиданных партнеров. Например, по базам публичных видео- и фотосервисов был создан сервис Find face, позволяющий установить человека просто по фотографии.

Конкуренция приведет к быстрому прогрессу этой технологии: распознавание отпечатков пальцев, голоса и лиц совершенствуется непрерывно.

Что может рассказать смартфон

Люди размещают свои данные добровольно, часто даже не осознавая этого. Владелец смартфона при первой регистрации сдает огромное количество персональной информации. По тому, как вы используете гаджет, современные алгоритмы могут установить даже ваше вероисповедание. Например,

если владелец годами отключает смартфон каждую субботу, можно сделать вывод, что он правоверный иудей.
В Нигерии и большинстве стран тропической Африки нет полноценного статистического наблюдения, его занимает анализ данных сотовых операторов. Статистика по населению получается от сотовых операторов.

Местный провайдер NordTelecom оценивал качество образования по анализу текстов СМС-сообщений населения. Таким способом с вероятностью 84% определялся уровень образования абонента. Это позитивный пример использования Больших данных при разработке программ повышения образования в различных регионах.

Отдел кадров в облаках

Мы все опасаемся государства, но следят больше всего корпорации. Обработка Больших данных требует средств, технологий и кадров. В первую очередь деньги вложат те, кто сможет быстро продать анализ вашей персональной информации: Google, Facebook, Apple, Microsoft и им подобные крупные международные игроки рынка.

При запуске новых компаний, услуг и продаже данных они заинтересованы в маркетинговых исследованиях вашего потребительского поведения. Игра Pokemon Go и те, что последуют за ней, запускаются в расчете на уже рассчитанную модель поведения населения.

Международные корпорации в России и крупнейшие отечественные компании очень жестко следят за своими сотрудниками. На корпоративных серверах устанавливаются программы, контролирующие голосовой трафик, переписку, мессенджеры и почту. Большинство сотрудников это знают, пользуясь сторонними защищенными сервисами. Корпорации стремятся вскрыть и эту почту. Бизнес, как правило, знает о вас гораздо больше, чем государство.

Работа на рейтинг

Вся ваша жизнь влияет на кредитный рейтинг. Для этого банки отслеживают данные клиента в социальных сетях, ведь заполняя заявку на кредит, вы указываете свою страницу (многие уже догадались, что лучше не указывать). Найти вас там банки, имея договоры с социальными сетями, могут по телефону, адресу электронной почты, указанной в договоре.

Их находки подчас весьма любопытны.

Группа, создавшая механизм оценки кредитоспособности заемщика по данным из сети «ВКонтакте», нашла связь между количеством загруженной на страницу клиента музыки и вероятностью, что он не вернет кредит.
Конечно, посадить на такую работу людей, физически читающих тексты, нереально. И корпорации, и государство приходят к автоматизации сбора и анализа колоссальных объемов информации о гражданах.

Как работает «полицейское государство»

На одном уровне отслеживают массовые настроения, уровнем ниже исследуют отдельные группы и лидеров мнений, отдельно же занимаются лишь людьми, находящимися в какой-либо группе риска.

Это не только в России происходит. Я с некоторой иронией отношусь к мнению, что у нас строят полицейское государство. Когда у нас перестанут пилить бюджет на строительство «Большого брата», может, что-то и получится. А пока коррупция в правоохранительных органах этому препятствует.

Да и государство не находится на переднем крае этого процесса, оно всегда догоняющий игрок. Правительственные идеи тотального контроля лишь клонируют или расширяют корпоративные разработки. Я говорю о массовых практиках, не о слежке за отдельными террористами или оппозиционерами. Это вообще не Big Data, потому что таких людей и информации о них совсем немного.

Часть Больших данных есть только у государства. Например, обобщенные потоки на транспорте или от сотовых операторов. По сигналам Wi-Fi можно отследить передвижения конкретного смартфона и человека.

Спецслужбы и полиция могут объединить все данные с камер наблюдения в единую систему, например, и анализировать лица людей в реальном времени в масштабах мегаполиса или региона. Можно объединить системы пассивного сбора информации: звуковые датчики в городах в совокупности укажут точное место выстрела или любого интересного государственным органам звука, автокатастрофы например.

Зато у них негров дискриминируют

Правозащитники в США сегодня борются с системой, анализирующей активность в социальных сетях. Многие специалисты подозревают, что многочисленные сайты-анонимайзеры, позволяющие обеспечить анонимность пользователя, также финансируются спецслужбами разных стран. И чем лучше их публичная репутация, тем больше у них поток информации, которую пользователи хотят скрыть. По американским законам провайдер не имеет права предупредить клиента, что его переписку читают спецслужбы.

Это очень похоже на нашу ситуацию, разница только в прогрессе индустрии. Технологически среда на Западе изначально была очень сложной, а контроль затруднен, несмотря на передовые достижения. Китай построил моноструктуру контроля с простой и ясной архитектурой. Мы где-то посередине, но постепенно движемся в сторону Китая.

При этом алгоритмы анализа зависят от постановки задач, поэтому результаты их работы могут отражать различные уровни предубеждений вплоть до расизма.

Для судов США система Compass рассчитывает сумму залога, который разумно внести за конкретного человека.
В нее загружается его судебный и поведенческий профиль: пол, возраст, происхождение, образование, прохождение по делам учета — сотни параметров. После анализа машина выдает рекомендацию, какую сумму залога назначить. Выяснилось, что цветным почти гарантированно назначают более высокий залог. Американские правозащитники борются с этой практикой.

Ваш геном очень важен для нас

Но раса и национальность объединяют огромные группы людей. Генетическая же информация конкретного человека — это принципиально новый уровень этики для работы с Большими данными.

В любом крупном городе люди могут за свой счет секвенировать геном и узнать, например, о возможном развитии ишемической болезни сердца в будущем. Минимальный набор тестов стоит сейчас 14 000 рублей, но постепенно дешевеет, и многие начинают это потихоньку делать. В России таких около 60 000, а в США в 2014 году секвенирование прошли полмиллиона человек, в нынешнем, думаю, около миллиона. Почти всегда это делается добровольно в рамках ДМС. Некоторые медицинские компании последнее время уже начали эту услугу навязывать.

В течение восьми лет набирает силу проблема генетической дискриминации. Если секвенирование указывает на высокую для вас вероятность болезни Альцгеймера и до этого вам осталось лет пять, в России к этому отнесутся философски — горизонт планирования у большинства граждан два-три года. Но в странах, где люди и компании смотрят вперед лет на 20, человеку начинают повышать стоимость добровольного медицинского страхования. У многих страховка подорожала в разы. С 2002 по 2008-й в Конгрессе США шли баталии, закончившиеся принятием такого закона, запрещающего генетическую дискриминацию.

Ведь если работодатель оплачивает человеку ДМС, в рамках трудового договора он может обязать его пройти секвенирование. У нас такой массовой практики пока нет, на рынке анализа генетической информации есть лишь несколько компаний. Готов поспорить, в скором времени они начнут лоббировать идею бюджетного финансирования генетических исследований для больших групп граждан.

Когда стоимость услуги снизится, они начнут придумывать причины. Сначала преступников одновременно с дактилоскопией обяжут пройти секвенирование, затем сотрудников силовых органов, далее бюджетников. Всеобщую дактилоскопию ввести сложно, она устойчиво ассоциируется с преступностью. А геном — с медициной. Сегодня уже предлагают секвенировать нерожденных детей, чтобы знать, кто родится с серьезными отклонениями. Об этом сравнительно недавно снят фантастический фильм «Гаттака».

Все это Большие данные, которые будут храниться до вашей смерти. Если у вас есть брат-близнец, ваш анализ даст государству и компании-оператору в руки и его личные данные полностью. А также половину генома вашего отца, матери, братьев и сестер.

Кому принадлежат данные о вашем геноме? Ряд законов позволяет изъять результат анализа в компании, проводившей исследования. Но хранится он в цифровом виде, и предотвратить копирование в любых целях затруднительно.

И это перспектива ближайших десяти лет. Уже сейчас запрещено вывозить из России генетический материал. Расшифровку генома в зарубежном сервисе вы можете сделать только нелегально.

Надо понимать, что анализ Больших данных всегда предлагает совершенно неочевидные опосредованные выводы. При переходе к конкретной личности всегда остается возможность ошибки. Сегодня банки еще не интегрированы с социальным сетями, они не могут автоматически узнать, что клиент сменил место работы. Но разговоры о таких возможностях среди специалистов уже идут, хотя это на грани вторжения в частную жизнь.

«Извращения истории государство обращает в свою пользу». Как устроена цензура: интервью с историком
Коммерческие и рекламные предложения вам на почту и в мессенджеры все чаще приходят в результате изучения вашей потребительской активности. Это только начало, сегментирование пользователей можно делать гораздо более глубоким. Допустим, показать определенную рекламу всем, кто за последнюю неделю купил новый холодильник.

Сканер для ваших карманов

Активность государства сегодня несопоставима со слежкой компаний. Государство сильно в первую очередь тем, что может получить доступ к информации бизнеса.

Года три назад в Италии запустили проект налоговой службы, сравнивающий среднемесячный доход и расходы граждан, начиная с определенной суммы расхода. Если в месяц человек тратит условно 20 тысяч евро при подтвержденном доходе 3 тысячи, к нему в гости идут инспекторы и задают конкретные вопросы.

Это именно анализ Больших данных из хранилища налогового ведомства, отслеживающего все финансовые транзакции. И наши налоговики легко могут это сделать сегодня. Например, если расходы большинства сотрудников конкретной компании не соответствуют доходам, значит, директор выплачивает часть зарплаты в конвертах и ему можно слать предупреждение.

Многих данных еще нет, но можно начать их собирать. Китай уже планирует эксперимент с социальным рейтингом граждан.

Вот в сервисе «Яндекс.Такси» вы после поездки оцениваете таксиста. А ведь и он может вас оценить — вежливость, чистота одежды и так далее.
Из дорогих парикмахерских и клиник вам звонят службы оценки качества и интересуются вашим мнением, выраженным по десятибалльной шкале.

Такие оценки есть в интернет-сервисах по подбору врачей, репетиторов, мастеров ремонта и так далее. Все рейтинги изучают, насколько тщательно и последовательно вы выполняете правила. Но ведь и законы — это тоже правила. И в Китае в социальный рейтинг будут закладываться нарушения ПДД, административные наказания, частота просрочек квартплаты, кредитов и любых регулярных платежей вообще.

В итоге сформируется ваш рейтинг. Если он высок, с вас, например, не возьмут предоплату в отеле. Участие человека в волонтерских движениях, социально ориентированных НКО, например, увеличит рейтинг. А пьяное буйство в самолете может так его понизить, что гражданину разрешат покупать авиабилеты с большими ограничениями или по повышенной цене. Советую посмотреть посвященную этой технологии первую серию третьего сезона фантастического сериала «Черное зеркало».

Я на это смотрю как на вполне возможное будущее. И государство будет модерировать систему социальных рейтингов, использовать их в манипуляциях гражданами. Организация такой системы в пределах МКАД вполне возможна и сегодня, но Россия, полагаю, будет далеко не первой страной на этом пути. В кандидатах у меня ряд городов в Европе, Сингапур, где это уже обсуждается.

Анализ Больших данных обещает и много хорошего. В недалеком будущем передающие информацию в интернет вживленные устройства контроля давления и других медицинских параметров позволят мгновенно обнаруживать место и время убийства, смерти от несчастного случая, избиения и изнасилования.

Хотел бы уберечь интересующихся граждан от иллюзий: если наше государство станет экономически мощным аналогом западных демократий, слежка на самом деле усилится. Где растет экономика, там корпорации наращивают влияние, имея при этом тесные связи и общие интересы с государственными органами.

Думаю, все практики, которые даны власти прогрессом, будут применены. Но не политика в первую очередь волнует власть, она полезла во все сферы, касающиеся наших денег. Если анализ Больших данных позволит снизить издержки на конкретного гражданина или увеличить его налогооблагаемую базу, этим обязательно воспользуются.

И коммент в тему:

Александра Изучеева

У нашего Большого Брата (ББ) есть свои, отличные от западных родственников, косяки. Например, заказчик моего сфабрикованного дела, работающий как раз у ББ “шпиёном”, решил мне отомстить, задействовав как раз высокие технологии: один сайт заразили вирусом, второй сайт 4 года осаждал робот, регистрирующий фейковых посетителей. Написала заявление о возбуждении уголовного дела по 273. отдел “К” отказался проводить проверку.Теперь ее проводят оперативники районного отдела полиции. Рег ру заблокировал сайт ..за превышение количества посетителей. Робот-поисковик (не из числа официальных) стал заходить по 200 тысяч раз за сутки на сайт. Тариф предусматривал гораздо меньшее количество посетителей. Если раньше в отношении меня тупо завели уголовное дело,чтобы развалить бизнес то теперь при помощи высоких технологий дело губят на корню, но изящнее. Мораль:россияне столкнутся с тем, что технологические возможности ББ, помноженные на коррупцию, дадут такой ..цветок душистый прерий…

Источник