Кибер-днк

Содержание

Стали появляться законы, защищающие виртуальный след людей

Последние 20 лет, пока манипуляции с данными из интернета не регулировались законами, компании-гиганты успели монополизировать информационный рынок, получив не только сотни миллиардов долларов капитала, но и политическое влияние, возможность влиять на выборы, устраивать революции и перевороты.

Лидером и хедлайнером юридического осмысления цифровой информации и манипуляций с ней стал Европейский союз, разработавший Генеральный регламент о защите персональных данных (GDPR), вступивший в силу 25 мая 2018 года. Этот регламент может варьироваться от страны к стране, однако общие черты остаются неизменными.

GDPR имеет дело с двумя видами (или уровнями) цифровых следов: личными данными и чувствительными (sensitive) личными данными. Личными данными может считаться любая информация, с помощью которой можно прямо или непрямо идентифицировать человека: имя, обычный и ip-адрес, а также большая часть «пассивного цифрового следа». К чувствительным данным относятся более личные и даже интимные данные вроде религиозных взглядов, политических мнений, сексуальной ориентации и т. д.

Компании, имеющие дело с личными данными людей, в GDPR называют «контроллерами» или «обработчиками» и обязуют выполнять предписанные требования: четко обозначать в специальной документации, зачем и как они используют данные пользователей, использовать и хранить минимальное количество данных и обеспечивать конфиденциальность и безопасность. В случае утечки данных компании должны сообщить о ней властям и затронутым ею людям в течение 72 часов.

Но главные нововведения GDPR касаются непосредственно пользователей, за которыми законодательно закрепляется право распоряжаться информацией о себе.

Что такое цифровой след?

Каждый раз, когда вы публикуете что-либо в интернете, обмениваетесь контентом или когда сайт собирает о вас информацию, устанавливая файлы cookie на ваше устройство, вы создаете цифровой след. Он включает в себя ваш IP, данные для входа в систему и другую личную информацию, которую вы раскрываете в интернете. Информация, опубликованная о вас, также будет добавлена в цифровой след.

Что цифровой след может сказать о вас?

Эта информация является вашей цифровой идентификацией, и она может появиться, когда кто-то будет искать ваше имя в интернете. Ваша личность в интернете может влиять на различные аспекты вашей жизни. Например, работодатели, школы, колледжи и сотрудники правоохранительных органов могут использовать ваш цифровой след в качестве основы для оценки характера.

Проще всего «вычислить» экстраверсию и открытость опыту

К цифровым следам относятся размещаемые в сети тексты, изображения, особенности интернет-серфинга, «лайки», а также телефонные звонки, геолокация и финансовые транзакции.

Что можно прогнозировать при помощи анализа цифровых следов:

Личностные черты (наибольшая точность при анализе личностных черт по «Большой пятерке» (Big Five) – экстраверсия, открытость опыту, добросовестность, нейротизм, дружелюбие)

Эмоциональные состояния (например, тревога, депрессия)

Мотивы, ценности

Поведение (например, покупательское поведение, пунктуальность в исполнении взятых обязательств, социальная активность)

Активнее всего прогнозируются личностные черты «Большой пятерки». По степени успешности прогнозов они располагаются следующим образом: экстраверсия, открытость опыту, добросовестность, нейротизм, дружелюбие.

Враг № 6 — слежка

Смартфоны способны шпионить за нами, даже будучи выключенными и в отсутствие Интернета. Для предотвращения этого вида хакерства созданы оболочки типа UnPocket. Эта обложка имеет уникальное покрытие против излучения.

Кибер-днкЛучший способ не оставить след в Сети — отказаться от гаджетовФото: pixabay.com

Его сравнительно недавно запустила компания Kickstarter, собрав с пользователей пожертвования на этот проект. Благодаря ему на радарах наш смартфон не определяется. Аминь.

Сергей Власко, CEO компании по защите личных вещей mySafety.ua заявил:

Может, нам пора вернуться к кнопочным телефонам?

Борьба за права человека распоряжаться информацией о себе в США

Американские технологические гиганты, сделавшие свои состояния на сборе и обработке информации пользователей, уже вовсю сталкиваются с законодательными ограничениями в Европе. Однако в их родных США нет законов, гарантирующих конфиденциальность личной информации пользователей, и нет почти никаких правил, регулирующих прозрачность того, как компании собирают, хранят и обрабатывают цифровые следы пользователей.

Теперь основной спор между компаниями и законодателями будет разворачиваться вокруг трактовки нюансов и того, как новые законы скажутся на законодательстве других штатов.

Технологические компании хотели бы, чтобы калифорнийские законы были «потолком» и ограничивали права других штатов регулировать сбор и обработку информации. Такая реакция американских гигантов не вызывает никакого удивления, если учесть, насколько свободно они себя пока что чувствуют при сборе, хранении и обработке информации о пользователях.

И что?

Бизнес-модели, позволяющие IT-корпорациям зарабатывать триллионы долларов на наших природных слабостях, вряд ли исчезнут в ближайшее время. При этом нельзя сказать, что эти технологии делают что-то принципиально новое: медиа всегда работало на пропаганду, гналось за скандалами и интригами, эксплуатировало секс и насилие, а основные деньги получало от рекламы и лоббирования политических интересов. Поменялась разве что интенсивность, с которой всё это происходит. А также пока что доминирует романтическое мироощущение, с которым люди всё это потребляют: у пользователей появилась устойчивая иллюзия свободы выбора и большей осведомленности.

6 шагов для защиты цифрового следа

  1. Введите свое имя в нескольких поисковых системах. Используйте несколько поисковых систем для поиска вашей фамилии и имени. Если вы недавно сменили имя, то проверьте предыдущее и текущее. Просмотрите первые две страницы результатов. Если вам что-то не понравится (если кто-то выложил ваши личные данные, например, номер личного телефона, адрес и возраст), попросите администратора сайта удалить след.
  2. Дважды проверьте свои настройки конфиденциальности, но не доверяйте им. Такие настройки позволяют вам контролировать, кто видит ваши сообщения в соцсетях. Например, Facebook позволяет не только ограничить количество сообщений для друзей, но и составить персонализированные списки людей, которые могут видеть определенные сообщения.
  3. Создавайте надежные пароли. Создайте такой пароль, который использует комбинацию не менее десяти цифр, символов и заглавных и строчных букв. Избегайте простых паролей, кто-то всегда будет пытаться получить доступ к нему. Сделайте пароль таким, чтобы его было легко запомнить, но трудно угадать постороннему. Если вам сложно запомнить уникальные пароли для разных сайтов, то менеджер паролей может пригодиться.
  4. Обновляйте ПО. Многие вирусы и вредоносные программы специально разработаны для поиска вашего цифрового следа, и они постоянно обновляются. Чтобы защитить себя, убедитесь, что ваше антивирусное программное обеспечение и другие программы обновлены. Старое ПО может быть более уязвимым для атак хакеров, оно может содержать большое количество цифровых следов.
  5. Удалите неиспользуемые приложения. Время от времени просматривайте приложения на телефоне или планшете. Если приложение больше не используется, лучше удалите его. При установке нового приложения прочитайте текст мелким шрифтом, в котором указывается, какую информацию они собирают и для чего она может быть использована. Эти приложения могут использовать такие персональные данные, как адрес @, местоположение и действия в интернете.

Я согласен

— Удешевление компьютеров и появление сети в каждом доме породило лавину цифровых данных, — рассказывает Борис Орехов, доцент факультета гуманитарных наук НИУ ВШЭ. — Возможности машинного обучения основаны на статистике — а тут появился гигантский массив данных, с которыми можно работать. Например, нейронные сети часто используют для распознавания образов на изображениях. Как можно этому научить компьютер? Сначала пользователи Фейсбука стали выставлять фотографии, потом сами отмечали друзей на фото, и получилась огромная обучающая выборка для нейронной сети, по которой она училась узнавать людей на изображениях.

Вам встречались веселые приложения вроде «Кто ты в “Игре престолов” или «Какой у тебя психологический возраст»? По сути, это короткие психологические тесты. Миллионы пользователей играют в эти игры, чтобы поделиться смешным результатом, и не чувствуют подвоха, соглашаясь на требование приложения предоставить ему доступ к личной информации. Алгоритму остается лишь сравнить ответы на тест с тем, как мы ставим лайки и что пишем в ленту. Машины глотают и анализируют данные миллионов пользователей, обучаясь вычислять наши черты все лучше — этот анализ человеческой психики машинами продолжается уже лет десять.

Одно из первых таких тестов-приложений, собирающих и анализирующих информацию о пользователях, придумали еще в 2008 году в Кембридже студенты-психологи Дэвид Стиллуэлл и Михал Косински (теперь уже профессора). Они надеялись заполучить информацию хотя бы сотни пользователей, но их приложение myPersonality стало вирусным: миллионы людей как одержимые заполняли тесты и без оглядки отдавали свои данные. Алгоритм научился по лайкам и записям определять цвет кожи пользователя, его сексуальную ориентацию, возраст, религиозную принадлежность, курит ли и даже в разводе ли его родители! Совершенно не обязательно быть помешанным на соцсетях гиком, который ежеминутно теребит смартфон; достаточно кликнуть пару раз в день. Всего десяток-другой лайков, и программа может узнать о вас больше, чем знают коллеги. Сотня лайков  —  и она знает о ваших чертах и предпочтениях точнее, чем друзья; несколько сотен  — и она понимает вас лучше, чем супруг(а).

Главным фигурантом скандалов вокруг анализа цифровых следов пользователей соцсетей стала компания Cambridge Analytica, в 2015 году выпустившая приложение «Это ваша цифровая жизнь». Создатели честно признавались в описании, что игра создана для исследования: изучить цифровые следы и на их основе построить психологические профили. Добровольцев набралось около 270 тысяч, за помощь науке им выплатили по доллару. Но на самом деле всего за доллар участники продали не только свое цифровое «я», но и информацию друзей. «Вы не против, если мы просмотрим данные ваших друзей?» — спрашивала программа. «ОК, пожалуйста! Я же хочу пройти этот забавный тест!» — так реагировали участники. В итоге в сети компании попались данные 50 миллионов человек. Алгоритм, переварив все это, научился расфасовывать пользователей по категориям: интроверт или экстраверт; консерватор или либерал; чаще опирается на логику или эмоции, и так далее.

В обрусевшем Фейсбуке — «ВКонтакте» — такие веселые и словно бы невинные тесты тоже популярны. Возмущаться беспардонным вторжением не получится: ведь технически никто данные не воровал, мы сами ставим галочку «я согласен» под пользовательским соглашением, навсегда прощаясь с правами на свои записи, фотографии, комментарии, лайки и любые выводы, которые можно сделать на основе этих данных.

Мы, кстати, можем посмотреть, что о нас известно. И Фейсбук, и «ВКонтакте» по первому обращению любезно присылают архив всего, что вы делали на просторах соцсети. Это зрелище для храбрых духом! «ВКонтакте», как оказалось, бережно хранит каждый лайк, комментарий, запись и каждую букву моей личной переписки (даже удаленной) с момента регистрации — 12 лет цифровой жизни.

Доля дефолтов по некоторым переменным цифрового следа, %

Кибер-днк

Словом, если делать покупки с компьютера марки Macintosh вскоре после полудня, зайдя за ними со специализированного сайта, оформлять заказ на платный емейл, состоящий из имени и не содержащий цифр, не использовать запрет отслеживания и быть внимательным при заполнении веб-форм, соблюдая правила орфографии, – можно получить высший кредитный рейтинг.

Точность прогноза

Исследователи проанализировали способность цифрового следа предсказывать дефолт с помощью логистической регрессии, которая оценивает вероятность наступления события исходя из анализа нескольких независимых переменных. Способность математической модели предсказывать, наступит или не наступит риск-событие, называется дискриминационной способностью (discriminatory power). Ее показатель ранжируется от 50% (крайне ненадежный прогноз) до 100% (идеальный). Считается, что в условиях недостаточных данных желателен показатель не ниже 60%, если данных в избытке – не менее 70%.

В выборке из 296 банков Германии точность скоринговой модели составила 66,5%, а скоринг по данным P2P-кредитования в США показал точность лишь в 62,5%, приводят пример авторы.

Точность прогноза на основе данных кредитных бюро, использованных в исследовании Берга с соавторами, составила 68,3%. А на основе только цифровых данных – 69,6%. Скомбинировав же данные бюро с цифровыми, исследователи получили еще более высокий результат: 73,6%.

Это выдающийся результат, подчеркивают авторы, поскольку использованный набор цифровых переменных легко доступен для любой компании, ведущей бизнес в интернете. Результат оказался устойчив к проверкам на надежность, в том числе на различных выборках. Например, дискриминационная способность оценки по цифровому следу для пользователей, чьи данные отсутствовали в кредитном бюро, оказалась точно такой же, как и для идентифицированных пользователей.

На темной стороне

Потенциально потребители могут менять свое онлайн-поведение, если цифровой след будет широко использоваться при принятии решений о выдаче кредита, признают авторы.

В долгосрочной перспективе дискриминационная способность оценки по цифровым данным будет зависеть от того, насколько легко «плохие» типы поведения смогут мимикрировать под хорошие. Некоторыми переменными – такими как дорогой девайс или платный емейл – манипулировать довольно затратно. Могут появиться и новые типы цифровых следов, слишком дорогих для «подделки».

Цифровые следы нужно использовать не всегда и не везде – например, они не нужны, если продукция не требует высокой кредитоспособности покупателя. Регуляторные органы, заинтересованные в соблюдении норм справедливого кредитования, вероятно, будут следить за тем, чтобы цифровые данные не использовали незаконно, надеются авторы исследования. Цифровые следы есть и у компаний – так что они тоже заинтересованы в ограничениях на применение подобных данных. Финансовые компании, проигрывающие использующим цифровые следы конкурентам, тоже, вероятно, будут лоббировать ограничительные меры. Вопросы конфиденциальности и статистической дискриминации станут ключевыми в дебатах о цифровых следах,
Берг и его соавторы.

Цифровые преимущества

Цифровой след может использоваться как дополнение к традиционному скорингу, делая его точнее – там, где он есть, заключают авторы.

В развивающихся странах, где финансовая инфраструктура отсутствует или недостаточно развита, цифровые данные могут помочь преодолеть информационную асимметрию между кредитором и заемщиком, так как анализ цифровых следов возможен даже в отношении не имеющих кредитной истории клиентов. 

Потенциально цифровой след может расширить доступ к кредиту для
взрослых трудоспособных людей во всем мире, не имеющих доступа к финансовым услугам, тем самым содействуя повышению финансовой доступности и снижению неравенства, полагают авторы. Он может стать цифровым эквивалентом дорогого костюма, который люди надевали перед посещением банка, сравнивают они.

Но разница в том, что управление цифровым следом, в отличие от облачения в костюм, оказывает гораздо более широкое влияние на повседневную жизнь и, по сравнению с управлением своей кредитной историей, связано не с расчетливым финансовым поведением, а с выбором и привычками обыденной жизни

Важно, чтобы исследователи, потребители, компании и регулирующие органы внимательно следили за развитием событий и оценивали влияние использования цифрового следа на экономику и общество, заключают авторы. 

Наследили

У экранов гаджетов есть прозвище — «черное зеркало»; их холодные и глянцевые поверхности глядят на нас с каждого рабочего стола и из каждой ладони. По ту сторону экрана мы оставляем необычное отражение — свой подробный цифровой автопортрет. Каждый раз, когда мы касаемся интерактивного экрана смартфона или клацаем по клавиатуре ноутбука, сквозь наши пальцы убегают данные. Мы лайкаем, подписываемся на интересные страницы, разбрасываемся геометками, вбиваем запросы в Яндекс, скачиваем музыку, смотрим видео, выкладываем фотографии.

А еще пишем, и пишем, и пишем. В романе «Война и мир» 2,5 миллиона знаков, а в Твиттере буквенный эквивалент романа набирается каждые полторы секунды. За секунду мы отправляем под 3 миллиона электронных писем — никто и никогда не писал так неутомимо, как пользователи сети.

Наш цифровой след становится все длиннее, и значимость этих данных мы недооцениваем. То, что мы оставляем после себя в одних только соцсетях, — вовсе не дебри ерунды. Страничка в Фейсбуке легко переводится в психологический портрет, где отражены характер, слабости и чаяния ее автора. Еще в 2013 году исследователи из Кембриджа и Университета Северного Иллинойса научились по текстам фейсбучных постов довольно точно определять IQ. И даже измерять «большую пятерку» черт личности (Big Five — модель личности, выделяющая пять переменных, которые прежде всего склонны замечать и оценивать в нас другие люди: открытость, эмоциональность, экстраверсия, добросовестность и доброжелательность).

По лайкам можно выявить не только политические предпочтения, но и отношение к религии, сексуальные предпочтения, пристрастия к алкоголю или наркотикам и многое другое. «Большой брат» из фантазий ХХ века о тотальной слежке оказался программой, и чтобы вторгнуться на нашу личную территорию, ему достаточно проанализировать статистику.

Я включил все рекомендуемые настройки безопасности в браузере, меня не отследят

Ошибаетесь. Наоборот, уникальные настройки браузера делают ваш цифровой отпечаток ещё более рельефным. Не помогут ни запреты отслеживания, ни удаление cookies, ни режим инкогнито. Свой цифровой отпечаток невозможно отключить.

Как соцсети порождают национализм и мизогинию

Движение за права афроамериканцев #blacklivesmatter или движения против харассмента и сексуального насилия #metoo и #янебоюсьсказать получили широкий резонанс благодаря социальным сетям. Логично предположить, что они вызвали в обществе прилив толерантности, терпимости и взаимоуважения.

Как бы не так: парадоксальным образом они вызвали еще большую волну национализма и мизогинии.

Радикализация мнений во многом упирается в базисные алгоритмы, по которым работают социальные сети: они каталогизируют людей и кормят их контентом, который их сильнее всего цепляет.

Для максимального вовлечения пользователей нужно вызвать либо сильное одобрение и чувство, что контент делает их сильнее, умнее и краше — либо, наоборот, вызвать у них расстройство, раздражение, негодование. Эти реакции «прочитываются» алгоритмами в том числе по наборам ключевых слов.

Кому Трамп обязан победой

— Профилирование по соцсетям может запустить важный тренд в цифровой среде, — рассказывает Борис Орехов. — Ведь на его основе можно управлять поведением людей. Если в правильный момент в правильном виде выбрасывают правильную информацию — можно заставить кого-то полюбить, а кого-то возненавидеть.

Cambridge Analytica, например, использовала свою базу данных из 50 миллионов человек, разбитых по психотипам, для нахождения правильного подхода к каждому в предвыборной кампании Дональда Трампа. Была создана программа, которая анализировала, что пользователь пишет, что любит и с кем общается. И на основе этих данных Cambridge Analytica выдавала инструкцию: что и как сказать человеку, чтобы он поверил и «правильно» отреагировал. Оказалось, чтобы получить отклик людей разных типов, достаточно лишь сменить упаковку одной и той же идеи. Кому-то нужно говорить в лоб, а кого-то очень долго подготавливать аккуратными сообщениями. Бывший сотрудник компании Кристофер Уайли признавался: «Мы использовали несовершенство Фейсбука для сбора миллионов пользовательских профилей и построения моделей, которые позволяли нам узнать о людях многое и применить знания для активации их внутренних демонов». А покровитель проекта Стив Бенон (бывший советник Трампа) прямо назвал проект «инструментом запудривания мозгов для психологической войны».

Cambridge Analytica хвасталась, что с помощью Фейсбука смогла «взломать» 200 выборов в разных странах мира. Самые громкие трофеи компании — голосование о выходе Великобритании из Евросоюза и выборы президента США. Снайперски нацеленную политическую рекламу Трампа в зарубежной прессе даже называли одной из главных причин его победы на выборах. Алгоритм отбирал пользователей, которые могли бы проголосовать за Трампа, и подсовывал им правильные слова — рассказывал ту часть программы, которая могла их заинтересовать. К примеру, фермеры видели сообщения о решении проблем, связанных с сельским хозяйством. И Трамп обошел всех во многом именно потому, что поговорил с избирателями «один на один». Это стало историей успеха парня без поддержки крупных лоббистов, без внятной идеи, зато с данными пользователей Фейсбука, парой ученых и хорошим алгоритмом.

Точно оценить могущество метода Cambridge Analytica никто не может, но даже отсутствие достоверных доказательств того, что компания решающим образом повлияла на политические процессы, не очень успокаивает — ведь реальная возможность воспользоваться своей «магией» у нее была.

«Если человек использует в речи короткие предложения — “пойдем”, “окей”, “давай”, — это говорит, что он сосредоточен на действии. А длинные предложения — это текст, стилистически направленный на осознание, поиск смысла. То же касается высокочастотных и редких слов»

«Продавать» пользователям можно что угодно. Предвыборная агитация за кандидата в президенты не слишком отличается от продвижения на рынок новых пельменей, хотя последствия успеха будут ощутимо разные. В обоих случаях, чтобы сломить сопротивление «покупателя», алгоритм должен правильно разложить пользователей по категориям и выбрать правильную стратегию. Ну а компании готовы платить, чтобы в нужном виде попасться на глаза нужным людям, соответствующим портрету потребителя вроде «консервативный мужчина среднего возраста». Чем детальнее портрет, тем лучше. А цифровой портрет тем точнее, чем больше досье на пользователя.

— Речь идет о бешеных объемах данных, которые люди не задумываясь выкладывают на всеобщее обозрение, — рассказывает Борис Орехов. — Это стало самым дорогим товаром — персональные данные пользователей сети. Наша информация извлекается, хранится и продается задорого.

Приторговывая нашими данными, Фейсбук, например, зарабатывает на рекламе около 40 млрд долларов в год. Закрадываются сомнения, кто тут пользователь, а кого используют.

Враг № 3 — анкеты

Хоть раз каждый из нас «играл» в какую-нибудь игру типа «Ты настоящая русалка?». Глупо, но работает. Никому не дано знать ключ, запрограммированный в этом опросе аналитиками, и как и кем будет обрабатываться этот невинный опрос. Лучше не рисковать и не тратить время, и не раскрывать конфиденциальные данные на прохождение любых тестов.

Как обезопасить данные?

«Злоумышленник может узнать пароль пользователя несколькими
способами, к примеру, подобрать пароль, если он недостаточной стойкий, провести
фишинговую атаку (получение пароля через сомнительные ссылки в письмах) или
установить кейлоггер. Для дополнительной защиты учетной записи рекомендуется
использовать двухфакторную аутентификацию», — утверждает Килюшева.

Двухфакторная идентификация — система защита, состоящая из
двух частей. В первой логин и пароль, а во второй код, приходящий по почте или
смс или биометрические данные.

В этом случае, даже если злоумышленник узнает пароль, он не
сможет получить доступ к странице в соцсети или другому сервису.

Грушо считает, что любые способы аутентификации очень уязвимы.
Строить хорошие механизмы аутентификации достаточно сложно, кроме того, они предполагают
наличие у пользователя определенно рода токенов, которые также могут быть
украдены.

«Что касается биометрической аутентификации, там еще хуже. Если у вас какие-то данные используются для аутентификации, то в случае кражи
подобной базы данных их нечем будет заменить. Поэтому однофакторная или
двухфакторная идентификация  — не принципиально, просто будьте более осторожны с
информацией. Что остро необходимо передать через глобальную сеть — передавайте. Но если есть данные, которые можно оставить при себе, лучше их не выкладывать», — советует Грушо.

Враг № 4 — поисковики Яндекс, Гугл и другие

Поисковые системы проявляют к нам интерес даже больший, чем тот же Facebook. Ищете отель на отпуск или розовую блузку от Pimkie со скидкой? Поисковая система при первом удобном случае навешает вам на дисплей массу ненужной контекстной рекламы. И это будут только цветочки.

Найдите в установках (их расположение напрямую зависит от версии и года) режим «инкогнито». Я обычно пользуюсь им в скайпе — устанавливаю сетевой статус «не в сети». Так я вижу, кто из моих контактов в скайпе есть, а они меня не видят. И не дергают по пустякам.

Кибер-днкСохраняйте важную информацию на облачных хранилищах, не доверяйте все смартфонуФото: pixabay.com