Аудиторные исследования

Как интегрировать онлайн и офлайн взаимодействия, что такое косвенные данные и почему за ними охотятся социологи, урбанисты и современный бизнес

Сохранить в закладки
12292
115
22 марта 2018
Сохранить в закладки

Аудиторные исследования — тема достаточно давняя, серьезные шаги в этой области начали осуществлять еще в 1920–1930-х годах в США. Цель этих исследований можно описать так: получить как можно больше информации о поведении и предпочтениях исследуемой аудитории. Мощный толчок для развития эта область получила с появлением Интернета и возможности отслеживать поведение пользователей в Сети.

Использовать аудиторные исследования можно для самых разных целей: в социологических задачах, в градостроительстве для оценки посещаемости объектов, при планировании застройки и, конечно же, в рекламной индустрии, где уже сформировалась понятная бизнес-модель. Сегодня аудиторные данные применяются в коммерции для задач оптимизации медиазакупок и планирования рекламных кампаний за счет поведенческих таргетингов или для расширения аудитории через моделирование по схожести интересов и предпочтений.

Look-alike-аудитория (дословно с английского — «поиск похожих»)новый вид социально-демографического таргетинга, выделяющий пользователей, которые по поведению похожи на тех, кто уже пользовался тем или иным сервисом

В этой сфере становится интересна связь онлайн- и офлайн-взаимодействий, а именно создание технологий, позволяющих это оценивать. Для того, чтобы исследовать поведение пользователей офлайн, нужно каким-то образом наладить автоматический сбор информации и настроить на базе этих данных соответствующие механизмы обучения. И самая важная задача, которая стоит перед создателями инфраструктуры для аудиторных исследований, — убрать субъективный фактор. Даже в строгих социологических опросах, когда один человек спрашивает, а другой отвечает, всегда есть некие искажения, связанные с тем, что один как-то не так спросил, другой как-то не так ответил. Это приводит к ошибкам субъективной интерпретации. А вот в онлайн никто никого ни о чем не спрашивает — там просто следят за вашим поведением, узнают, куда вы ходите, как часто, что вы там делаете, какие привычки формируете и так далее. И в офлайн хотелось бы сделать ровно то же самое: отслеживать характерные паттерны поведения автоматически, без участия человека.

 

Что такое косвенные данные

Современный смартфон — сложное интеллектуальное устройство, содержащее множество информации о своем пользователе. Информация бывает персональной: имя, номер телефона, адрес электронной почты и даже иногда параметры здоровья и отпечатки пальцев. Также она бывает косвенной — различные идентификаторы самого устройства (адреса связных интерфейсов, серийный номер). Использовать персональные данные без согласия пользователя законодательно запрещено, поэтому для исследований данные анонимизируются. Но это не освобождает от задачи их хранения, что накладывает серьезные требования по безопасности. Поэтому перспективной областью аудиторных исследований является использование косвенной информации, связанной с пользователем. И чем меньше действий со стороны пользователя для этого требуется, тем лучше.

Конвенция Совета Европы о защите физических лиц при автоматизированной обработке персональных данных была подписана 28 января 1981 года в Страсбурге. В России конвенция вступила в силу с 1 марта 2002 года // wikipedia.org

«Самая важная задача, которая стоит перед создателями инфраструктуры для аудиторных исследований, — убрать субъективный фактор. В онлайн никто никого ни о чем не спрашивает — там просто следят за вашим поведением, узнают, куда вы ходите, как часто, что вы там делаете, какие привычки формируете и так далее. И в офлайн хотелось бы сделать ровно то же самое: отслеживать характерные паттерны поведения автоматически, без участия человека»

Простейший способ получить эту косвенную информацию — прослушивать трафик, генерируемый смартфоном, а именно служебные сообщения самого смартфона, а не трафик пользователя, который является его персональной информацией. В трафике смартфона потенциально можно увидеть следующие идентификаторы: МАС-адреса интерфейса Wi-Fi и интерфейса Bluetooth, используемые для идентификации устройства. На самом деле у смартфона есть еще идентификатор устройства в сотовой сети IMEI (International Mobile Equipment Identity), но узнать его можно, только разобрав обмен информацией между смартфоном и базовой станцией оператора и неизбежно узнав IMSI (International Mobile Subscriber Identity) — персональный идентификатор абонента, по которому в один шаг определяется телефонный номер абонента — персональная информация. Кроме того, это, строго говоря, вмешательство в работу сотового оператора, поэтому сейчас в аудиторных исследованиях перспективным кажется сосредоточиться только на определении МАС-адресов интерфейсов Wi-Fi и Bluetooth.

JR Corpa // unsplash.com
JR Corpa // unsplash.com

Как узнать МАС-адрес устройства

Прежде всего, для сбора данных по МАС-адресам смартфона необходимо достаточно простое устройство — сниффер, или анализатор трафика, который сканирует эфир и записывает услышанные в кадрах данных МАС-адреса. По сути дела, сниффер — это маленький компьютер, имеющий интерфейсы Wi-Fi и Bluetooth для сканирования, специальное ПО для разбора полученных из эфира кадров и выделения из них МАС-адресов. Также в сниффере есть интерфейс связи (обычно это GPRS или LTE-модем) для передачи записанных МАС-адресов в базу данных DMP. Расставив такие снифферы по городу (например, на наружных рекламных и информационных конструкциях или в общественных местах: магазинах, ресторанах, концертных залах и так далее), можно в режиме онлайн собирать информацию о смартфонах, находящихся в непосредственной близости от сниффера, и таким образом географически позиционировать смартфоны.

По сути дела, сниффер — это маленькая коробочка, отладочная плата размером с Raspberry Pi с двумя антеннами, которую можно поставить в принципе везде, но чаще всего ее размещают на улицах, рекламных конструкциях. С точки зрения работы это просто еще один сотовый телефон, который по GPRS или LTE отправляет куда-то данные и не выступает каким-то активным элементом связи, как, например, точка доступа Wi-Fi.

МАС-адресУникальный номер длиной 48 бит, назначенный сетевой карте ее производителем. Необходим для обеспечения коммуникации устройств в сети на физическом уровне

Постепенно в базе данных появляются и постоянно обновляются профили смартфонов, в которых записана информация об их геопозиции на протяжении достаточно долгого времени. Даже эта информация, которая пока никак не привязана к пользователям смартфонов, уже дает много дополнительных знаний как городским службам и ведомствам, так и отдельным предприятиям, таким как банки и торговые центры, прежде всего о количестве людей, ежедневно проходящих по конкретной улице или заходящих в тот или иной магазин, о сезонных колебаниях этого количества и так далее. По МАС-адресам можно также узнать производителя смартфона и тем самым приблизительно сегментировать смартфоны, например, по их стоимости.

Например, на станции метро «Деловой центр» много дорогих смартфонов (деловые люди часто пользуются метро, чтобы не опаздывать на встречи из-за пробок), а это значит, что на этой станции метро можно рекламировать автомобили премиум-класса. С помощью методов науки о данных и искусственного интеллекта из профилей смартфонов можно найти много интересных и порой неожиданных соответствий. И что важно, эти соответствия делаются на основании сбора косвенных данных, и пользователь может совершенно не волноваться за свои персональные данные.

 

 

Raspberry Pi — одноплатный компьютер размером с банковскую карту // wikimedia.org
Raspberry Pi — одноплатный компьютер размером с банковскую карту // wikimedia.org

Обработка и хранение данных аудиторных исследований

Аудиторные данные хранятся и обрабатываются на многофункциональных платформах по управлению данными — DMP (Data Management Platforms). Все эти решения направлены прежде всего на онлайн-рынок, в то время как офлайн-рынок до сих пор работает на старых, доинтернетных методах (опросы, холодные звонки, статистические расчеты по общедоступным данным и так далее). Одной из актуальных задач на сегодняшний день является задача автоматического добавления (так называемого обогащения) офлайн-информации в DMP с онлайн-информацией. Как правило, это информация о геопозиционных предпочтениях пользователя: маршруты передвижения, повторяемость маршрутов, время в пути, посещаемые места.

Самое очевидное приложение этих данных — проверка эффективности рекламных онлайн-кампаний, приводящих пользователя в офлайн-магазин, или, наоборот, подстройка рекламной онлайн-кампании под офлайн-объекты, которые посещает пользователь. Эти данные легко получить, если на смартфоне пользователя установлено приложение, отсылающее данные о его геопозиции, однако далеко не все пользователи хотят подобные приложения устанавливать. Поэтому важно найти способ собирать эту информацию без какого-либо участия или содействия со стороны пользователя. При этом важно достаточно точно оценивать нахождение пользователя не только на улице, но и в помещениях.

Использовать теорию вероятностей для исследования общественных явлений впервые предложил Яков Бернулли // wikipedia.org

Связка профиля смартфона и профиля его пользователя осуществляется через DMP операторов связи, предоставляющих доступ в интернет через Wi-Fi. По российскому законодательству каждый пользователь общественных Wi-Fi-сетей должен идентифицироваться — обычно с помощью номера своего сотового телефона (самый распространенный вариант), данных ЕСИА (Единой системы идентификации и аутентификации) или связки логина/пароля портала государственных услуг РФ. А зная телефон пользователя, уже можно обратиться к сотовому оператору связи, который знает о своих абонентах очень многое.

«Важно найти способ собирать данные о геопозиции пользователя без какого-либо участия или содействия с его стороны, при этом делать это с достаточной точностью не только на улице, но и в помещениях»

Конечно, сотовый оператор (или его компания-партнер, специализирующаяся на обработке его данных) никогда не выдаст личные данные абонента, однако может сегментировать его в ту или иную категорию: пол, возраст от/до, ежемесячная сумма, которую абонент тратит на сотовую связь, регулярно пользуется такси, болеет за определенный спортивный клуб, владелец определенной марки машины. Что, конечно же, сильно помогает прежде всего для проведения таргетированных рекламных кампаний.

И в связи с этим самое типичное, что сейчас пытаются продавать операторы сотовой связи, — это результаты рекламной онлайн-кампании в офлайн. То есть, например, оценку того, пошел ли человек после взаимодействия с рекламой в тот магазин, который рекламировали, или нет.

 

Что можно узнать через Wi-Fi и Bluetooth

Информация о физическом месте нахождения пользователя смартфона у сотовых операторов также есть, однако она не так точна, как информация, собранная по Wi-Fi и Bluetooth. Это особенно важно для определения положения пользователей в помещениях, и прежде всего потому, что радиус действия Wi-Fi и особенно Bluetooth небольшой и пользователя можно позиционировать точнее. Интерфейс Bluetooth в данном случае наиболее интересен, однако он часто отключен в смартфоне в целях экономии заряда аккумулятора телефона.

Технология Bluetooth была названа в честь короля Харальда Первого Синезубого, объединившего Данию и Норвегию, ведь новый стандарт смог объединить разрозненные беспроводные протоколы

Частично эту проблему снимают многочисленные гаджеты носимой электроники, которые подключаются к смартфону по Bluetooth: гарнитуры, беспроводные наушники, фитнес-браслеты и другие привычные нам устройства провоцируют пользователя держать интерфейс Bluetooth включенным, а значит, смартфон становится ценным источником косвенной информации.

«Bluetooth и Wi-Fi — это максимально деперсонализированные вещи. Они вообще ничего не сообщают об абоненте, а только определяют различные параметры смартфона»

Однако сейчас разрабатываются дополнительные способы провоцировать абонента на использование этого интерфейса. Например, сниффер может рассылать через свой интерфейс Bluetooth макеты маячков стандартов iBeacon и Eddystone для предоставления полезных пользователю сервисов (например, для позиционирования пользователей в помещении, что особенно актуально для больших торговых центров, или предоставления им полезной информации).

 

 

Маяк Eddystone Lighthouse в проливе Ла-Манш // wikimedia.org
Маяк Eddystone Lighthouse в проливе Ла-Манш // wikimedia.org

Связанный мир 

Кажется, что в мире, пронизанном интернетом вещей, мы находимся под постоянным прицелом систем, отслеживающих наше поведение. С одной стороны, это так, с другой — это не так страшно, ведь Bluetooth и Wi-Fi — это максимально деперсонализированные вещи. Они вообще ничего не сообщают об абоненте, а только определяют различные параметры смартфона.

Важно понимать, что персональные данные связаны с сим-картой, а не с устройством. Как только вы дарите, теряете и продаете свой телефон, инфраструктура аудиторных исследований будет продолжать следить за ним, а не за исходным абонентом — владельцем устройства. И с этой точки зрения точность оценок аудиторных исследований, безусловно, падает. Но методы работы с большими данными рано или поздно делают свое дело и находят соответствия между индивидуальными пользователями в сети и их устройствами. Как только вы с новым телефоном зарегистрируетесь, например, при подключении к сети Wi-Fi в метро, вы снова покажете свой МАС-адрес и предоставите информацию о себе.

 

Читайте также

Внеси свой вклад в дело просвещения!
visa
master-card
illustration