Интернет-инструменты в исследовании общества: возможности и ограничения
Данияр Сабитов. Источник: ИМЭП
В современном интернет-маркетинге используется большое количество инструментов, позволяющих определить целевую аудиторию компании, ее характеристики, предпочтения и прочее. По большому счету любое маркетологические исследование во многом базируется на принципах и методах социологического анализа, но применяются в бизнесе, а не в фундаментальных гуманитарных работах.
Вместе с тем, эти инструменты все же можно использовать и в сфере социологии. К сожалению, в Казахстане такого рода методы в политологической и социологической науке почти не используются, тем самым игнорируется серьезный инструмент анализа.
В этой статье будет показано, как можно работать с данными двух популярных поисковых систем на примере исследования языковых изменений в Казахстане.
В 2016 году во время религиозного поста Ораза впервые в бытовом языковом дискурсе появилось слово «ифтар», которое является арабским аналогом традиционного понятия «ауызашар» (разговение). Арабский термин стал появляться на вывесках кафе в Алматы, звучать в речи. Это объективно показывает, что в быту начали сосуществовать два языковых маркера. Это свидетельствует о культурологических изменениях, которые только предстоит исследовать в междисциплинарном дискурсе религиоведения, социологии, этнографии и лингвистики.
1. GoogleTrends является одним из интернет-сревисов, которым может воспользоваться исследователь. Поисковик Google не только ищет статьи по запросу, но и аккумулирует Big Data, часть из которых доступны всем. Google Trends не показывает количество запросов в абсолютном выражении – узнать какое количество раз люди искали то или иное слово невозможно. Механизм работает иначе - чтобы вычислить относительную популярность слова или словосочетания, сервис делит значение показателя в каждой точке на графике на общее количество запросов в указанном регионе и в заданный период времени. Затем полученные данные масштабируются от 0 до 100. Название инструмента полностью соответствует его сути – он показывает только тренды к увеличению или уменьшению. Здесь можно осуществлять сравнительный анализ сразу нескольких слов, а также делать выборку по конкретному региону.
Таким образом, мы можем проанализировать тренды запросов слов «ифтар» и «ауызашар», сравнить их, задав конкретный регион анализа – Казахстан. При этом следует отметить, что работать с запросами нужно тщательно. Люди могут искать один и тот же термин, но писать его по-разному, например, с грамматической ошибкой. Поэтому следует искать все возможные формы написания слова «ауызашар», например «аузашар» или «ауыз ашар».
При запросе с 2004 года по 2016 год максимум значений набрало слов «ауызашар», и оно берется за 100. От этого показателя выстраиваются все остальные денные.
Вместе с тем, если смотреть на динамику, то тренды будут следующими:
|
Ифтар |
Ауызашар |
Аузашар |
Ауыз ашар |
Октябрь 2005 |
59 |
0 |
0 |
59 |
Сентябрь 2006 |
31 |
0 |
0 |
32 |
Август 2007 |
17 |
15 |
0 |
15 |
Август-октябрь 2008 |
0 |
0 |
0 |
29 |
Август 2009 |
0 |
9 |
0 |
14 |
Август 2010 |
12 |
17 |
9 |
8 |
Август 2011 |
5 |
17 |
3 |
14 |
Июль 2012 |
4 |
16 |
1 |
7 |
Июль 2013 |
9 |
21 |
2 |
18 |
Июль 2014 |
11 |
29 |
2 |
12 |
Июнь 2015 |
15 |
37 |
2 |
17 |
Июнь 2016 |
40 |
100 |
4 |
33 |
Эти же данные в форме диаграммы:
В результате можно сделать несколько выводов:
- В конкуренции запросов терминов «ифтар» и «ауызашар» (в разных комбинациях) в тренде традиционное обозначение. Если говорить о 2016 годе, то соотношение трендов запросов арабского термина «ифтар» к традиционному казахскому «ауызашар» составляет почти 1:3.
- Необычным является всплеск интереса к слову «ифтар» в 2005 году и постепенный спад до нуля в 2008 и 2009 годах. Google Trends не предоставляет статистику до 2005 года, поэтому невозможно судить о том, насколько популярным запрос был ранее. Тем не менее, статистика показывает, что с 2010 года наблюдается устойчивый интерес с постепенным ростом в последние три года.
- Пик запросов обоих слов совпадает во времени друг с другом, а также со временем поста (см. диаграмму). Очевидно, это связано с утилитарным интересом – пользователи ищут в сети время начала ауызашара, рецепты, адреса кафе, в которых можно поужинать и т.д.
Также Google Trends дает данные по географии запросов.
Это тренды популярности запроса «ауызашар»:
Вместе с тем при использовании подобного инструмента нужно быть осторожным в интерпретации данных, поскольку всегда нужно делать дисклеймеры следующего рода:
- Google – лишь одна из поисковых сетей, используемых на территории Казахстана. Важно понимать степень популярность этого сайта по годам, в зависимости от географии, языка запроса и т.д.
- Google Trends специализируется именно на репрезентации трендов, а не истинного положения вещей. Ниже пойдет речь об инструменте Yandex Word Stat, который показывает данные в абсолютном выражении.
2. Планировщик ключевых слов GoogleAdWords – еще один полезный инструмент, который позволяет детализировать данные. В панели поиска следует выставить максимальный диапазон дат, выбрать источник поиска «Google и поисковые партнеры» и указать назначение таргетинга «Казахстан». В итоге по запросам можно получить следующие данные в пике значений:
Ключевое слово | Средн. показатель |
июл.14 | июн.15 | июл.15 |
ауыз ашар | 480 | 1900 | 2400 | 1600 |
ауызашар | 880 | 2900 | 3600 | 2900 |
ифтар | 1300 | 3600 | 5400 | 3600 |
Также здесь можно сравнивать данные по городам, здесь следует помнить об обычных ограничениях – нужно учитывать количество жителей, уровень проникновения интернета, приоритет того или иного поисковика. В связи с этим, лучше сравнивать не города как таковые, а запросы внутри конкретных населенных пунктов. Статистика по городам доступна только за июль 2016 года (кол-во запросов):
Ифтар | Ауызашар | Ауыз ашар | |
Астана | 2900 | 2400 | 880 |
Алматы | 5400 | 3600 | 1600 |
Шымкент | 720 | 590 | 260 |
Актобе | 880 | 210 | 260 |
Атырау | 880 | 390 | 210 |
3. YandexWordStat принадлежит компании Яндекс. Этот инструмент также позволяет посмотреть помесячный или понедельный срез статистики показов по заданному запросу в абсолютном выражении. Работает таргетирование по конкретной стране/региону. Однако если обратить на предоставляемую статистику, то показатели гораздо ниже, чем у Google. Можно предположить, что этот поисковик не так популярен в Казахстане, но его данными можно воспользоваться, чтобы также увидеть некую тенденцию.
Так, если задать поиск по слову «ифтар», выбрать фильтр «История запросов» и задать регион «Казахстан», мы получим следующие данные в пики значений:
- июль 2014 - 1292
- июнь 2015 - 2333
- июль 2015 - 1232
- июнь 2016 - 5827
Данные по запросу «ауызашар» в пики значений:
- июнь 2015 – 2 953
- июль 2015 – 1761
- июль 2016 - 5723
Данные по запросу «ауыз ашар» в пики значений:
- июль 2014 – 4 726
- июнь 2015 – 8 730
- июнь 2015 – 4 151
- июль 2016 – 13 681
4. Помимо указанных инструментов, статистику предоставляют также компании Rambler и Mail.ru, однако в цели данной публикации не входит демонстрация работы всех служб.
5. Помимо публичных способов анализа существуют и закрытые. Так, любой сайт собирает обширную статистику, особенно если в него встроена система сбора информации Google Analytics. Если продолжать тему религиоведения, то у сайтов мечетей и церквей Казахстана также есть обширная информация с динамикой численности посетителей, регионов, языка и т.д. Эти данные также могут иметь дополнительные значение в исследовании.
Использованный пример с изменением частоты запроса слов-маркеров показывает как плюсы, так и минусы интернет-инструментов. Очевидно, что они все-таки были разработаны как помощь бизнесу, поэтому в сфере фундаментальных исследований их использование ограничено. Получаемые данные необходимо перепроверять другими инструментами из традиционных наборов социолога, или в данном случае, филолога.
Тем не менее, использование онлайн-сервисов может стать частью инструментария казахстанского исследования. К сожалению, в Казахстане нет такого мощного инструмента, как база Национального корпуса русского языка, какой создан в России. В результате фундаментальной и кропотливой работы российских ученых в интернете есть библиотека, в которой можно проследить историю любого русского слова – дату первого употребления, источник, динамику. Следует признать, что предложенные здесь методы текстового анализа являются только суррогатом Национального корпуса русского языка.
Чтобы привести пример, как можно работать с интернет-технологиями, был использован анализ употребления слов-маркеров – арабское «ифтар» и казахское «ауызашар». Оба они означают одно и то же, однако динамика запросов показывает возрастающий интерес к арабскому аналогу. Процесс нужно наблюдать в динамике, возможно в средне- или долгосрочной перспективе частота использования обоих слов сравняется, а возможно, понятие «ауызашар» начнет вытесняться. Это будет означать многое, в частности, не столько рост интереса к вопросам религии (статистика запросов по «ауызашар» также растет), сколько увеличение влияния арабской формы ислама. Языковые изменения – один из самых верных индикаторов перемен в обществе.
Добавить комментарий