Интернет-инструменты в исследовании общества: возможности и ограничения

  • Опубликовано: 27 July 2016
  • Автор: danik

Данияр Сабитов. Источник: ИМЭП

В современном интернет-маркетинге используется большое количество инструментов, позволяющих определить целевую аудиторию компании, ее характеристики, предпочтения и прочее. По большому счету любое маркетологические исследование во многом базируется на принципах и методах социологического анализа, но применяются в бизнесе, а не в фундаментальных гуманитарных работах.

Вместе с тем, эти инструменты все же можно использовать и в сфере социологии. К сожалению, в Казахстане такого рода методы в политологической и социологической науке почти не используются, тем самым игнорируется серьезный инструмент анализа.

В этой статье будет показано, как можно работать с данными двух популярных поисковых систем на примере исследования языковых изменений в Казахстане.

В 2016 году во время религиозного поста Ораза впервые в бытовом языковом дискурсе появилось слово «ифтар», которое является арабским аналогом традиционного понятия «ауызашар» (разговение). Арабский термин стал появляться на вывесках кафе в Алматы, звучать в речи. Это объективно показывает, что в быту начали сосуществовать два языковых маркера. Это свидетельствует о культурологических изменениях, которые только предстоит исследовать в междисциплинарном дискурсе религиоведения, социологии, этнографии и лингвистики.

1. GoogleTrends является одним из интернет-сревисов, которым может воспользоваться исследователь. Поисковик Google не только ищет статьи по запросу, но и аккумулирует Big Data, часть из которых доступны всем. Google Trends не показывает количество запросов в абсолютном выражении – узнать какое количество раз люди искали то или иное слово невозможно. Механизм работает иначе -  чтобы вычислить относительную популярность слова или словосочетания, сервис делит значение показателя в каждой точке на графике на общее количество запросов в указанном регионе и в заданный период времени. Затем полученные данные масштабируются от 0 до 100. Название инструмента полностью соответствует его сути – он показывает только тренды к увеличению или уменьшению. Здесь можно осуществлять сравнительный анализ сразу нескольких слов, а также делать выборку по конкретному региону.

Таким образом, мы можем проанализировать тренды запросов слов «ифтар» и «ауызашар», сравнить их, задав конкретный регион анализа – Казахстан. При этом следует отметить, что работать с запросами нужно тщательно. Люди могут искать один и тот же термин, но писать его по-разному, например, с грамматической ошибкой. Поэтому следует искать все возможные формы написания слова «ауызашар», например «аузашар» или «ауыз ашар».

При запросе с 2004 года по 2016 год максимум значений набрало слов «ауызашар», и оно берется за 100. От этого показателя выстраиваются все остальные денные.

Вместе с тем, если смотреть на динамику, то тренды будут следующими:

 

Ифтар

Ауызашар

Аузашар

Ауыз ашар

Октябрь 2005

59

0

0

59

Сентябрь 2006

31

0

0

 32

Август 2007

17

15

0

15

Август-октябрь 2008

0

0

0

29

Август 2009

0

9

0

14

Август 2010

12

17

9

8

Август 2011

5

17

3

14

Июль 2012

4

16

1

7

Июль 2013

9

21

2

18

Июль 2014

11

29

2

12

Июнь 2015

15

37

2

17

Июнь 2016

40

100

4

33

Эти же данные в форме диаграммы:

В результате можно сделать несколько выводов:

  1. В конкуренции запросов терминов «ифтар» и «ауызашар» (в разных комбинациях) в тренде традиционное обозначение. Если говорить о 2016 годе, то соотношение трендов запросов арабского термина «ифтар» к традиционному казахскому «ауызашар» составляет почти 1:3.
  2. Необычным является всплеск интереса к слову «ифтар» в 2005 году и постепенный спад до нуля в 2008 и 2009 годах. Google Trends не предоставляет статистику до 2005 года, поэтому невозможно судить о том, насколько популярным запрос был ранее. Тем не менее, статистика показывает, что с 2010 года наблюдается устойчивый интерес с постепенным ростом в последние три года.
  3. Пик запросов обоих слов совпадает во времени друг с другом, а  также со временем поста (см. диаграмму). Очевидно, это связано с утилитарным интересом – пользователи ищут в сети время начала ауызашара, рецепты, адреса кафе, в которых можно поужинать и т.д.

Также Google Trends дает данные по географии запросов.

Это тренды популярности запроса «ауызашар»:

 
 Здесь отображаются тренды запроса «ауыз ашар». Интересно, что тут представлены всего четыре региона – это может быть предметом этнографического или лингвистического исследования.

 Наиболее любопытной является диаграмма по запросу «ифтар»:

 
 Далее в убывающем порядке идут Кызылординская область (52), Южно-Казахстанская область (48), Восточно-Казахстанская область (28) и Павлодарская (27).

Вместе с тем при использовании подобного инструмента нужно быть осторожным в интерпретации данных, поскольку всегда нужно делать дисклеймеры следующего рода:

  1. Google – лишь одна из поисковых сетей, используемых на территории Казахстана. Важно понимать степень популярность этого сайта по годам, в зависимости от географии, языка запроса и т.д.
  2. Google Trends специализируется именно на репрезентации трендов, а не истинного положения вещей. Ниже пойдет речь об инструменте Yandex Word Stat, который показывает данные в абсолютном выражении.

2. Планировщик ключевых слов GoogleAdWords – еще один полезный инструмент, который позволяет детализировать данные. В панели поиска следует выставить максимальный диапазон дат, выбрать источник поиска «Google и поисковые партнеры» и указать назначение таргетинга «Казахстан». В итоге по запросам можно получить следующие данные в пике значений:

Ключевое слово Средн. показатель
июл.14  июн.15  июл.15
ауыз ашар 480 1900 2400 1600
ауызашар 880 2900 3600 2900
ифтар 1300 3600 5400 3600

Также здесь можно сравнивать данные по городам, здесь следует помнить об обычных ограничениях – нужно учитывать количество жителей, уровень проникновения интернета, приоритет того или иного поисковика. В связи с этим, лучше сравнивать не города как таковые, а запросы внутри конкретных населенных пунктов. Статистика по городам доступна только за июль 2016 года (кол-во запросов):

  Ифтар Ауызашар Ауыз ашар
Астана 2900 2400 880
Алматы 5400 3600 1600
Шымкент 720 590 260
Актобе 880 210 260
Атырау 880 390 210


3.
YandexWordStat принадлежит компании Яндекс. Этот инструмент также позволяет посмотреть помесячный или понедельный срез статистики показов по заданному запросу в абсолютном выражении. Работает таргетирование по конкретной стране/региону. Однако если обратить на предоставляемую статистику, то показатели гораздо ниже, чем у Google. Можно предположить, что этот поисковик не так популярен в Казахстане, но его данными можно воспользоваться, чтобы также увидеть некую тенденцию.

Так, если задать поиск по слову «ифтар», выбрать фильтр «История запросов» и задать регион «Казахстан», мы получим следующие данные в пики значений:

  • июль 2014 - 1292
  • июнь 2015 - 2333
  • июль 2015 - 1232
  • июнь 2016 - 5827

Данные по запросу «ауызашар» в пики значений:

  • июнь 2015 – 2 953
  • июль 2015 – 1761
  • июль 2016 - 5723

Данные по запросу «ауыз ашар» в пики значений:

  • июль 2014 – 4 726
  • июнь 2015 – 8 730
  • июнь 2015 – 4 151
  • июль 2016 – 13 681

4. Помимо указанных инструментов, статистику предоставляют также компании Rambler и Mail.ru, однако в цели данной публикации не входит демонстрация работы всех служб.

5. Помимо публичных способов анализа существуют и закрытые. Так, любой сайт собирает обширную статистику, особенно если в него встроена система сбора информации Google Analytics. Если продолжать тему религиоведения, то у сайтов мечетей и церквей Казахстана также есть обширная информация с динамикой численности посетителей, регионов, языка и т.д. Эти данные также могут иметь дополнительные значение в исследовании.

Использованный пример с изменением частоты запроса слов-маркеров показывает как плюсы, так и минусы интернет-инструментов. Очевидно, что они все-таки были разработаны как помощь бизнесу, поэтому в сфере фундаментальных исследований их использование ограничено. Получаемые данные необходимо перепроверять другими инструментами из традиционных наборов социолога, или в данном случае, филолога.

Тем не менее, использование онлайн-сервисов может стать частью инструментария казахстанского исследования. К сожалению, в Казахстане нет такого мощного инструмента, как база Национального корпуса русского языка, какой создан в России. В результате фундаментальной и кропотливой работы российских ученых в интернете есть библиотека, в которой можно проследить историю любого русского слова – дату первого употребления, источник, динамику. Следует признать, что предложенные здесь методы текстового анализа являются только суррогатом Национального корпуса русского языка.

Чтобы привести пример, как можно работать с интернет-технологиями, был использован анализ употребления слов-маркеров – арабское «ифтар» и казахское «ауызашар». Оба они означают одно и то же, однако динамика запросов показывает возрастающий интерес к арабскому аналогу. Процесс нужно наблюдать в динамике, возможно в средне- или долгосрочной перспективе частота использования обоих слов сравняется, а возможно, понятие «ауызашар» начнет вытесняться. Это будет означать многое, в частности, не столько рост интереса к вопросам религии (статистика запросов по «ауызашар» также растет), сколько увеличение влияния арабской формы ислама. Языковые изменения – один из самых верных индикаторов перемен в обществе.

Добавить комментарий

Filtered HTML

  • Адреса страниц и электронной почты автоматически преобразуются в ссылки.
  • Разрешённые HTML-теги: <a> <em> <strong> <cite> <blockquote> <code> <ul> <ol> <li> <dl> <dt> <dd> <p>
  • Строки и параграфы переносятся автоматически.

Plain text

  • HTML-теги не обрабатываются и показываются как обычный текст
  • Адреса страниц и электронной почты автоматически преобразуются в ссылки.
  • Строки и параграфы переносятся автоматически.