- Global Voices по-русски - https://ru.globalvoices.org -

Хештеги и сети пользователей в разговорах о Путине и Порошенко в Twitter

Категории: Восточная и Центральная Европа, Россия, Украина, война и конфликты, гражданская журналистика, политика, Эхо Рунета
Connections between Twitter users and the hashtags they use might reveal interesting information. Images mixed by Tetyana Lokot.

Связи между пользователями Twitter и хештегами, которые они используют, могут раскрыть интересную информацию. Коллаж Татьяны Локоть.

Эта статья — часть проекта по анализу данных по гражданским медиа, проводимого в качестве совместной инициативы «Эха Рунета» [1]и Мэрилендского института технологий в области гуманитарных наук [2] [анг]. Вы можете изучить полную серию статей на странице рубрики «Все президентские твиты [3]».

Мы уже рассмотрели в первом приближении [4] малый набор данных из нашей шестимиллионной выборки, отфильтрованной по коду страны для получения твитов из России и Украины. Оказалось, что более 6000 твитов с кодом страны «UA» (Украина) и почти 8500 твитов с кодом страны «RU» (Россия) содержали одно или более из выбранных нами ключевых слов: poroshenko, putin, порошенко, путин и путін.

Хотя эти две группы твитов составляют гораздо меньшую выборку, они дают нам представление о российской и украинской твитосферах в течение нескольких недель осени 2014 года. Один из способов изучить это представление — рассмотреть российские и украинские твиты как сети, соединяющие отдельных пользователей, и отношения за этими связями. Лучший способ представить такие сети визуально — использование графов.

Два графа ниже раскрывают связи между отдельными пользователями Twitter и хэштегами, которые они включают в свои твиты, причём и те, и другие представлены как круглые узлы. Размер узла для каждого хештега показывает, как часто он используется в нашей выборке твитов для каждой страны. Цветовое кодирование представляет кластеры использования хештегов группами отдельных аккаунтов, чьи узлы имеют размер, соответствующий уровню их вклада в каждый хештег.

User-hashtag network graph for the Russian tweets sample (country code "ru"). Image by Lawrence Alexander.

Граф пользователей и хештегов для российской выборки твитов (код страны «ru»). Изображение создано Лоуренсом Александром.

В графике для российских пользователей из нашей выборки имеется большой голубой кластер, где активность сосредоточена вокруг связанных доминирующих хэштегов #путин и #Россия. Также заметны в этой области, но на меньшем уровне, хэштеги #США, #Обама и #политика.

Значимые для голубого кластера, где основной темой является Россия, пользователи включают журналиста Константина Гетманского [5] и пророссийских комментаторов Павела Рыжевского [6] и Максима Трушкина [7]. Их значимость в этом графе показывает их центральное место в дискуссии с Россией в качестве центральной темы в нашей выборке, но, конечно, не отражает общей ситуации в российском Twitter, в котором, насколько нам известно, в различное время разные пользователи доминируют в обсуждении Путина/Порошенко.

Напротив, активность в российском Twitter вокруг хештегов, связанных с Украиной (например, #Порошенко и #Украина), в нашей выборке ограничена более малой пурпурной областью слева. Справа от главного голубого кластера обсуждение сосредоточено на валдайской речи Путина 2014 года [8].

User-hashtag network graph for the Ukrainian tweets sample (country code "ua"). Image by Lawrence Alexander.

Граф пользователей и хештегов для украинской выборки твитов (код страны «ua»). Изображение создано Лоуренсом Александром.

В украинской выборке в центре обсуждения Путина и Порошенко с применением хештегов за рассматриваемый нами период стоят аккаунты двух местных новостных агентств, оба из которых обильно пишут в Twitter: «Преступности.Нет [9]» (которое также относительно заметно в российской выборке твитов) и telegraf.com.ua [10]. Интересно, что украинцы будто бы используют хештег #путин больше, чем хештег для собственного президента Петра Порошенко.

В обеих графах сообщества хештегов имеют тенденцию к разделению по языкам. Пользователи, употребляющие английские хештеги, находятся в большинстве своём в областях справа сверху. Значимым примером является украинский офицер и журналист Виктор Коваленко [11]. Ключевые темы среди англоговорящих украинских пользователей включают Украину, Германию, Кремль и Путина.

Исследования по анализу контента из Twitter говорят нам, что если полагаться на использование хештегов как единственной меры влияния в сети, это может привести к значительной предвзятости, так как некоторые пользователи употребляют хештеги намного более методично, чем другие, а некоторые вообще их не используют. Например, в российской выборке главные пользователи сети Гетманский, Трушкин и Рыжевский включают хештеги почти в каждый твит, так что их значимость в графе — например, через их вклад в #путин и #Россия — может быть частично приписана этому намеренному использованию хештегов.

Мы можем, однако, добавить второй слой анализа для нахождения относительного влияния отдельных пользователей в конкретной сети. С помощью облаков имён пользователей мы также можем отсортировать пользователей Twitter из каждой выборки на основе числа их твитов — с и без хештегов. Опять же, это говорит нам только, какие пользователи с кодом страны для России или Украины были наиболее плодовиты осенью 2014 года. Но хотя мы не можем делать всеобъемлющих выводов о сетях пользователей и топ-пользователях, мы можем заметить некоторые интересные тренды.

User cloud weighed by tweet volume for the Russian tweets sample (country code "ru"). Image by Lawrence Alexander.

Облако пользователей, где размер отражает количество твитов, для российской выборки (код страны «ru»). Изображение создано Лоуренсом Александром.

Значимым трендом для «главных» российских пользователей является заметность удалённых/переименованных или кажущихся фейковыми аккаунтов. Аккаунта @fredhofmd [12] уже не существует (его владелец, плодовитый участник Twitter, называющий себя западным специалистом по безопасности, проживающим в России, по-видимому сменил свой аккаунт на @infoagestrategy [13]); @doctoriza1888 [14] — автоматический бот, который постоянно в виде спама отправляет хештеги с видео с YouTube; @1georg607 [15] публикует только заголовки и ссылки с segodnya.ru; и @usastupidd [16] — троллинговый аккаунт с антиамериканской направленностью.

User cloud weighed by tweet volume for the Ukrainian tweets sample (country code "ua"). Image by Lawrence Alexander.

Облако пользователей, где размер отражает количество твитов, для украинской выборки (код страны «ua»). Изображение создано Лоуренсом Александром.

Среди «главных» украинских аккаунтов имеются несколько, обычно много твитящих (и делающих ретвиты) о текущих событиях, например, @jumistress [17], @sileziaa1 [18], @yadrobotun [19] и @prestupnostinet [20], что отражено в нашей выборке. Среди других топ-пользователей — бот трендов Twitter [21] (автоматический), но также журналисты, работающие в Украине, такие как Анна Домбровская [22], и известные комментаторы, как Андрес Ослунд [23], шведский общественный деятель, живущий в Украине.

Две наши выборки по странам могут не отражать полностью более обширное пространство диалога в российском-украинском Twitter, но они дают нам довольно хорошую идею о том, кто писал о Путине и Порошенко осенью 2014 года и какие пользователи и хештеги могли доминировать в дискуссии.

В работе над этой статьёй принимала участие редактор «Эха Рунета» Татьяна Локоть [24] [анг].