Эта статья — часть проекта по анализу данных по гражданским медиа, проводимого в качестве совместной инициативы «Эха Рунета»и Мэрилендского института технологий в области гуманитарных наук [анг]. Вы можете изучить полную серию статей на странице рубрики «Все президентские твиты».
Мы уже рассмотрели в первом приближении малый набор данных из нашей шестимиллионной выборки, отфильтрованной по коду страны для получения твитов из России и Украины. Оказалось, что более 6000 твитов с кодом страны «UA» (Украина) и почти 8500 твитов с кодом страны «RU» (Россия) содержали одно или более из выбранных нами ключевых слов: poroshenko, putin, порошенко, путин и путін.
Хотя эти две группы твитов составляют гораздо меньшую выборку, они дают нам представление о российской и украинской твитосферах в течение нескольких недель осени 2014 года. Один из способов изучить это представление — рассмотреть российские и украинские твиты как сети, соединяющие отдельных пользователей, и отношения за этими связями. Лучший способ представить такие сети визуально — использование графов.
Два графа ниже раскрывают связи между отдельными пользователями Twitter и хэштегами, которые они включают в свои твиты, причём и те, и другие представлены как круглые узлы. Размер узла для каждого хештега показывает, как часто он используется в нашей выборке твитов для каждой страны. Цветовое кодирование представляет кластеры использования хештегов группами отдельных аккаунтов, чьи узлы имеют размер, соответствующий уровню их вклада в каждый хештег.
В графике для российских пользователей из нашей выборки имеется большой голубой кластер, где активность сосредоточена вокруг связанных доминирующих хэштегов #путин и #Россия. Также заметны в этой области, но на меньшем уровне, хэштеги #США, #Обама и #политика.
Значимые для голубого кластера, где основной темой является Россия, пользователи включают журналиста Константина Гетманского и пророссийских комментаторов Павела Рыжевского и Максима Трушкина. Их значимость в этом графе показывает их центральное место в дискуссии с Россией в качестве центральной темы в нашей выборке, но, конечно, не отражает общей ситуации в российском Twitter, в котором, насколько нам известно, в различное время разные пользователи доминируют в обсуждении Путина/Порошенко.
Напротив, активность в российском Twitter вокруг хештегов, связанных с Украиной (например, #Порошенко и #Украина), в нашей выборке ограничена более малой пурпурной областью слева. Справа от главного голубого кластера обсуждение сосредоточено на валдайской речи Путина 2014 года.
В украинской выборке в центре обсуждения Путина и Порошенко с применением хештегов за рассматриваемый нами период стоят аккаунты двух местных новостных агентств, оба из которых обильно пишут в Twitter: «Преступности.Нет» (которое также относительно заметно в российской выборке твитов) и telegraf.com.ua. Интересно, что украинцы будто бы используют хештег #путин больше, чем хештег для собственного президента Петра Порошенко.
В обеих графах сообщества хештегов имеют тенденцию к разделению по языкам. Пользователи, употребляющие английские хештеги, находятся в большинстве своём в областях справа сверху. Значимым примером является украинский офицер и журналист Виктор Коваленко. Ключевые темы среди англоговорящих украинских пользователей включают Украину, Германию, Кремль и Путина.
Исследования по анализу контента из Twitter говорят нам, что если полагаться на использование хештегов как единственной меры влияния в сети, это может привести к значительной предвзятости, так как некоторые пользователи употребляют хештеги намного более методично, чем другие, а некоторые вообще их не используют. Например, в российской выборке главные пользователи сети Гетманский, Трушкин и Рыжевский включают хештеги почти в каждый твит, так что их значимость в графе — например, через их вклад в #путин и #Россия — может быть частично приписана этому намеренному использованию хештегов.
Мы можем, однако, добавить второй слой анализа для нахождения относительного влияния отдельных пользователей в конкретной сети. С помощью облаков имён пользователей мы также можем отсортировать пользователей Twitter из каждой выборки на основе числа их твитов — с и без хештегов. Опять же, это говорит нам только, какие пользователи с кодом страны для России или Украины были наиболее плодовиты осенью 2014 года. Но хотя мы не можем делать всеобъемлющих выводов о сетях пользователей и топ-пользователях, мы можем заметить некоторые интересные тренды.
Значимым трендом для «главных» российских пользователей является заметность удалённых/переименованных или кажущихся фейковыми аккаунтов. Аккаунта @fredhofmd уже не существует (его владелец, плодовитый участник Twitter, называющий себя западным специалистом по безопасности, проживающим в России, по-видимому сменил свой аккаунт на @infoagestrategy); @doctoriza1888 — автоматический бот, который постоянно в виде спама отправляет хештеги с видео с YouTube; @1georg607 публикует только заголовки и ссылки с segodnya.ru; и @usastupidd — троллинговый аккаунт с антиамериканской направленностью.
Среди «главных» украинских аккаунтов имеются несколько, обычно много твитящих (и делающих ретвиты) о текущих событиях, например, @jumistress, @sileziaa1, @yadrobotun и @prestupnostinet, что отражено в нашей выборке. Среди других топ-пользователей — бот трендов Twitter (автоматический), но также журналисты, работающие в Украине, такие как Анна Домбровская, и известные комментаторы, как Андрес Ослунд, шведский общественный деятель, живущий в Украине.
Две наши выборки по странам могут не отражать полностью более обширное пространство диалога в российском-украинском Twitter, но они дают нам довольно хорошую идею о том, кто писал о Путине и Порошенко осенью 2014 года и какие пользователи и хештеги могли доминировать в дискуссии.