Хотите исследовать русскоязычный интернет, но не говорите по-русски? Мы можем помочь.

"Help." Photograph by Ali Moradi, April 20, 2010. Halifax, Nova Scotia. CC 2.0. Edited by Kevin Rothrock.

“Помощь.” Фотография Али Моради, 20-ое апреля 2010-го года. Галифакс, Новая Шотландия. CC 2.0. ПоKevin Rothrock.

Эта статья – часть большого руководства, подготовленного RuNet Echo с целью помочь людям научиться исследовать открытые ресурсы русскоязычного интернета. Изучите весь справочник целиком [анг] на специальной странице проекта. 

Исследование открытых источников может быть трудным, и это даже более азартным когда ты не можешь читать или писать на языке исследуемой темы. Однако именно благодаря Интернету даже эти обстоятельства не делают невозможным для людей, которые не говорят по-русски, исследование на русском. Чтобы это сделать вам нужно в равной степени обладать терпением и техническими сведениями о поисковых алгоритмах и средствах перевода. Этот справочник указывает и объясняет бесплатные ресурсы, которые позволяют исследовать русскоязычные  открытые источники не изучая языка. Здесь вы изучите как ориентироваться в поисковых алгоритмах в Google и Twitter чтобы отыскать полезную информацию.

Google-Переводчик

Если у вас совсем мало или нет знаний русского языка, тогда программы для переводы совершенно необходимы чтобы поводить исследование  на русском открытых ресурсов. Google-Переводчик - это многофункциональный инструмент для перевода, предлагающий много возможностей о части которых вы наверняка уже знаете, а  с частью которых вы, возможно, знакомы меньше.

Функция обычного перевода в “Google-Переводчике” уже очевидно – копируйте и вставляйте на русском (или печатайте по-английски) текст и получайте перевод. Вы также можете ввести ссылку на сайт в поле для перевода и увидеть всю страницу переведенной на нужный язык.

Если вам трудно читать русский алфавит, то функция Google-переводчика “drawing”, которая позволит вам обвести буквы, используя мышь или cенсорную панель, и перевести рисунки в редактор переводимый текст. Посмотрите ниже на пример со словом “Магнит” (“Магнит” – означает “magnet”), вывеской на супермаркете:

1

Как только вы нарисуете текст, Google автоматически предложит  редактируемый текст, соответствующий вашему эскизу. Иногда первый предложенный вариант не всегда правильный, поэтому просмотрите другие варианты, чтобы быть уверенным в правильности.

Средства Google также могут распознавать текст, написанный от руки, который может сильно отличаться от печатного русскоязычного текста. Ниже фраза “До свидания” (“do svidaniya,” или “goodbye”) успешно распознанная Google:

2

Аббревиатуры и акронимы.

Как и в английском, в русском бесконечное число бюрократических акронимов, а сайт  Sokr.ru помогает ориентироваться среди этих загадок.  Для расшифровка местных названий  особенно полезна вот эта страница русскоязычной “Википедии”, где перечислены списком наиболее употребительные общие аббревиатуры для разных типов населенных пунктов в России (большие и маленькие города, деревни и так далее).

Например, следующий текст найден в названии видео на сайте VK, добавленного про-сепаратистским видеоканалом. Используя два инструмента, подчеркнутых выше, возможно расшифровать информацию, даже не говоря по-русски.

г.Донецк Ленинский р-н обстрел РСЗО “Ураган”

Здесь есть аббревиатуры, которые очень часто встречаются в видео, относящихся к теме украинского конфликта.

sokr

A search on Sokr.ru for the abbreviation “г.”

  1. г. Донецк:  Сначала смотрим список для  “г.”  на Sokr.ru, это даёт нам значение “город” (city), которое находим на “Википедии”, на странице с аббревиатурами. Это описание города Донецк.
  2. Ленинский р-н:  И сайт Sokr.ru, и  “Википедия” подсказывают значние “район” (region/district) для этой аббревиатуры. Это описание  the Lenin (Ленинский) district (район).
  3. РСЗО: Это никак не связать с городами, поэтому мы должны положиться на Sokr, который подсказывает, что этот акроним обозначает  “реактивная система залпового огня / ракетная система залпового огня” (reactive system of volley fire / rocket system of volley fire). Английский эквивалент для него “multiple rocket launcher system” (MLRS),  который в данном случает относится к системе типа “Ураган”.

Таким образом, название видео “City of Donetsk Leninskiy district shelling MLRS ‘Uragan’”

Поиск на русском

В английском слова редко меняются в зависимости от их роли в предложении, но в некоторых случаях к ним добавляется буква, чтобы показать число или притяжательный падеж (soldier, soldiers – солдат, солдаты; soldier’s, soldiers’ – солдата, солдатов (примечание переводчика – в значении “принадлежит солдату/солдатам”), или в случае с местоимениями чтобы показать объект или субъект (who or whom – кто или кому, he or him – он или ему, she or her – она или ей, и так далее).

Всё не так просто в русском языке, так как в нем около десятка форм для каждого слова (показывающих единственное или множественное число или падеж), и несколько разных наклонений и спряжений глаголов. В зависимости от роли в предложении (субъект, прямое и косвенное дополнение, каждое в   единственном и множественном числах  и так далее), слово “кошка” (cat) может иметь следующие 9 изменяемых форм: кошка, кошки, кошке, кошку, кошкой, кошек, кошкам, кошками, кошках. Каждое из этих написаний дает разные результаты при поиске в Твиттере, что усложняет простой процесс поиска, – поэтому  простые формы “кошка” или  “кошки” дадут гораздо больше результатов при поиске чем более продвинутые запросы типа “с кошкой” или  “с кошками”.

“Вики-словарь” предлагает все формы склонения для большинства слов в соответствующем разделе, как и спряжения глаголов. Например, вход в “Вики-словарь” для слова “кошка” показывает формы единственного и множественного числа для каждого из 6 падежей русского языка. Во время поиска убедитесь, что вы удалили знак ударения (маленькая отметка на  о́ как видели в слове “ко́шка”) с буквы  нажатием клавиши “backspace” перед ударной буквой.

3

Когда вы ищете информацию в Google, то это не такая уже большая проблема, так как поисковые алгоритмы включают множество форм слова во время поиска. (Когда вы вводите русского слово “кошка” (cat)  в поиск, то появятся релевантные результаты, которые будут включать разные формы — кошки, к кошке, кошки, по кошке и так далее). Таким образом, до тех пор пока вы не вводите слово в кавычках, вам не надо беспокоиться о форме существительного или глагола при поиске информации в Google на русском.

С Twitter, надо заметить, дело обстоит несколько иначе. Twitter может выдавать результат на конкретный запрос и не способен различить изменения форм глаголов  (как например “бегут” “бежали,” “бегает”) или существительных.

If you were trying to find out information about the evacuation of a building в Казани, вы можете получить радикально разные результаты, зависящие от формы слова, которые вы вводите в поисковое поле. Например, 2 поисковых запроса с разными формами глагола “эвакуировать” (to evacuate) и формами  слова “Казань”:  начальный вариант (“Казань) и вариант “в Казани” (“in Kazan”).

  1. Эвакуировать Казань – Evacuate Kazan (без изменений глаголы/существительного):

При поиске в вкGoogle News, результаты включают разные формы слов “Казань” и “эвакуировать”, но также включат результаты со словом “эвакуация” и прилагательными, образованными от слова “Казань”, в разных падежах.

4

В Twitter вы получите гораздо меньше результатов, так как эта форма глагола “эвакуировать” редко используется в твитах и новостных статьях.  Как вы видите результаты ниже, между тремя твитами перерыв в 4 месяца,  показывающих что едва ли есть информация по нужной теме, ключевую фразу для поиска стоит пересмотреть.

5

  1. Эвакуировали в Казани (“evacuated in Kazan”)

Использование формы прошедшего времени множественного числа глагола “‘эвакуировать” (распространен в пассивных конструкциях) даёт гораздо больше ценных результатов с первого раза. (Если вы посмотрите снова на результаты поиска в Google News, второй результат использует именно эти формы слов “эвакуировать” и “Казань”) Твиты ниже довольно разнообразные, но все они релевантны запросу, как, например, эвакуация церкви после пожара, автобусная эвакуация и эвакуация школы.

6

Если вы незнакомы с русским, то трудно понять, какие фразы и поисковые параметры использовать чтобы получить максимальные результаты. Поэтому лучше ввести русские термины и фразы в Google— такие как “evacuation” и “Kazan”— и затем скопировать наиболее часто воспроизводимые словосочетания. После того как мы это сделали в Google, можно найти наиболее релевантные результаты в поисковике Twitter, потому что русские  существительные и глаголы (это важно напомнить) обладают не очень податливым и покорным характером.

***

Как вы видите из путеводителя, поиск на русском без знания русского может быть утомительным и даже разочаровывать, но все же в конечном счете он возможен. Вы не обязаны знать как читать по-русски, даже знать кириллический алфавит, чтобы проводить исследование русскоязычных открытых источников,  но все-таки это  определенно может помочь познакомиться с языком. Через какое-то время вы начнете узнавать буквы и поймете, как читать алфавит, особенно отдельные города и имена, которые чаще всего появляются в ваших запросах.  Между тем этот справочник поможет  расшифровывать непрозрачные сокращения, Twitter  и Google также  помогут вам в ваших поисках.

Переводчик: Дарья Труханова.

Начать обсуждение

Авторы, пожалуйста вход в систему »

Правила

  • Пожалуйста, относитесь к другим с уважением. Комментарии, содержащие ненависть, ругательства или оскорбления не будут опубликованы.