Яндекс ищет по падежам украинских слов

0
712 views

Яндекс научился искать по формам тех украинских слов, которых нет в словаре. Например, теперь по запросу [вікіпедія] на yandex.ua можно найти все документы, в которых встречаются различные падежи этого слова: «вікіпедії», «вікіпедію», «вікіпедією» и т.п. Раньше такие слова Яндекс искал только в том виде, в котором пользователь набрал их в поисковой строке.

Как система определяет такие словоформы? Анализирует их сходство со словами, которые уже есть в словаре. В частности, Яндекс смотрит на типовые наборы окончаний слов в словаре. “Мы сравниваем окончания «нового» слова с таким же окончанием слова из словаря и делаем предположение, что «новое» слово склоняется так же, как и словарное, – рассказывает Наталья Журавлева, PR-менеджер Яндекса. – Редкие окончания образцом не берем – слова с такими окончаниями обычно относятся к языковому ядра, новые слова по таким шаблонами практически не образуются”.

Анализируются также последние буквы слова перед окончанием. Они могут влиять на то, какие падежные окончания имеет слово или чередоваться при склонении слова (например, руКА – в руЦІ, ноГА – в ноЗІ).