Архив за месяц: Апрель 2009

Рассмотрим «Арзамас» поближе

Логотип ЯндексИтак, прошла первая неделя с момента запуска новых алгоритмов поиска Яндекс, под названием «Арзамас», и что мы о них знаем? Вот Комментарии самих представителей Яндекс:
«Теперь поиск Яндекса учитывает регион пользователя. Начиная с «Арзамаса», результаты поиска по одному и тому же запросу могут быть разными в разных регионах.

Пользователи часто спрашивают Яндекс о людях и компаниях из их региона, локальных событиях и местах, сайтах и услугах. Например, среди самых часто задаваемых запросов в Челябинске и Ростове-на-Дону 14% «локальных», в Уфе — 24%, а во Владивостоке — 29%. Ранжирование с учетом региона поможет поиску дать более точный ответ на вопрос пользователя.

Движение в эту сторону поиск начал давно — с 2006 года в Яндексе работает автоматическая геоклассификация сайтов, еще раньше появилась возможность ограничить поиск сайтами из своего региона (в расширенном поиске или взведя галочку под поисковой строкой). Но теперь Яндекс пытается сам определить, важен ли регион в каждом конкретном случае. И, конечно, у нас были и будут колдунщики, дающие локальные для пользователя ответы из Карт, Адресов, Афиши, Погоды и Новостей.

Как «Арзамас» понимает, что какие-то результаты должны быть локальными? Регион пользователя определяется по IP-адресу. При желании пользователь может указать свой регион вручную. В ранжировании стали учитываться факторы, позволяющие понять, что данная страница важна пользователям именно «своего» региона. Причем мы попытались сделать это решение максимально общим, не зависящим ни от какого региона конкретно.

Для ряда регионов — и список их будет расти — мы используем специально настроенную формулу ранжирования. Сейчас индивидуальная формула есть для Москвы, Санкт-Петербурга и российского регионального поиска, а также для некоторых стран СНГ.

С выходом «Арзамаса» мы начали учитывать в подсказке об опечатках настройку языка браузера при определении языка запроса в сложных случаях.»

Денис Расковалов и команда поиска
Источник: webmaster.ya.ru

Эт всё понятно, но непонятно пока — как мониторить позиции сайтов, если продвигаешь сразу в нескольких регионах или во всех сразу? Мои тесты показали что, например, семонитор — показывает совсем не ту выдачу, которую я вижу со своего браузера. А ежели еще и Заказчик из другого региона? …а если он еще и через неместный прокси смотрит? Вощем вопросов появилось много…

Запись опубликована автором в рубрике SEO.

На Yandex.ru обновлена поисковая программа

На прошлой неделе Яндекс обновил в очередной раз свои поисковые алгоритмы (уже в третий раз за год), и вот дословно что пишет Яндекс:
«На www.yandex.ru обновлена поисковая программа — теперь там работает «Арзамас» (ранее известный как «Анадырь»). В серии постингов мы расскажем, что сделано за это время.
Снятие омонимии. Яндекс научился еще лучше понимать русский язык, разрешая неоднозначности слов в запросах.

Как известно, знание русской морфологии позволяет поиску Яндекса находить больше полезных ответов. Если вы спросили [реконструкция Маяковской], мы покажем также страницу со словами [станция Маяковская открылась после реконструкции]. Но русский язык — тонкий, сложный и неоднозначный. Тем, кто ищет [фото львов], могут быть нужны как фотографии животных, так и фотографии города Львова. Человек может уточнить свое высказывание, добавив к нему одно или несколько слов: [фото африканских львов]  или [фото город львов]. Теперь эти уточнения наш поиск научился понимать.

Мы реализовали алгоритм снятия омонимии, позволяющий во многих случаях определить, какое слово имеется в виду, и предлагаем в ответ только документы с формами нужного слова. По запросу [фото африканских львов] пользователь получит в ответ документы со словами  «лев», «льва», «льву», но не получит документы, где встречаются лишь слова «Львова» или «Львову».

Как мы научили машину отличать, когда речь идет о животных, а когда — о городах? Алгоритм снятия омонимии основан на анализе данных запросов наших пользователей, учитывает частоту слов в Интернете и их сочетаемость, а также опирается на лексическую статистику слов из Национального корпуса русского языка — академического проекта, разрабатываемого при поддержке Яндекса. При анализе неоднозначного запроса мы выбираем наиболее частотную модель. Выбор в  пользу наиболее вероятной  конструкции помогает понять, что «день рыбака» — это не призыв, а праздник, а «платья придворных дам» — не обещание поделиться одеждой.»

Что ж… это все конечно замечательно… в теории, но факты говорят о другом: выдача в Яндексе стала настолько непонятной и мягко скажем неожиданной, что все оптимизаторские форумы буквально заполнились негодованием и матом!

Судите сами: набираешь, к примеру, «типовые сайты под ключ» — в топе все что угодно кроме веб студий (какие то дома и квартиры под ключ, монтаж аппаратуры, какие то внутренние странички на «народных» сайтах, не имеющих никакого отношения к сайтам… и т.п.! Вощем — бред! Что ж — будем посмотреть в ближайшие недели что и как будет дальше и в каком русле двигаться. Одно понятно — нужно тщательно работать с контентом и юзабилити, это всегда будет актуально, а в свете последних событий — возможно приобретет еще больший вес.  Что касается фокусов Яндекса — не впервой, пробьемся!

Запись опубликована автором в рубрике SEO.