Почему в заблуждение? Если бы Яндекс ранжировал страницы в соответствии с весом, на первом месте была бы главная. Не так ли?
Насколько я помню, Яндекс каждый запрос перед выполнением операции поиска преобразует в некоторую спец. форму, по которой и ведется поиск.
Раньше ее даже посмотреть можно было ("колдунщиком" называли вроде как), пока Яндекс не прикрыл это.
Одним из параметров там было оптимальное расстояние между словами.
Возможно в случае с "-" изменяется именно эта промежуточная форма. Расстояние между словами вполне логично было бы менять для запросов с "-" и без.
Из этой логики получается, что как дополнительное слово "-" он не учитывается, но в базу запросы идут разные, и выдача отличается для них.
Что скажете? Теория имеет право на жизнь?
Не стоит смотреть. Имхо. Яндекс выдает страницы не в соответствии с весом.
Можно немного поэкспериментировать, чтобы убедиться. Например, поиск по ru.wikipedia.org
Согласен, с "оле" пример не удачный, но "лукойе" без него не употребляется: "лукойе"
А т.к. слово "лукойе" более редкое (=весомое), то более релевантными Яндекс считает документы с двумя этими словами.
При чем тут домены, если вы о запросах говорите?
Яндекс считает дефис разделителем. А конкретно в этом случае - вбейте просто "лукойе" и просто "оле", эти слова поодиночке почти не употребляются.
Имеет. К тому же желательно одинаковые контактные данные на сателлитах не указывать.
Тут собственно хозяин-барин. Главное чтобы был каталог и обучающая выборка достаточного объема. Можно и по Dmoz рубрикатор сделать.
Все просто :)
1. Пишите парсилку сайтов yaca, собираете тематики и сниппеты/главные сайтов в них.
2. Обучаете ваш рубрикатор. Например, определяете вероятность встреч тех или иных слов в тематике. Это проще всего. Попутно детали (типа необходимости учета стоп-слов) увидите сами.
3. Делаете функцию определения вероятности тематики для произвольного текста.
4. Тестите и дорабатываете вашу методику пока не будет вас устраивать.
И мне пожалуйста hannibalmail###gmail$$$com
Те же самые, что и раньше. Региональность вряд сделали метрической величиной. Сайт либо относится к региону, либо нет. В зависимости от этого фиксированный поправочный коэффициент.
Возможно разный для регионов, т.к. количество сайтов в Москве и урюпинске разное.