Hannibal

Hannibal
Рейтинг
3
Регистрация
17.01.2010
PRT84:
вот ты грамотно ввел в заблуждение молодец

Почему в заблуждение? Если бы Яндекс ранжировал страницы в соответствии с весом, на первом месте была бы главная. Не так ли?

Насколько я помню, Яндекс каждый запрос перед выполнением операции поиска преобразует в некоторую спец. форму, по которой и ведется поиск.

Раньше ее даже посмотреть можно было ("колдунщиком" называли вроде как), пока Яндекс не прикрыл это.

Одним из параметров там было оптимальное расстояние между словами.

Возможно в случае с "-" изменяется именно эта промежуточная форма. Расстояние между словами вполне логично было бы менять для запросов с "-" и без.

Из этой логики получается, что как дополнительное слово "-" он не учитывается, но в базу запросы идут разные, и выдача отличается для них.

Что скажете? Теория имеет право на жизнь?

Не стоит смотреть. Имхо. Яндекс выдает страницы не в соответствии с весом.

Можно немного поэкспериментировать, чтобы убедиться. Например, поиск по ru.wikipedia.org

umklaidet:
Вы сами то вбивали отдельно "оле"? Посмотрите что получится. С "оле-лукойе" возможно не самый лучший пример, но разница видна все равно.

Согласен, с "оле" пример не удачный, но "лукойе" без него не употребляется: "лукойе"

А т.к. слово "лукойе" более редкое (=весомое), то более релевантными Яндекс считает документы с двумя этими словами.

umklaidet:
Это все смешно, конечно, однако у Яндекса действительно странное отношение к доменам с дефисом. Вот например вбейте в Яшу "оле-лукойе" и "com-news.ru" в кавычках. "оле-лукойе" везде вместе, а "com-news.ru" то com отдельно, то news. Почему?

При чем тут домены, если вы о запросах говорите?

Яндекс считает дефис разделителем. А конкретно в этом случае - вбейте просто "лукойе" и просто "оле", эти слова поодиночке почти не употребляются.

shurg:
Имеет ли смысл в таком случае разносить их на хостинге по разным серверам(по письму это возможно).

Имеет. К тому же желательно одинаковые контактные данные на сателлитах не указывать.

Тут собственно хозяин-барин. Главное чтобы был каталог и обучающая выборка достаточного объема. Можно и по Dmoz рубрикатор сделать.

Все просто :)

1. Пишите парсилку сайтов yaca, собираете тематики и сниппеты/главные сайтов в них.

2. Обучаете ваш рубрикатор. Например, определяете вероятность встреч тех или иных слов в тематике. Это проще всего. Попутно детали (типа необходимости учета стоп-слов) увидите сами.

3. Делаете функцию определения вероятности тематики для произвольного текста.

4. Тестите и дорабатываете вашу методику пока не будет вас устраивать.

И мне пожалуйста hannibalmail###gmail$$$com

Те же самые, что и раньше. Региональность вряд сделали метрической величиной. Сайт либо относится к региону, либо нет. В зависимости от этого фиксированный поправочный коэффициент.

Возможно разный для регионов, т.к. количество сайтов в Москве и урюпинске разное.

Всего: 49