Обьясняю свою гипотезу.
Если в запросе > одного слова
Каждое слово в запросе имеет свой вес. Именно в запросе. Этот вес зависит от места этого запроса модификатора +. И сомое важное для НАС "ПОПСОВОСТИ" ЭТОГО СЛОВА. ПОПСОВОСТЬ считатаеться по к-ву запросов и/или частоте присутствия слова в документах ВСЕГО РУНЕТА. ЧЕМ больше ПОПСОВОСТЬ слова тем меньше его вес.
ЧЕМ слово редче тем пользователь его больше хочет встретить в искомом документе.
Например, пользователь вводит "раскрутка циклофазитрон".
Он СОВСЕМ НЕ хочет найти главную страницу веб студии со словами "была произведена расрутка сайта ООО "циклофазитрон"". Если бы все слова имели один вес, то по запросу эта страница была бы на первом месте из-за того, морды поставлены со словом "раскрутка".
Чтобы избежать такого рода фигни каждое слово в запросе имеет свой вес и причем с ростом ПОПСОВОСТИ слова он уменьшаеться.
ПУСТЬ это функция F(1/ПОПСОВОСТЬ_СЛОВА, 1/Ni, ISi_+)
N - номер слова в запросе
IS_+ - стоит ли + перед словом.
Попсовость вычислияться исходя из числа документов в Интернете и/или числа запросов.
Как просисходит поиск и ранжирование:
1. Выбираються документы содержащие все слова запроса
2. Находиться вес по кадого сайта по каждому слову запроса
3. Перемножаеться вес по каждому слову на F(1/ПОПСОВОСТЬ_СЛОВА, 1/Ni, ISi_+)
3а. Учитываеться растояние между словами на станице в анкорах (может кстати из-за этого, но мы этим будем пренебрегать)
4. Сайты сортируються
Если накидаете мне примеров в личку сильного сдвига серпа - может что то скажу об изменениях.
Если хотите могу свою прогу скинуть она под гуглу. Токо яша банит за такое. И гугл тоже.
Может скажу глупость но может изменились не алгоритмы метрик сайтов по словам, а алгоритм сложения этих метрик.
Например запрос "слово1 слово2 ... словоN"
Для каждого слова считают метрики на каждый сайт M[J]("словоI", сайтJ) Так вот эти метрики не поменялись. Поменялся их алгоритм сложения. Релеватность сайта J = F(частота слова в рунете ("слово1"))*M[1][J]+...+F(частота слова в рунете ("слово1"))*M[N][J]. Т.е. поменялась функция F() зависимость коефициента от частоты слова во всем индексе.
Конечно можно. Если какие то вопросы аська моя 316030352
Разместили через час после того как по аське списался. Остался доволен.
"и не выйдет на ссылаемую страницу" что вы подрузумеваете под этим.
ССылка будет учтена и вес передаст.
/ru/forum/94602
P.S. не фига себе новичок :)
Вы атеист вы не верите в существование склейки и не можите это доказать.
Я верующий и верю в существование склеек и тоже не могу это доказать.
:)
Я хочу сказать что это пустой спор. Все равно мы останемся при своих мнениях.
Просто создайте каталог. Добавьте все сайты в вашем порядке. И поиск по описанием сайтов. Но я не понял зачем вся эта радость?
На J2EE могу сделать полнотекстовый поисковик по всем страницам с роботом. С удалением дублей. С кешем. Только он не будет учитавать словоформы.
Хорошо буду цитировать вас.:) Проверьте серп по запросам - подписям разработчиков сайтов. Если не было склейки то студии бы упорядочились по убыванию крутости*к-во заказчиков.