и что?
или быстроробот или оба слова есть...
Нашли какой-то конкретный сайт?
Там одна страница была быстророботовская и одна страница обычная, но на 7 мб. Был без пометки "* часов назад" и я что-то не проверил даже ее на быстророботовость :)
Сейчас похоже все быстророботовское в выдаче по этому запросу.
Кстати прикольная темка:
(продажа продовольствие голод люди) ~~люди
страница www.evreimir.com/article.php?id=4862&res=1 вылезает за счет слова "человечки"
Переходы, однако
А как думаешь (не против на "ты"?), схож ли текущий алго с тем, что был представлен на Ромипе'06? Там же тоже были бонусы за наличие всех слов, за точное вхождение вроде...
На счет расстояния - это обязательно должно быть - хотя и не так, как раньше...
П.с. На счет кворума - уж не знаю, сколько таких запросов, где учитывается кворум, в общей массе, но я их не встречал. Тем более при поиске на отдельно взятой странице.
Даже если они есть, то скорее всего, это проделки колдунщика, а не алгоритмический учет.
Тимон добавил 05.02.2009 в 01:55
Про расстояния еще Трофименко говорил - нет их уже, && рулит
Все, завтра еще напишу что-нть, а то поздно как-то...
Чуть выше отписался.
Я имел в виду, что в выдачу попадают сайты с пометкой типа "17 часов назад"
Раньше кворум работал абсолютно четко и при запросе из 7-8 слов документ попадал в выдачу, если в тексте содержал хотя бы 6 слов. Это если грубо. А вообще формула ромипа 2004 (с исправленной правой частью) работала четко
Тимон добавил 04.02.2009 в 17:29
Поясните, плиз, вашу логику...
что значит данный запрос?
первая часть - найди 4 слова на сайтах
вторая часть - исключи сайты, содержащие слово "сайт".
значит в первом случае он среди всех сайтов нашел 2 сайта, на которых не было слово "сайт"? Т.е. каким-то образом эти два сайта вылезли только за счет трех слов... Хм...
пробовал различные запросы при поиске по сайту, например,
(большинства людей добиваемся Возможно продвижение раскрутка seo система детали)<<url="www.bdbd.ru"
когда все слова есть в тексте - все ок, когда нет одного слова - страница не найдена
(большинства людей добиваемся Возможно продвижение раскрутка seo система детали лыжи)<<url="www.bdbd.ru"
был бы кворум - прошел бы в легкую
ставил эксперименты на многих сайтах
Можно попробовать что-то типа
большинства людей добиваемся Возможно продвижение раскрутка seo система детали который тапир
Вылезают странички быстроробота, на которых не все слова из запроса.
Правда, вылезают и непонятные страницы, типа webmassmedia.ru/root присутствие которых в выдаче я не могу объяснить.
Тимон добавил 04.02.2009 в 17:10
Ну если предположить, что
а) :: работает
б) в текстовой релевантности учитываются веса слов (IDF)
то тогда все логично
Тимон добавил 04.02.2009 в 17:11
Задайте за меня этот вопрос, плиз
Я вряд ли попаду туда :(
Это баг или целенаправленные действия Google?
Обнулился PR на всех страницах блога :( Проверил по нескольким датацентрам.
Ну да, баловался продажей ссылок, но со всего блога (около 150 страниц) было продано около 60-ти ссылок, при этом естественных исходящих ссылок раз в несколько больше.
Падения посещаемости с Google не заметил.
Тимон добавил 03.02.2009 в 10:08
Да, забыл добавить, что ссылок с Sape куплено всего штук 10, уже давно.
99% ссылок - естественной происхождение
Вот за такие блоки, как здесь - http://www.nicefilm.ru/faq. банит на "раз, два"
лучше уберите все, после "отбанивания" начнете заново продавать в меньших объемах
Так, что-то не сростается...
у wiki больше тошнота, но она во втором примере вылезает вверх.
А вы пишете, что во "втором случае, ... страница с меньшей тошнотой (...) становится более релевантна"
Я пример к тому привел, что Яндекс учитывает не только транслит в урле и не только сам ключ, но еще и перевод!