Тимон

Тимон
Рейтинг
74
Регистрация
08.06.2007

и что?

или быстроробот или оба слова есть...

Нашли какой-то конкретный сайт?

upyrj:
Не знаю, что вы там вчера видели, но сегодня там натурально быстроробот. 8/

Там одна страница была быстророботовская и одна страница обычная, но на 7 мб. Был без пометки "* часов назад" и я что-то не проверил даже ее на быстророботовость :)

Сейчас похоже все быстророботовское в выдаче по этому запросу.

Кстати прикольная темка:

(продажа продовольствие голод люди) ~~люди

страница www.evreimir.com/article.php?id=4862&res=1 вылезает за счет слова "человечки"

Переходы, однако

_S_:
Ну, скажем, сейчас там много чего накручено - например мягкость, расстояния, цитаты и тд. Кворум есть, но как уже было сказано выше - не для всех запросов.

А как думаешь (не против на "ты"?), схож ли текущий алго с тем, что был представлен на Ромипе'06? Там же тоже были бонусы за наличие всех слов, за точное вхождение вроде...

На счет расстояния - это обязательно должно быть - хотя и не так, как раньше...

П.с. На счет кворума - уж не знаю, сколько таких запросов, где учитывается кворум, в общей массе, но я их не встречал. Тем более при поиске на отдельно взятой странице.

Даже если они есть, то скорее всего, это проделки колдунщика, а не алгоритмический учет.

Тимон добавил 05.02.2009 в 01:55

Dryoma:
как раз расстояния уже не важны (т. е. сайты с большими расстояниями между словами из запроса не выпадают. Как большие расстояния отражаются на релевантности --- не знаю, но скорее всего плохо)

Про расстояния еще Трофименко говорил - нет их уже, && рулит

Все, завтра еще напишу что-нть, а то поздно как-то...

Dryoma:
а что такое быстророботовская выдача?

По поводу кворума --- он есть, но срабатывает очень редко, в особенности на "естественных" запросах.

Чуть выше отписался.

Я имел в виду, что в выдачу попадают сайты с пометкой типа "17 часов назад"

Раньше кворум работал абсолютно четко и при запросе из 7-8 слов документ попадал в выдачу, если в тексте содержал хотя бы 6 слов. Это если грубо. А вообще формула ромипа 2004 (с исправленной правой частью) работала четко

Тимон добавил 04.02.2009 в 17:29

Dryoma:
вбейте

(левкипп демокрит анаксимен сайт)~~сайт

2 страницы найдено, значит "сайт" выпадает

Поясните, плиз, вашу логику...

что значит данный запрос?

первая часть - найди 4 слова на сайтах

вторая часть - исключи сайты, содержащие слово "сайт".

значит в первом случае он среди всех сайтов нашел 2 сайта, на которых не было слово "сайт"? Т.е. каким-то образом эти два сайта вылезли только за счет трех слов... Хм...

_S_:
С чего это вдруг? Это на чем такой вывод основывается?

пробовал различные запросы при поиске по сайту, например,

(большинства людей добиваемся Возможно продвижение раскрутка seo система детали)<<url="www.bdbd.ru"

когда все слова есть в тексте - все ок, когда нет одного слова - страница не найдена

(большинства людей добиваемся Возможно продвижение раскрутка seo система детали лыжи)<<url="www.bdbd.ru"

был бы кворум - прошел бы в легкую

ставил эксперименты на многих сайтах

Можно попробовать что-то типа

большинства людей добиваемся Возможно продвижение раскрутка seo система детали который тапир

Вылезают странички быстроробота, на которых не все слова из запроса.

Правда, вылезают и непонятные страницы, типа webmassmedia.ru/root присутствие которых в выдаче я не могу объяснить.

Тимон добавил 04.02.2009 в 17:10

Дрозофила:
Тимон, А в чем вопрос то?
По-моему выдача при первом и втором запросе вполне адекватная, и объяснимая

Ну если предположить, что

а) :: работает

б) в текстовой релевантности учитываются веса слов (IDF)

то тогда все логично

Тимон добавил 04.02.2009 в 17:11

gparkov:
Я думаю ответы на эти вопросы можно будет на конференции, которая будет в марте.

Задайте за меня этот вопрос, плиз

Я вряд ли попаду туда :(

SMooVE:
Недавно у многих сайтах с пр3 обнулили.... На каждом сео форуме об этом говорят. Самое интересное, что не на всех таких сайтах были продажные ссылки.

Это баг или целенаправленные действия Google?

Обнулился PR на всех страницах блога :( Проверил по нескольким датацентрам.

Ну да, баловался продажей ссылок, но со всего блога (около 150 страниц) было продано около 60-ти ссылок, при этом естественных исходящих ссылок раз в несколько больше.

Падения посещаемости с Google не заметил.

Тимон добавил 03.02.2009 в 10:08

Да, забыл добавить, что ссылок с Sape куплено всего штук 10, уже давно.

99% ссылок - естественной происхождение

Вот за такие блоки, как здесь - http://www.nicefilm.ru/faq. банит на "раз, два"

установка эфирной антенны | Holms Badehotel, Restaurant, Middelfart, Denmark | выкуп иномарок | порно знаменитостей | салон каминов | екатеринбург кафе

лучше уберите все, после "отбанивания" начнете заново продавать в меньших объемах

Так, что-то не сростается...

у wiki больше тошнота, но она во втором примере вылезает вверх.

А вы пишете, что во "втором случае, ... страница с меньшей тошнотой (...) становится более релевантна"

Константинович:
Не катит. Это лучше.

Представьте пользователя статистического, который в запрос вбивает такие символы. Секретарь-блонди фигачет, ага.

10 сосисок и 1 sausage

Я пример к тому привел, что Яндекс учитывает не только транслит в урле и не только сам ключ, но еще и перевод!

Всего: 265