Boris Baydenko

Рейтинг
35
Регистрация
13.03.2008

Уник, если будете откровенно (по 1000 со страницы) торговать ссылками - бан однозначно. Вы ведь о линкфермах слышали? знаете, что с ними делают?

массовый бан? Ну, кого поймают, того и забанят.

(пластиковые & окна) ~~ (пластиковые && окна)

Сергей, Вы ведь этот запрос приводили в примере на непустую выдачу? И у Вас 16 тыс. страниц в выдаче? Если да, то я разгадал в чём прикол - надо включить флажок "со словами из запроса" в настройках поиска (у меня он отключен). Писец какой-то, пошли такие извращения...из-за подсветки сниппетов убирать выдачу!

Абрашка:
не, ну можно по-другому запросы задавать

Так оператор && не ведёт себя корректно - я об этом говорил.

wolf:
Если под пассажами считать запросонезависимое разбиение на предложения, то с этим утверждением поспорил бы. Оператор & подозрительно часто меняет свою функцию. Вернее, на мой взгляд, просто игнорируется. Иначе в подобных примерах:
http://yandex.ru/yandsearch?text=%28%EF%EB%E0%F1%F2%E8%EA%EE%E2%FB%E5+%26+%EE%EA%ED%E0%29+%7E%7E+%28%EF%EB%E0%F1%F2%E8%EA%EE%E2%FB%E5+%26%26+%EE%EA%ED%E0%29&clid=14003
не было бы непустой выдачи.

У меня пустая.

wolf:
Похоже, пора опять возвращаться к неоконченному спору что есть пассаж, и как происходит деление текста на них - запросозависимо или независимо :)

Информация бралась отсюда: http://ivanov.in/separators/ (предложения - читать пассажи). Похоже, пора перепроверить...

nik_kent:

Пишите конечно прямо здесь. Зачем в личку? Палево?:)

Нет, не палево, просто опасаюсь мести некоторых агрессивных гуру (с их приписками "за тупость", " ", "афрооптимизаторчег" и т.п.) ..не хочу нарываться на срач в ответ и бан...

wolf:
Гы, а если в скобки заключить?
http://yandex.ru/yandsearch?text=(%D0%BD%D0%B5%D0%B2%D1%81%D0%BA%D0%B8%D0%B5+%D0%BE%D1%82%D0%B5%D0%BB%D0%B8)

Неисповедимы пути мысли твоей, Яндекс :)

Да, Сергей, согласен. Со скобками вообще я прозрел...

Ладно, пока поделюсь своими наблюдениями:

1)http://yandex.ru/yandsearch?text=%28%28%D0%BD%D0%B5%D0%B2%D1%81%D0%BA%D0%B8%D0%B5+%26+%D0%BE%D1%82%D0%B5%D0%BB%D0%B8%29+%7E%7E+%28%D0%BD%D0%B5%D0%B2%D1%81%D0%BA%D0%B8%D0%B5+%26+%D0%BE%D1%82%D0%B5%D0%BB%D0%B8%29%29+%7C+%D1%80%D0%B0%D0%BE%D0%B2%D0%B0%D0%BE

Тут всё логично - один запрос даст пустое множество (и в теории, и на практике), а по второму таки есть страница со словом на ней. Пример немного непонятен...

Проверил сегодня также и остальные примеры этого топика, кое-где выдача отличается от написанного автором. Просмотрев резулататы выдач, рискну сделать выводы:

2) Оператор & (в большинстве известных и наблюдаемых мной случаях) не поменял своей функции: слова как и прежде должны находиться в одном пассаже. Видимо, теперь как-то иначе делится на пассажи конструкция со знаками препинания в них и заглавными буквами - Яндекс мог добавить/убрать что-то в класс пассажей (у Иванова когда на эту тему проводились детальные исследования и результаты выкладывались на его сайт)

3) В целом, не поменял своей роли и оператор ~~ - он исключает из множества документов слева документы, которые удовлетворяют (считаются релевантными) комбинации справа. Этим и обьясняется то, что однословник он находит во всём документе (анкоры тоже!) и исключает все документы с этим однословником. Отсюда и пустая выдача в примере с невскими отелями при вычитании одного из слов запроса. Но по двусловникам переколдовка запроса "невские отели" (к примеру) существенно отличается от "невские && отели" (в смысле отбора документов, у которых слова могут принадлежать разным поисковым зонам), оттого и такая выдача по (невские отели) ~~(невские && отели)

4) По && нет чёткой уверенности в его прежней работе (слова где угодно в документе) из-за некоторых патологических случаев (они у wolf'a в личке). Есть подозрение, что тут замешан вес слова (ну, не похоже на косяк Яндекса, и всё тут!)

5) Кстати, есть ещё оператор ^. Он тоже на что-то влияет, но точной картины по нему нет.

Уффф...фсе. Жду пожеланий, примеров/контрпримеров, замечаний, критики.

З.Ы. Кому интересны аргументы моих наблюдений - пишите, могу показать.

А можно примеры в студию? Всё ведь оооочень от запроса зависит...

Miha Kuzmin (KMY):

Кто-нибудь может лучшую пару подобрать, чем это http://yandex.ru/yandsearch?&text=%D1%81%D0%B0%D0%B9%D1%82%20%D1%81%D0%B8%D0%BD%D1%85%D1%80%D0%BE%D1%84%D0%B0%D0%B7%D0%BE%D1%82%D1%80%D0%BE%D0%BD&msp=1 - а то тут все с вторым словом (

Я смогу. И сдаётся мне, здесь кворум стал ну уж слиишком мягкий... (В апреле, во всяком случае, такой переколдовки я не видел...)

Boris Baydenko добавил 16.09.2008 в 18:41

wolf:
А вот теперь самое интересное. Смотрим выдачу:
http://yandex.ru/yandsearch?text=(%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5+%D0%BE%D0%BA%D0%BD%D0%B0)+~~+(%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5+%26%26+%D0%BE%D0%BA%D0%BD%D0%B0)

По логике результатов быть не должно. Но они есть. Изучив внимательно, видим, что эти жалкие 16 тыщ страниц каким-то образом проскочили кворум только по одному из терминов, тем самым обойдя запрет, стоящий после ~~. Так вот, почему они прошли, а другие из вот этого списка:
http://yandex.ru/yandsearch?text=(%D0%BE%D0%BA%D0%BD%D0%B0+~~+%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5)+|+(%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5+~~+%D0%BE%D0%BA%D0%BD%D0%B0)
- нет? И это ведь не быстроботовские копии, у которых свой кворум. Получается, есть еще какая-то категория документов, у которых другой кворум?

Кстати, ни так:
http://yandex.ru/yandsearch?text=(%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5+%D0%BE%D0%BA%D0%BD%D0%B0)+~~+%D0%BE%D0%BA%D0%BD%D0%B0
, ни так:
http://yandex.ru/yandsearch?text=(%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5+%D0%BE%D0%BA%D0%BD%D0%B0)+~~+%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5
эти документы кворум не проходят... Здесь всё нормально. Чудеса какие-то...

wolf, ну, думаю, тут не чудеса какие-то, а маленькое обыкновенное чудо. Если интересно, пример-подсказку/(доказательство гипотезы) могу кинуть в личку.

wolf:
А вот теперь самое интересное. Смотрим выдачу:
http://yandex.ru/yandsearch?text=(%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5+%D0%BE%D0%BA%D0%BD%D0%B0)+~~+(%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5+%26%26+%D0%BE%D0%BA%D0%BD%D0%B0)

По логике результатов быть не должно. Но они есть. Изучив внимательно, видим, что эти жалкие 16 тыщ страниц каким-то образом проскочили кворум только по одному из терминов, тем самым обойдя запрет, стоящий после ~~. Так вот, почему они прошли, а другие из вот этого списка:
http://yandex.ru/yandsearch?text=(%D0%BE%D0%BA%D0%BD%D0%B0+~~+%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5)+|+(%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5+~~+%D0%BE%D0%BA%D0%BD%D0%B0)
- нет? И это ведь не быстроботовские копии, у которых свой кворум. Получается, есть еще какая-то категория документов, у которых другой кворум?

Кстати, ни так:
http://yandex.ru/yandsearch?text=(%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5+%D0%BE%D0%BA%D0%BD%D0%B0)+~~+%D0%BE%D0%BA%D0%BD%D0%B0
, ни так:
http://yandex.ru/yandsearch?text=(%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5+%D0%BE%D0%BA%D0%BD%D0%B0)+~~+%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5
эти документы кворум не проходят... Здесь всё нормально. Чудеса какие-то...

wolf, уже и в первом запросе напрочь отсутствует выдача (синтаксическая ошибка). Так что...

Да, по поводу пробитого кеша: та же фигня - различие в запросах пластиковые окна и ПлаСТиКоВЫе оКна было видно лишь накануне апдейта. Здесь Вы оказались правы.

Всего: 216