cymax

cymax
Рейтинг
16
Регистрация
28.08.2007

MiRaj, спасибо за подтверждение.

Кроме того, до сего дня не было слов с весом >20000000, если не брать потолок 800378936. Сейчас появились вот такие слова adidas::91352020, ну и многие редкие с весом 800378936 переехали вниз.

Было mercedes::800378936

Стало mercedes::43780370

fima32, то, о чем я говорю, не для всех загадка ;) http://download.yandex.ru/company/03_yandex.pdf

Факты. Если у вас есть известные вам веса слов, то сделайте 2 запроса и сравните выдачу

http://www.yandex.ru/yandsearch?text=%D0%BD%D0%B0%D1%81%D0%BB%D0%B5%D0%B4%D1%81%D1%82%D0%B2%D0%BE

http://www.yandex.ru/yandsearch?&p=0&text=%D0%BD%D0%B0%D1%81%D0%BB%D0%B5%D0%B4%D1%81%D1%82%D0%B2%D0%BE%3A%3A140085

Уже не сопадает.

lukst, попробуйте здесь. Бывает, в одном месте капчу вам повесили, а в другом чисто.

rypy, возьмем один из ваших запросов

!+we::6447 & you::0 & !%about::8293 & he::11544 & us::7379 & will::0 & all::0 & me::7228

А вот так это выглядит в реальной жизни

!+we::5064 & you::0 & about::0 & he::13393 &&/(-3 3) us::2791 &/(-1 3) will:0 &/(-1 3) all::0 &/(-1 3) me::988

Вроде бы и веса тут недалеко разбежались, но стоп-слова уже разошлись, да и расстояния не те. Примеры у вас слишком искусственные, в реальной жизни может быть сильно хуже. Например, по весам: mercedes::40458 там и mercedes::800378936 здесь. Размер корпусов отличается в несколько раз, качественный состав тоже (как вам мерседес?), про остальное я уже не говорю.

Мне кажется, пока ваш путь малоперспективный. Впрочем, готовь сани летом? ;)

Ну, и замечательно. Я тоже желаю вам ТИЦ ^^^ :)

Могу только добавить, что до отмены anchor имелся сервиc, который грубо считал стоимость продвижения а ля Язл. Когда по ТИЦ бэка случалась такая штука, то брался бар, и такая оценка обычно была точнее. Но это история, сейчас все по-другому работает.

В баре он по-прежнему 750

http://bar-navig.yandex.ru/u?ver=2&show=1&url=http://www.lviv.ua

Такие "ножницы" и раньше нередко случались.

У меня тоже только что сайт вернулся. Только я не писал ни XTR, ни Платону ;)

Интересно, что робот не приходил на сайт с 19.11, после выпадения даже каталожный дятел перестал приходить. А сегодня в 7:46 робот появился и прошелся по полной программе :)

Некорректно проверять стоп-слова запросом "стоп-слово". Одно и тоже слово может быть стоповым или нет в зависимости от запроса, все определяет колдунщик. Вот два примера с предлогом "на":

стоп-слово и проверка - выдача одинаковая

обычное слово и проверка - выдача разная

Подсветке болдом не всегда можно доверять, лучше смотреть на совпадение выдачи 2-х запросов, а в сомнительных случаях пробивать кэш. Примеры с пробивкой кэша

стоп-слово и проверка

У Лебедева хороший список, кроме алтухова ;) В приложении см. список стоп-слов (потенциальных, ведь все зависит от запроса) для Яндекса в моей версии. Леммы сохранены, т.к. бывают интересные исключения. Например, "самому" Я трактует как форму слова "сам" и может сделать стоп-словом. А "самой" не бывает стоп-словом - в трактовке Яндекса это форма слова "самый".

Скорее всего, список неполный. Если кто-то найдет ошибки или новые слова, то просьба не таить в секрете :)

txt stops.txt

ЦОП - центр обслуживания партнеров рекламной сети Яндекса (РСЯ). Подробнее о ЦОП

http://help.yandex.ru/partner/

Theorist, топик не совсем про это. Можно создать отдельный.

Запросы я взял от фонаря, на выдачу даже и не смотрел - только по вашим ссылкам увидел статистику :) Пример был в том, что самому бывает стоп-словом в запросах, а самой - нет. А веса у них отличаются, несмотря на ~одинаковое кол-во слов по корпусу. Здесь играет роль кол-во документов, и тут разница существенная. Поэтому веса самой::623, а самому::35370.

Всего: 123