to Gray - мне кажется, вам явно не хватает FAQ-а.
Попробуйте direct.yandex.ru - надежно и ненамного дороже
Илья
Сильно сомневаюсь, что в мире у кого бы то ни было есть лишние 25 миллионов долларов на поиск. (8 тысяч компьютеров * 3 тысячи долларов).
База безусловно - одна. Проекции могут быть разные - это верно.
Добрый день, Влад и все!
Совершенно верно, при ранжировании веб-страниц ИЦ совершенно _не_ используется. Используется "взвешенный индекс цитирования",
или, говоря на языке Ларри Пейджа, - "PageRank".
Это,действительно, итеративно (10-100 итераций) вычисляемая вероятность попадания пользователя на страницу X в очень простой модели веб-серфинга.
ИЦ (рудиментарный) остался пока только в сортировке ресурсов каталога. Возможно, скоро он и оттуда исчезнет. Причина, по которой он там живет, - проста. ИЦ - это идея, интуитивно очень понятная, и за два года эксплуатации дошла до многих журналистов, ПиАрщиков и просто веб-мастеров. Менять его на загадочный "взвешенный ИЦ" - значит огрести массу ПиАр проблем.
Об алгоритме вычисления ИЦ писано очень много. Скажу только, что расхождения между числом ссылок и ИЦ может объясняться следующими причинами:
- мы считаем в ИЦ не страницы и не сайты а отдельные ресурсы каталога
- если у ресурса есть зеркало (-а), то его ИЦ может сильно отличаться в обе стороны.
Мы ИЦ _никак_ не накрычиваем, не подкручиваем и вообще все делает программа.
Непотистский спам при обнаружении карается также как и контентный - жестоко и навсегда.
О накрутке ИЦ, взвешенного ИЦ и т.д. Спасибо ewspam-у за подробное описание механизма. Пишите еще, будем Вам очень благодарны.
С уважением,
Я понял - это зондаж
Где-то мы это уже писали и наверное не раз:
Все антиспамовые меры на Яндексе работали и работают следующим образом: автоматически определенный "спам" считается спамом "гипотетическим" и, следовательно, автоматом за него никого из индекса не исключают, разве что "мягко понижают".
Но: если мы на 100% уверены в спаме (например: глазами посмотрели и убедились) - мы резервируем за собой право не только исключать данную страницу/сайт, но даже и все страницы данного "автора". (посмотрите точную формулировку в нашем дисклеймере). Мы уже не раз данным правом пользовались и будем пользоваться.
Тот же принцип относится и к непотистскому спаму (линконакрутке). Можете проэкстраполировать его, если хотите.
На 30 клоунов 45 детей и один теплоход.
Получил награду как лучший двуязычный попугай. (best bilingual parrot)
В Яндексе есть и ошибки и глюки. Есть, в том числе, и труноустранимые. Одна из таких ошибок, в частности, возникает в ситуациях, когда в вебе не представлено то, что найдено в других поисковых источниках. (в новостях, магазинах и т.п.)
Надеемся, что ошибок не очень много. Мы работаем над их устранением.
Вот и отпуск кончился - всем привет.
Совершенно необязательно это был робот.
Кроме робота есть еще и подсветчик.
user-agent у него тоже Yandex но с буквочкой m (от слова markup).
Вот более подробноая расшифровка:
i - индексатор
d - addurl
m - подсветка найденных слов
Есть еще звонилка каталога (буквочку не знаю), сливалка зеркал (там кажется "h") и еще кое-что, вся и не вспомнишь.
У нас в форуме мы отвечали побробней, с год или два тому назад, кажется. Возможно что-то про буквочки есть и в help-е.
А что такое "запрет"? В смысле, в суд не подают ? Не подают конечно, но зато выбрасывают из индекса "навсегда".
Вот поискал:
cloaking site:www.google.com
Получил:
http://www.google.com/help/faq.html
To preserve the accuracy and quality of our search results, Google may permanently ban from our index any sites or authors who engage in cloaking to distort their search rankings