Вопросы к Яндексу:
1. Когда включите поддержку .doc, .xls и т.п. общеизвестных форматов?
2. Не противоречит ли политике компании и будет ли когда-нибудь поисковик индексировать Видео и Аудиоинформаци - например уже сейчас с достаточно небольшими трудозатратами можно было бы начать индексирование mp3 и подобных форматов(благо метаинформации в них зачастую достаточно и она четко структурирована)?
3. Насколько сложно подключить к поисковику новый формат и вообще планируете ли развиваться в этом направлении - постепенное подключение новых форматов, для обеспечения действительно универсального поиска по ресурсам Рунета?
http://www.computerra.ru/news/2003/2/26/37857/
Из переписки с Владиславом Шабановым:
> SV>Мы выкидываем не динамику, а URL, содержащие некоторые
> строки (например,
> SV> /cgi-bin/) Поэтому если робот за страницей сходил, значит в ней
> SV> "запрещенных"
> SV> подстрок нет (на этот момент).
Да кстати - из статьи узнал, что существует сокращенная версия, аналог ya.ru - правда адресс посложнее: http://www.turtilla.ru/
Уже есть статья в Компьютерре: http://www.compulenta.ru/2002/6/27/31511/
Много хвалят(попали на презентацию?), немного критикуют -критика по большей части к нерелевантности результатов поиска - мнение обозревателя совпадает с мнением форума: (читает форум на https://searchengines.guru/?)
Резюме: вполне объективно(;
Это интересно... возможно Turtle использовал страницы выдачи резльтатов запросов поисковиков (или только апорта) для первоначального заполнения своей базы для индексации. (;
Как это ни странно с рамблером, апортом и яндексом таких проблем не возникало - наоборот могли бы сканировать почаще. Теоретически с Turtle проблема решена - Дмитрий сказал, что внес изменения в алгоритм. Седни вечером снимем фильтр - посмотрим.(;
Что это такое: M - подсветчик?
"Mozilla/4.0 (compatible; MSIE 5.0; YANDEX)"
Личный IE работников Яндекса?(-:
~3000 запросов за 5 мин.!!! DoS атака на лицо! Я конечно понимаю что это дело хорошее так быстро индексировать, но зачем валить сервак-то?