Mark Adamenko

Рейтинг
16
Регистрация
02.07.2001
Должность
Менеджер по маркетингу Интернет проектов
Интересы
парашютный спорт, пиво, девушки, музыка и вообще активный отдых от компов

Вопросы к Яндексу:

1. Когда включите поддержку .doc, .xls и т.п. общеизвестных форматов?

2. Не противоречит ли политике компании и будет ли когда-нибудь поисковик индексировать Видео и Аудиоинформаци - например уже сейчас с достаточно небольшими трудозатратами можно было бы начать индексирование mp3 и подобных форматов(благо метаинформации в них зачастую достаточно и она четко структурирована)?

3. Насколько сложно подключить к поисковику новый формат и вообще планируете ли развиваться в этом направлении - постепенное подключение новых форматов, для обеспечения действительно универсального поиска по ресурсам Рунета?

Как писал Professor
это тот же самый расширенный поиск, просто интерфейс простой к оному сделали ... кстати, расширенный поиск не полностью работает нормально - не работает поиск проиндексированных страниц внутри определенного раздела : сделал поиск по www domen ru/dir/dir2 - он находит www domen ru/dir3/ ... но вот заметил интересную особенность - рамблер проиндексировал страницы html?параметры и не проиндексировал cgi-bin/script.pl?параметры

Из переписки с Владиславом Шабановым:

> SV>Мы выкидываем не динамику, а URL, содержащие некоторые

> строки (например,

> SV> /cgi-bin/) Поэтому если робот за страницей сходил, значит в ней

> SV> "запрещенных"

> SV> подстрок нет (на этот момент).

Да кстати - из статьи узнал, что существует сокращенная версия, аналог ya.ru - правда адресс посложнее: http://www.turtilla.ru/

Уже есть статья в Компьютерре: http://www.compulenta.ru/2002/6/27/31511/

Много хвалят(попали на презентацию?), немного критикуют -критика по большей части к нерелевантности результатов поиска - мнение обозревателя совпадает с мнением форума: (читает форум на https://searchengines.guru/?)

Резюме: вполне объективно(;

Как писал misha
То есть turtle заиндексировал около миллиона страниц результатов поиска апорта
При таком подходе к индексации динамики можно и гугл запросто обогнать по размеру базы

Это интересно... возможно Turtle использовал страницы выдачи резльтатов запросов поисковиков (или только апорта) для первоначального заполнения своей базы для индексации. (;

Как это ни странно с рамблером, апортом и яндексом таких проблем не возникало - наоборот могли бы сканировать почаще. Теоретически с Turtle проблема решена - Дмитрий сказал, что внес изменения в алгоритм. Седни вечером снимем фильтр - посмотрим.(;

Что это такое: M - подсветчик?

"Mozilla/4.0 (compatible; MSIE 5.0; YANDEX)"

Личный IE работников Яндекса?(-:

~3000 запросов за 5 мин.!!! DoS атака на лицо! Я конечно понимаю что это дело хорошее так быстро индексировать, но зачем валить сервак-то?

123 4
Всего: 32