Ну вот вам спецификация RSS 2.0:
http://blogs.law.harvard.edu/tech/rss
Новости-то как на сайте появляются? Ручками верстаются или где в базе лежат? Если в базе, то надо их просто вывести не в HTML, а в XML по вышеупомянутой спецификации..
Miha Kuzmin, а, ну да... Индексят :) Поленился проверить :)
Проверьте свой robots.txt
"В целях совместимости с роботами, которые не полностью следуют стандарту при обработке robots.txt, директиву Host необходимо добавлять в группе, начинающейся с записи User-Agent, непосредственно после записей Disallow."
(c) http://www.yandex.ru/info/webmaster2.html#virtual
А Яндекс его знает :) У меня жрет всякую ненужную хрень в изрядных количествах (2206, 847 и 865 страниц в последние три захода). Нужная страница пока со старым тайтлом в серпе Я :( По логам он ее и не спрашивал :(
legat, да, через каталог. идете в нужный раздел - там будет ссылка "Добавить сайт"
По опыту. Один и тот же сайт в зонах .ru и .com нормально проиндексирован Я. В зонах .biz и .info Яндекс о сайте не знает вообще ("находятся на сайте" возвращает 0 страниц). Хотя при попытке добавления ссылки на эти домены он вспоминает (и определяет) эти домены как зеркало сайта в зоне .ru. Еще инфа вот тут: http://www.yandex.ru/info/webmaster.html#how_to_add
Отсебятина: индексатор Я был в 28.10, 1.11 и вчера. Прибавилось внешних ссылок в Я и Гугле. тИЦ на месте. PR на месте. Позиции тоже.
PS. Так, констатация факта. Можно не обращать внимания.
ИМХО: Российским поисковикам интересен контент только на русском языке. Гуглу интересен и многоязычный контент. Разделять (тут точка) и продвигать отдельно. Бонусов не заметил - мухи - отдельно, котлеты - отдельно.
PS. Многоязычный ресурс (ru, de, en) с 1994 года.
PPS. Контент - он рулез. Независимо от языка.
Могу подсказать по пункту 3.
Яндекс ставит дату документа, если сервер ему вернул HTTP заголовок Last-modified. В случае динамического контента сервера обычно этот заголовок не выдают и оставляют его на совести разработчика, ибо дата последнего измения php, asp, perl скрипта (а сервер знает именно эту дату), не совпадает с датой изменения данных, которые этот скрипт выводит. Т.е. скрипт, написанный год назад, выводит сегодняшние новости. В этом случае разработчик сам обязан позаботиться и выдать соответствующий last-modified.
Рамблер же, похоже, ставит дату индексации документа, что к дате изменения никакого отношения не имеет.
Так это скорее проблема разработчика, а не Яндекса. Хотя можно и не париться - на переиндексацию документа влияют скорее актуальные изменения этого самого документа, нежели отсутствие last-modified.
Нет тэг, но аттрибут title рекомендован к использованию в ссылках вот этим документом:
http://www.w3.org/TR/WCAG10/wai-pageauth.html#tech-meaningful-links