T.R.O.N

T.R.O.N
Рейтинг
314
Регистрация
18.05.2004
В Яндекс-новостях они есть?

Некоторые думаю есть. Думаю его вариант получения новостей, и мой - схожи. Поэтому могут пересекаться.

Кстати, адреса не покажете? Особенно того, которого каждые 6 часов? Хочется проверить пару идей.

Ну согласитесь, какой смысл давать свои сайты для эксперементов?

Superstar, возможно вы правы. Просто у меня нет данных, подтверждающих вашу версию. А на счет свое, могу сказать следующее:

5 сайтов. На них идет обновление новостей. Естественно никакой Явы. Интервал обновления 20-40 минут. (новости на разных сайтах уникальны). Объемы большие.

Так вот: один сайт, самый продвигаемы, посещается каждые 6-8 часов, остальные, в зависимости от известности, от суток, до 3 дней.

Nik33,

Мое глубокое мнение, что следует соблюдать стандарты там где это возможно.

Вы упорно повторяете варианты этой фразы. Сама фраза конечно верна, но объясните: ЗАЧЕМ?

Или действует принцып мушкетеров: "Я дерусь, потому что я дерусь"

Loky, Частота появления бота, имхо, больше зависит от приросат/изменения внешних ссылок

IBY, 100% верно

sergey24,

Есть алгоритм. Реализация Perl for Win32.

Судя по тому, как он себя ведет, действительно 1.0. Хотя зачем-то обязательно требует наличие переметров расшмренного 1.1

Eugeny Holin, Ничего явно плохого нет. Заголовок ответа сервера разный, для разных агентов. Может чего с хостом?

sergey24, понял, хотя и с трудом.

Начнем с начала.

Страница в виде текста или html?

Вам нужно это делать локально или с удаленного сервера?

Нужно ли использовать веса для разных тегов, или нужна просто частота слов?

Eugeny Holin, ка определили, что роботов нет?

Кинь в личку сайт. Интересно.

Всего: 4849