metton,
там все просто
http://bar-navig.yandex.ru/u?ver=2%E2%8C%A9=1049&url=http://-URL-&target=_No__Name:5&show=1&thc=0
указываеш только урл
возвращается бональный текст
запросите результат с нескольких сайтом, поймете что к чему
Если Запрашивать программно, стоит указать в качестве User-Agentr строку, как у настоящего эксплорера.
При первом подключении примите кук, если он есть и потом его передавайте назад.
Если делать все граматно, то бана боятся не стоит. Не стоит делать более 1-2 запросов в минуту.
killraty, Если верить статистике, то дай бог чтобы Вы 100 набрали в сутки. Вы задайтесь вопросом, кому и главное, ЗАЧЕМ нужен такой рессурс. Не сайт, а хлам. Имхо конечно =))
А насчет, чего не хватает - сущей малости. Нехватает того, что может быть интересно большой аудитории жителей сети.
Axeomica, Вы когданубудь слышали о санкциях за антирекламу!!! Вы прошли по граблям. Искренне сочуствую. А кто по ним не ходил? Ведь если подумаете хорошо, то поймет, что Вы хорошо понимала, что кидают.
А еще, рекомендую, внимательно почитайте правила форума.
_Nic_, Знаеш, просто по опыту, лучше все исправить как положено. Могу сказать из опыта, когда софт анализирует GET/POST запрос и встречает там собаку, он начинает выискивать почтовый адрес или FTP.
Переделка в втоем случае не займет много времени/денег/сил. Зато точно боков не будет.
У меня есть такой сайтец. Тематика - военный архив. С Рамы траф больше.
_Nic_, А можно поинтересоваться, откуда такое желание делать не так, как принято? Действительно живой интерес, ибо знамаюсь разработкой сетевых фильтров. Большинство из извесных мне, такое просто не пропускают или искажают.
Конечно в теории, поисковик должен хавать все, что возвращает приемлимый для него тип контента, но....
nidus, Зависит от того, что все сайты сетки из себя представляют. Если сайты сильные, то можно использовать 3, если слабые - 1 или 2. Лично я использую вариант 2 но направленный в обраную сторону. т.е. Накачивая верхние сайты. (просто другая задача)
seo_guy,
Не думаю, что здесь Robots поможет.
Может поробовать чтобы при подключении на порт 8080 отдавался бы robots с запретом на индексацию?
Кто мешает в коде вписать, чтбы отдавал ошибку 404 или 302 при входе с определенным user-agent.
И если не сикрет, зачем чтало нужно разносить порты, да еще так что там дубли с 80 портом?
Хочеш иметь серьезный, качественный и удобный сайт - делай его сам. Без сторонних движков. Чуть дольше, иногда немногим дороже, но зато результат всегда верный. Читая этот топик еще раз в этом убедился
Venom_w,
А что рвать, ели такой закономерности просто нет. Рама работает медленее чем Яша, там все идет с нятягом, но и результат стабилен.