T.R.O.N

T.R.O.N
Рейтинг
314
Регистрация
18.05.2004
Я знаю, как заработать много денег... выпустить календарь, где красным цветом будут отмечены дни апдейта... прям как даты менструаций на женских календарях)))

Предлагаю альтернативу заработка - темы "Апдейт" и "ересчитался тИЦ" сделать платными.

Avatar,

T.R.O.N, так ты имеешь отношение к этому сайту?
Это ТЫ писал о ращделении в саппорт или это твое мнение :?)

это мой опыт по другим сайтам. Последний был наверно окло года назад.

конечно ИМХО, но можно избежать склейки, если разные субдомены, имеют разные подсетки. Робот, с какогото момента, перестает перечитывать DNS. БЫл такой казус.

На собственной тестовой площадке, где все сайты имеют свои реальныые IP, как-то перенес "сайт 1" на другой адрес. Потом на IP,где лежал сайт 1, выложил другой сайт "сайт 2". (естественно DNS были переопределены). Так робот, после того, как начал индексить сайт 1 с нового места, сайт 2 считал его частью еще месяца 3. (не субдомены, темы разные)

T.R.O.N, ну вообще как я понимаю на одном IP может далеко не один домен висеть, не говоря о сабдоменах

"Реальный" IP чаще всего один, а "виртуальные" разный. Это избавляет от очень многих забот.

Angelika, действительно интересный пример
есть еще allfirm.expoweb.ru 30
Может он вручную роазделен яндексоидами как каталог?

Была такая задача, написал письмо в супорт, они разделили субдомены, чтобы и тИЦ раздельно считался и все остальное.

Один сайтик хостился в dataforce ip (df.ru). У него было 3 сабдомена на схожие и не схожие тематики. Так там принято сабдомены делать папками в той же директории, где и сам сайт.

А коли светанулся сайтец в качестве папочки, то и оставаться ему пожизненно в таком виде на том же домене...

Давайте мух от печенья отделим. суб юомен - это домен следующего уровня имеющий уникальный (реальнвый или виртуальный IP),

а папка - это пака. А то все как-то вместе.

А скажите по какому принципу ходит робот на сайт(действительно хотелось бы узнать)?

Конечно имхо, но (надеюсь они не сильно исказили класический алгоритм)

Когда индексация начинается, робот конечно начинает с морды, по проходит по ссылкам. У него лимит времени на сайт. Что успел - то взял. Лимит у разных сайтов - разный. Зависит от многих факторов.

Так продолжается несколько раз, с каким-то интервалом.

Потом, когда накопились данные, робот ходит по сайту, начиная как с морды, так и со страниц с наибольшей частотой обновлений и с большим весом внешних ссылок.

По всей видимости, робот иметт ограничения и на количество ошибок. Если код имеет ошибки и сервак часто возвращает код отличный от 200, бот посто уходит.

Такое часто наблюдается у сайтов, посторенных на движках с "плавающими" страницами, когда страница со временем меняет УРЛ.

(да, здесь я еще не описал проходы быстроробота, робота каталога и т.д.)

Вощем посмотрите расширенные логи сервера, там много станет понятно.

И после всего этого Яндекс называет себя "Зеркалом интернета".... :-/

Если он заглядывает только на страницы. на которые есть ссылки с главной....

Слышал звон........ =))

Какой смысл яндеху создавать "умного" робота. Гемора много. Денег больше не принесет. Сейчас он вне конкуренции. Большенство его ругают но пользуются.

Ведь уные мысли появляются тогда, когда жмут ботинки.

Посему, пока кто-то "на коленках" не моздаст нового монстра, который будет заточен под русский контент и менталитет - яндех будет продолжать сои эксперементы.

Ведь ссылки удобней контента, с точки зрения анализа, учета и индексации. А над парсерами контента нуна голову ломать.

Lenka, А как на счет скорости отдачи страниц. Робот имеет лимит времени на сайт. Если сервер тормозит, робот просто не успевает дальше зайти

Всего: 4849