Да я это понял. Вопрос почему пишут что нельзя в <hN> включать ссылку, если с точки зрения верстки это семантически верно.
<hN><strong><a>Заголовок</a></strong></hN>
Просто я анализирую сайты корреспондента.
http://www.homepage.ru/news - первый по запросу новости Москвы. Хотя ria.ru по круче будет его в разы.
Я смотрю они спамят h4-h5
h1 - самая главная
h2 - главная в рубрике
h3 - главные в рубрики, либо название самой рубрики.
"текст ссылки в тег" - наверное так.
like2dev добавил 06.09.2011 в 15:17
И еще вопрос, если выводится новость в виде
Заголвок
Краткое описание.
На сколько верно будет сделать это типо
<a><h4>заголовок</h4>краткое описание</a>
Все в логах, яндекс бота тоже нашел, но просто странно почему-то яндекс не выдает в поиске наши новости. Хотя он буквально вчера нас индексировал. Если верить логам.
"Только вы отфильтруйте строки" - как понять? И стоит ли дежать поиск по тэгам открытым для поисковика?
66.249.66.249 - - [01/Sep/2011:16:51:43 +0400] "GET /tags HTTP/1.1" 404 1281 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
Я так понимаю гугл бот ходит?
Я имел ввиду именно ботами новая версия качается.
Просто прошло уже 18 часов, гугл не обновил. Хотя страницы новые попадают в индекс, а вот Яндекс вообще новые новости перестал отображать.
Был, хреновый движок. Каждый раз когда бот запрашивал сайт ему выдавалась новая сессия, в итоге сессий было слишком много и нельзя было создать новую сессию.
User-agent: *
Disallow: /admin/
Disallow: /profile
User-agent: Yandex
Crawl-delay: 10
User-agent: msnbot
Crawl-Delay: 25
User-agent: googlebot
crawl-delay: 10
User-agent: yahoo-slurp
Crawl-Delay: 15
User-agent: Mail.Ru
Crawl-Delay: 20
Правильно?
Disallow: /
Боюсь, что боты придут не скоро =(