Яндекс научился "понимать" ссылки без тега <a>?

42

Yeugeny

5 апреля 2009, 22:28

3645

Предыстория такова. Есть у меня один сайт, делал для души, а потом забросил, но в панели вебмастера он есть. После апа 05.04 зашел в панель и случайно обратил внимание, что на нем появилось две ошибки. Конечно, ошибки у всех бывают, но тут ситуация несколько иная: сайт на статическом ХТМЛе, контент давно не менялся, все страницы в индексе (их чуть больше десятка), раньше этих ошибок не было.

Обе ошибки "HTTP-статус: Ресурс не найден", даты последнего изменения и последнего посещения совпадают - 31.03.2009. Причем, страницы (которые не найдены) какие-то странные, одна "/$1", вторая "/about.htm." с точкой после htm. Решил посмотреть, откуда такие корявые ссылки взялись, может кто эксперименты над моим сайтом ставит, а я и не догадываюсь?

Поискал точное вхождение и обнаружил эти "ссылки" на одной из страниц своего же сайта. Страница про robots.txt и 301 редирект, там как-раз приведен пример файла .htaccess, в котором и встречается /$1. Второе вхождение нашлось без особого труда (оно на той же страничке в следующем абзаце). Причем, в обоих случаях это не гиперссылки, а простой текст, начинающийся с ht_tp:// (на всякий случай здесь вставил подчеркивание :)). Это пример некорректно "прочитанных" ссылок, но ведь могут быть и вполне корректные...

Отсюда закономерный вопрос: с каких это пор Яндекс воспринимает простой текст, начинающийся с ht_tp:// как ссылку? У кого-нибудь подобное наблюдается?

P.S. Конечно, на самом деле вопросов гораздо больше (все сразу начали судорожно вспоминать, где ставили ссылки в простом тексте ;)), но сначала хотелось бы узнать, может это глюк Яндекса и зря я тут панику поднимаю?

348

yanus

5 апреля 2009, 22:34

#1

возможно кто-то просто скопипастил вашу статью к себе на сайт и не углядел за ссылками - они там именно ссылками идут. поищити в Я копии вашей статьи на других сайтах.

а лучше урл в личку - любопытно.

247

Адепт

5 апреля 2009, 22:40

#2

yanus, да тут вопрос в том, что робот пошел по указанным ссылкам и посчитал их битыми.

А так, вполне логично, если разбирается текс и натыкается на http:// - идет и проверяет как ссылку. Если не работает, то пишет ошибку.

Эффективное комплексное продвижение для интересных проектов. ( /ru/forum/577451 ) Делюсь опытом.

Б

200

Беобахтер

5 апреля 2009, 22:43

#3

Yeugeny, я замечал подобное такое пару месяцев назад. Причём хуже: сайт в серпе был с НПС. Текст из НПС был найден лишь на одном каталоге, но это был просто текст! Искал не только в Яндексе. Сама ссылка на сайт была в виде url.

Тогда, почитав сёрч, счёл, что может существовать ещё один ресурс со ссылкой с таким анкором, который был, скажем, забанен. Но убедиться в этом не удалось. Так что как знать? Shit happens sometimes.

Будь мудрее. Выгляди глупее.

348

yanus

5 апреля 2009, 22:43

#4

Адепт:
yanus, да тут вопрос в том, что робот пошел по указанным ссылкам и посчитал их битыми.
А так, вполне логично, если разбирается текс и натыкается на http:// - идет и проверяет как ссылку. Если не работает, то пишет ошибку.

вопрос в том, посчитал робот имено на этой странице текстовое http://*** или где-то в другом месте реальную ссылку. второй вариант более правдоподобен, хотя полностью исключать, что Я видет в текстовой записи ссылку исключать не стоит.

[Удален]

5 апреля 2009, 22:53

#5

Что-то кажется, мне, что робот как раз таки http:// и читает, тэг <a> ему как бэ и по барабану... Хотя могу ошибаться...

247

Адепт

5 апреля 2009, 23:00

#6

Psycho, да он и так и так :) Идет не по тэгу, а по http:// А тэги различает, и выкидывает все что не надо :)

192

sabotage

5 апреля 2009, 23:01

#7

yanus дело говорит. Кто-то спер ваши статьи и криво использовал.

А вообще, в панели можно посмотреть источник битых ссылок.

MS

216

minSEO

5 апреля 2009, 23:02

#8

Psycho:
Что-то кажется, мне, что робот как раз таки http:// и читает, тэг <a> ему как бэ и по барабану... Хотя могу ошибаться...

Как быть с относительными ссылками внутри сайта?

Б

200

Беобахтер

5 апреля 2009, 23:02

#9

Psycho, не совсем так. Боты же ходят по относительным внутренним ссылкам, тем, которые начинаются сразу с /, без http://.

А по акулоссылочному что Вам думается?

minSEO, опередил. :)

A

12

asserte

5 апреля 2009, 23:02

#10

Psycho:
Что-то кажется, мне, что робот как раз таки http:// и читает, тэг <a> ему как бэ и по барабану... Хотя могу ошибаться...

Тогда он должен идти по таким линкам - логично?

=> можно проверить на влет в индекс с таким линком. :)

Пишу на похапэ (/ru/forum/342374). Аудит скриптов. За деньги. Качественно.

VK приобрела 70% в структуре компании-разработчика red_mad_robot

Маркетинг для шоколадной фабрики. На 34% выше средний чек