Яндекс научился "понимать" ссылки без тега <a>?

Yeugeny
На сайте с 01.02.2008
Offline
42
3550

Предыстория такова. Есть у меня один сайт, делал для души, а потом забросил, но в панели вебмастера он есть. После апа 05.04 зашел в панель и случайно обратил внимание, что на нем появилось две ошибки. Конечно, ошибки у всех бывают, но тут ситуация несколько иная: сайт на статическом ХТМЛе, контент давно не менялся, все страницы в индексе (их чуть больше десятка), раньше этих ошибок не было.

Обе ошибки "HTTP-статус: Ресурс не найден", даты последнего изменения и последнего посещения совпадают - 31.03.2009. Причем, страницы (которые не найдены) какие-то странные, одна "/$1", вторая "/about.htm." с точкой после htm. Решил посмотреть, откуда такие корявые ссылки взялись, может кто эксперименты над моим сайтом ставит, а я и не догадываюсь?

Поискал точное вхождение и обнаружил эти "ссылки" на одной из страниц своего же сайта. Страница про robots.txt и 301 редирект, там как-раз приведен пример файла .htaccess, в котором и встречается /$1. Второе вхождение нашлось без особого труда (оно на той же страничке в следующем абзаце). Причем, в обоих случаях это не гиперссылки, а простой текст, начинающийся с ht_tp:// (на всякий случай здесь вставил подчеркивание :)). Это пример некорректно "прочитанных" ссылок, но ведь могут быть и вполне корректные...

Отсюда закономерный вопрос: с каких это пор Яндекс воспринимает простой текст, начинающийся с ht_tp:// как ссылку? У кого-нибудь подобное наблюдается?

P.S. Конечно, на самом деле вопросов гораздо больше (все сразу начали судорожно вспоминать, где ставили ссылки в простом тексте ;)), но сначала хотелось бы узнать, может это глюк Яндекса и зря я тут панику поднимаю?

yanus
На сайте с 21.01.2009
Offline
348
#1

возможно кто-то просто скопипастил вашу статью к себе на сайт и не углядел за ссылками - они там именно ссылками идут. поищити в Я копии вашей статьи на других сайтах.

а лучше урл в личку - любопытно.

Адепт
На сайте с 15.06.2004
Offline
247
#2

yanus, да тут вопрос в том, что робот пошел по указанным ссылкам и посчитал их битыми.

А так, вполне логично, если разбирается текс и натыкается на http:// - идет и проверяет как ссылку. Если не работает, то пишет ошибку.

Эффективное комплексное продвижение для интересных проектов. ( /ru/forum/577451 ) Делюсь опытом.
Б
На сайте с 30.06.2008
Offline
200
#3

Yeugeny, я замечал подобное такое пару месяцев назад. Причём хуже: сайт в серпе был с НПС. Текст из НПС был найден лишь на одном каталоге, но это был просто текст! Искал не только в Яндексе. Сама ссылка на сайт была в виде url.

Тогда, почитав сёрч, счёл, что может существовать ещё один ресурс со ссылкой с таким анкором, который был, скажем, забанен. Но убедиться в этом не удалось. Так что как знать? Shit happens sometimes.

Будь мудрее. Выгляди глупее.
yanus
На сайте с 21.01.2009
Offline
348
#4
Адепт:
yanus, да тут вопрос в том, что робот пошел по указанным ссылкам и посчитал их битыми.
А так, вполне логично, если разбирается текс и натыкается на http:// - идет и проверяет как ссылку. Если не работает, то пишет ошибку.

вопрос в том, посчитал робот имено на этой странице текстовое http://*** или где-то в другом месте реальную ссылку. второй вариант более правдоподобен, хотя полностью исключать, что Я видет в текстовой записи ссылку исключать не стоит.

[Удален]
#5

Что-то кажется, мне, что робот как раз таки http:// и читает, тэг <a> ему как бэ и по барабану... Хотя могу ошибаться...

Адепт
На сайте с 15.06.2004
Offline
247
#6

Psycho, да он и так и так :) Идет не по тэгу, а по http:// А тэги различает, и выкидывает все что не надо :)

sabotage
На сайте с 14.02.2007
Offline
192
#7

yanus дело говорит. Кто-то спер ваши статьи и криво использовал.

А вообще, в панели можно посмотреть источник битых ссылок.

MS
На сайте с 21.07.2008
Offline
216
#8
Psycho:
Что-то кажется, мне, что робот как раз таки http:// и читает, тэг <a> ему как бэ и по барабану... Хотя могу ошибаться...

Как быть с относительными ссылками внутри сайта?

Б
На сайте с 30.06.2008
Offline
200
#9

Psycho, не совсем так. Боты же ходят по относительным внутренним ссылкам, тем, которые начинаются сразу с /, без http://.

А по акулоссылочному что Вам думается?

minSEO, опередил. :)

A
На сайте с 16.11.2008
Offline
12
#10
Psycho:
Что-то кажется, мне, что робот как раз таки http:// и читает, тэг <a> ему как бэ и по барабану... Хотя могу ошибаться...

Тогда он должен идти по таким линкам - логично?

=> можно проверить на влет в индекс с таким линком. :)

Пишу на похапэ (/ru/forum/342374). Аудит скриптов. За деньги. Качественно.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий