Потому что то, что вы поставите как ErrorDocument 404, возвращается с кодом статуса 404 (Not Found) и не индексируется гуглом.
Majordomo.ru при обращении к несуществующей странице производит редирект 302 на ту самую страницу /404.html, которую возвращает с кодом статуса 200 (ОК). Таким образом, формально ни поисковик, ни браузер не имеют возможности узнать, что обратились к несуществующему объекту (и поисковик, соответственно, проиндексирует эту самую 404.html). Вы, конечно, можете организовать у себя подобную схему, но только зачем вам такая кривизна?
Теперь придётся выяснять, индексируются ли и участвуют ли в ранжировании <image:title> и <image:caption>...
А ещё задумался над этим:
Не с 404-й страницы, а с тех урлов, на которые есть бэки и под которыми нет страниц.
Скорее нет. Лучше средиректить их на главную или на какую-нибудь другую релевантную страницу.
videooz.tab.net.ua: "...не читайте этот бред, это для поисковых роботов..."
Я бы на месте робота обиделся. А вдруг он не так глуп, как кажется? ;)
Если серьёзно, текст на этой странице, да и тайтл тоже, ни в какие языковые шаблоны не укладывается. Если предположить, что ПС попытается анализировать смысл или стиль написанного (а она рано или поздно попытается), то сайты с такими текстами станут первыми жертвами. А пока, судя по всему, вы ещё легко отделались.
Ippi добавил 08.04.2010 в 01:38
P.S. Бывают же нормальные генераторы лингвистически выдержанного правдоподобного бреда (кое-кому их выхлоп даже в рецензируемые научные журналы удавалось пропихивать), зачем пользоваться всяким барахлом?
Ippi добавил 08.04.2010 в 02:25
Z-Style,
Я бы вместо "Фильмы cмотреть онлайн бесплатно новинки кино" попробовал написать "Смотреть фильмы онлайн бесплатно. Новинки кино." или "Фильмы. Смотреть онлайн бесплатно. Новинки кино.", пусть у заголовка появится какая-никакая структура вместо каши. Хотя бы ради интереса.
В кэше тот же тайтл?
Почему же "чуть ли не"? Каттса и есть:
Для начала на всякий случай убедитесь, действительно ли символы "с", "о", "р", "е" в слове "смотреть" набраны кириллицей. Хотя гугл обычно это кое-как переваривал...
Опять же, без калькулятора, чисто на пальцах:
1) A>B;
2) B>A>C при большом демпинг-факторе (в т.ч. и при "каноническом" 0.85), A>B>C при малом;
3) A>(B=C) (схема симметрична относительно A).
Ippi добавил 06.04.2010 в 05:16
Кстати, Ramster,
ещё раз глянул на ваш блог — у вас же на каждой странице несколько блоков с внешними ссылками: "ТОП 8 комментаторов", "Ссылки", "Бизнес-партнёр"... Так что постепенный рост слива входящего на сайт пейджранка наружу при добавлении новых постов вполне закономерен, его следует компенсировать увеличением входящей ссылочной массы.
remorhaz,
ну вот давайте поменьше эмоций, и нарисуем три простеньких сайта:
1) ----- ----- PR'-> | А | <-> | B | ----- -----2) ----- ----- ----- PR`-> | А | <-> | B | <-> | C | ----- ----- -----3) ----- ----- ----- PR`-> | А | <-> | B | <-> | C | ----- ----- ----- ^ ^ | | ---------------------
где PR' - входящий на страницу A (будем считать её главной) внешний PageRank, одинаковый во всех трёх случаях.
Вы согласны, что на этих трёх сайтах страница А получит в результате разный PageRank, если её рассчитывать по любой из известных публике схем расчёта PageRank'а (в первую очередь классической, с равным для всех линков демпинг-фактором)?
Если что, я могу посчитать циферки для классической схемы. Без калькулятора навскидку могу только сказать, что суммарный PageRank страниц всех трёх этих сайтов будет равным (если пренебречь их собственным начальным пейджранком).
Ippi добавил 06.04.2010 в 00:04
Не забывайте, главная тоже ссылается на внутряки, а внутряки ещё и ссылаются друг на друга