По-моему, это преувеличение. Когда-то точно так же Яндекс "мог" в один момент грохнуть Линкатор.ру (кто помнит, в этом месте улыбнется). Но этот грох у него растянулся о-очень надолго.
При том, что линкаторные ссылки определялись практически стопроцентно, а саповские хоть как-то стараются варьировать.
Домен лучше брать из числа gTLD – com, net, org... (но можно и .su) – в Google Webmaster Tools для них можно выбрать географическую привязку.
Если бы энергию топикстартера кто-нибудь переключил с пиара на полезную деятельность – это было бы главным событием весны, несомненно.
Содержит ложную информацию (антоним "истинной"). Не надо расширенного толкования – это не утверждение, что там сознательная ложь. "Ложная" – не "лживая", о фальсификациях речь не идет.
Речь о том, что и неоднозначности могут быть разные. Я прочел насчет "мета-тегов noindex, nofollow" и усмехнулся – написано сгоряча, ясно, что речь о мета robots. Мне ясно. Но по этой книге кто-то будет учиться азам с нуля, она так позиционирована. И он-то как раз не сможет "понять правильно". В этом случае любая неточная размытая формулировка равнозначна ложной информации. А других случаев не будет, продвинутым с этой книгой говорить не о чем, для них она уже набор общих мест.
Еще можно сказать, что спорной информации там предостаточно (сюда же и keywords, по которому Яндекс уже менял позицию), но это уже отдельная тема для отдельного холивара.
Зря с этим к Яндексу. Он не папа римский, он просто опубликовал таблицу.
Хотя этот статус и отнесен к категории Redirection, это особый случай. Перенаправление подразумевает указание нового направления (Location) для повторного запроса от ПА. В случае Not Modified повторный запрос от ПА не предполагается. Это отклик на условный GET, подтверждающий неизменное состояние кэша/документа. См. RFC 2616 – ни при каких условиях в заголовке с этим статусом поле Location не передается (Content-Location – совсем не то же самое).
И на последующее обращение к коллегам.
MiRaj запредельно мягко высказал то, что сразу бьет в глаза: программа курса рассчитана непонятно на кого. В 150 часов это можно втиснуть – в режиме "обзор галопом" – но что останется в головах? Не буду таким мягким – останется иллюзия приобщения к какому-то знанию, потому что как следует уложить столько информации в головы за такой срок нереально. Особенно учитывая разнородность заявленной аудитории ("Для кого этот курс"). Зато выпускник сможет гнуть пальцы: "Да вы знаете, у кого я учился!".
Пройдитесь по топику, проверьте мои впечатления – похоже, самые положительные отклики, что здесь можно найти, выглядят примерно так: "И обижать не хочется, и одобрить не получается...".
Стр. 48 ("Устранение дубликатов")
Я пока (от себя) ничего не утверждал. Но если возможные значения мета-тега robots подаются как отдельные мета-теги, то уже можно смело утверждать, что ложная информация в книге есть. Можно, конечно, назвать это фактической ошибкой, но для содержания учебника это синонимы.
Девчушка, в книге есть ложная информация.
Разумеется, детальный разбор не проводился (а надо?), просто при очень беглом ознакомлении "по диагонали" бросились в глаза ляпсусы:
- мета-тегов noindex, nofollow ("с помощью" которых предлагается бороться с дубликатами) в природе не существует, это атрибуты мета-тега robots
- поисковые системы официально открестились от мета-тега keywords, который, тем не менее, провозглашается значимым
- код статуса HTTP 303 See Other не имеет никакого отношения к "временному перенаправлению", он придуман совсем для других целей
- Указывая тег < noindex > как средство предотвращения излишней индексации, автор упорно забывает добавить, что это может относиться только и исключительно к Яндексу
- показателен заголовок "Коды ответов 301 / 302 / 303 / 307 / 3**" – далее речь идет исключительно о редиректе. То есть, статус 304 Not Modified, по мнению автора, также является редиректом?
Вероятно, при внимательном поиске найдется больше.
Давно ожидаемая пакость. Ту же "атаку Гумблара" с высадкой троянских загрузчиков уже сколько времени проворачивают чуть не в промышленных масштабах, а здесь все еще проще. Rootkit'ом это называть немножко громко... но в любом случае, это годный инструмент для автоматического внедрения произвольных скриптов в нужные места.
И не все даже заметят, что с сайтом что-то случилось.
Насчет биржи не похоже, скрипт реагирует только на юзер-агенты ПС, а там нужно еще и ботам биржи отдавать контент с добавлениями. Возможно, у них своя биржа. А приведенный скрипт, похоже, заготовка, в которой установщик забыл/не успел прописать идентификатор. На всякий случай проверьте, не завелось ли еще что-то лишнее - скриптик проводит установку в какую-то директорию какого-то файла .php - имена файла и директории он получает "из Центра". Возможно, запасной "микрошелл" на случай, если connect.php обнаружат и вычистят.
Трудно сейчас что-то правильно понимать - с терминологией шалят, то и дело нужно переспрашивать. Сеткой часто называют не слинкованное стадо своих сайтов (а какая же это сетка?).
Речь о блогах – если на блогхостинге, то там не поймешь, весь ЖЖ по сути "легальная" линкованная сетка. Если stand-alone сплоги – слинкованы или нет? как в бан ушли – как сетка или просто набиты генерированным контентом? Ведь отношение к ссылкам запросто может зависеть от всего этого...
И Сапу смело можно рассматривать как сетку. :) Очень часто прокачивают сайты, покупая ссылки в той же Сапе, так что слинкованы сапосайты плотненько.
Ladycharm, поздновато я откликаюсь, но...
Я последовательно употребил термины "страница", "документ" и "тело сообщения" - откуда взялся смелый вывод, что под этим подразумевался HTTP-Response в целом? :) Когда речь изначально вообще шла о HTML-странице, о разделении её кода (HTML-тегов) и контента (текста).
Ну, а дальше дискуссия вообще ушла в сторону стрельбы по нарисованным силуэтам лиц, не читавших RFC2616 и не желающих смотреть, какую временную метку отправляет бот в If-Modified-Since... А вам сказать, почему мало кто заморачивается анализом этого заголовка? Как и прочих?
Берем "наше всё" – дико распространенный PHP. Берем в комплекте к хостингу с FastCGI – тоже довольно распространенный случай. И... видим эти заголовки запроса не лучше собственных ушей, поскольку функции getallheaders() нет в наличии – она только в модуле Апача.
А делать движок для однократного применения никому не хочется.
Это вы умозрительно?
Исходное положение: сайтик с "чем попало из головы" в качестве контента, примерно год нет ни изменений, ни пополнения контента, ссылок на него тоже практически нет (по одной закладке с мистер-Вонг и Мемори - это смешно). И за весь этот год редкий день бот не наведывался на сайтик. Страниц примерно 40 штук. :)
Попробуйте поиграть с заголовками всерьез. Сапо-ВМ вас на руках носит будут... ;)
Что-что?
И каким же это способом содержимое тела сообщения модифицирует уже отправленный заголовок? В раздел "Непознанное", однозначно. Пусть Малдер и Скалли разберутся в феномене. Тут без машины времени не обошлось, нутром чую...
18 мая, четыре попытки:
189.14.95.3
113.254.11.119
125.234.1.98
121.30.255.38