VIC

Рейтинг
127
Регистрация
27.10.2002
Mish-ka:

Гугл может грохнуть Сапу в один миг. И при том, пару дней назад, он показал, что это не шутка.
Вот только надо ли это Гуглу?

По-моему, это преувеличение. Когда-то точно так же Яндекс "мог" в один момент грохнуть Линкатор.ру (кто помнит, в этом месте улыбнется). Но этот грох у него растянулся о-очень надолго.

При том, что линкаторные ссылки определялись практически стопроцентно, а саповские хоть как-то стараются варьировать.

Домен лучше брать из числа gTLD – com, net, org... (но можно и .su) – в Google Webmaster Tools для них можно выбрать географическую привязку.

donc:
Так это главное событие весны, зачем там тезисы, пустяки все это.

Если бы энергию топикстартера кто-нибудь переключил с пиара на полезную деятельность – это было бы главным событием весны, несомненно.

ApokalipsYs:
VIC, спасибо за обратную связь. Хочу прокомментировать ваше сообщение.
Вы вешаете на мою книгу клише "содержит ложную информацию". Мне бы хотелось сделать дополнение, что информация может иметь различную степень достоверности и есть разница между фальсификацией и ошибкой в выборе термина.

Содержит ложную информацию (антоним "истинной"). Не надо расширенного толкования – это не утверждение, что там сознательная ложь. "Ложная" – не "лживая", о фальсификациях речь не идет.

Речь о том, что и неоднозначности могут быть разные. Я прочел насчет "мета-тегов noindex, nofollow" и усмехнулся – написано сгоряча, ясно, что речь о мета robots. Мне ясно. Но по этой книге кто-то будет учиться азам с нуля, она так позиционирована. И он-то как раз не сможет "понять правильно". В этом случае любая неточная размытая формулировка равнозначна ложной информации. А других случаев не будет, продвинутым с этой книгой говорить не о чем, для них она уже набор общих мест.

Еще можно сказать, что спорной информации там предостаточно (сюда же и keywords, по которому Яндекс уже менял позицию), но это уже отдельная тема для отдельного холивара.

ApokalipsYs:

Да, является.

Зря с этим к Яндексу. Он не папа римский, он просто опубликовал таблицу.

Хотя этот статус и отнесен к категории Redirection, это особый случай. Перенаправление подразумевает указание нового направления (Location) для повторного запроса от ПА. В случае Not Modified повторный запрос от ПА не предполагается. Это отклик на условный GET, подтверждающий неизменное состояние кэша/документа. См. RFC 2616 – ни при каких условиях в заголовке с этим статусом поле Location не передается (Content-Location – совсем не то же самое).

И на последующее обращение к коллегам.

MiRaj запредельно мягко высказал то, что сразу бьет в глаза: программа курса рассчитана непонятно на кого. В 150 часов это можно втиснуть – в режиме "обзор галопом" – но что останется в головах? Не буду таким мягким – останется иллюзия приобщения к какому-то знанию, потому что как следует уложить столько информации в головы за такой срок нереально. Особенно учитывая разнородность заявленной аудитории ("Для кого этот курс"). Зато выпускник сможет гнуть пальцы: "Да вы знаете, у кого я учился!".

Пройдитесь по топику, проверьте мои впечатления – похоже, самые положительные отклики, что здесь можно найти, выглядят примерно так: "И обижать не хочется, и одобрить не получается...".

donc:
Запутался.
Это в книжке так написано? Или вы утверждаете?

Стр. 48 ("Устранение дубликатов")

Чтобы избавиться
от полудубликатов, в некоторых случаях
содержимое таких страниц закрывают че-
рез метатеги noindex, nofollow

Я пока (от себя) ничего не утверждал. Но если возможные значения мета-тега robots подаются как отдельные мета-теги, то уже можно смело утверждать, что ложная информация в книге есть. Можно, конечно, назвать это фактической ошибкой, но для содержания учебника это синонимы.

Девчушка, в книге есть ложная информация.

Разумеется, детальный разбор не проводился (а надо?), просто при очень беглом ознакомлении "по диагонали" бросились в глаза ляпсусы:

- мета-тегов noindex, nofollow ("с помощью" которых предлагается бороться с дубликатами) в природе не существует, это атрибуты мета-тега robots

- поисковые системы официально открестились от мета-тега keywords, который, тем не менее, провозглашается значимым

- код статуса HTTP 303 See Other не имеет никакого отношения к "временному перенаправлению", он придуман совсем для других целей

- Указывая тег < noindex > как средство предотвращения излишней индексации, автор упорно забывает добавить, что это может относиться только и исключительно к Яндексу

- показателен заголовок "Коды ответов 301 / 302 / 303 / 307 / 3**" – далее речь идет исключительно о редиректе. То есть, статус 304 Not Modified, по мнению автора, также является редиректом?

Вероятно, при внимательном поиске найдется больше.

Давно ожидаемая пакость. Ту же "атаку Гумблара" с высадкой троянских загрузчиков уже сколько времени проворачивают чуть не в промышленных масштабах, а здесь все еще проще. Rootkit'ом это называть немножко громко... но в любом случае, это годный инструмент для автоматического внедрения произвольных скриптов в нужные места.

И не все даже заметят, что с сайтом что-то случилось.

Насчет биржи не похоже, скрипт реагирует только на юзер-агенты ПС, а там нужно еще и ботам биржи отдавать контент с добавлениями. Возможно, у них своя биржа. А приведенный скрипт, похоже, заготовка, в которой установщик забыл/не успел прописать идентификатор. На всякий случай проверьте, не завелось ли еще что-то лишнее - скриптик проводит установку в какую-то директорию какого-то файла .php - имена файла и директории он получает "из Центра". Возможно, запасной "микрошелл" на случай, если connect.php обнаружат и вычистят.

Трудно сейчас что-то правильно понимать - с терминологией шалят, то и дело нужно переспрашивать. Сеткой часто называют не слинкованное стадо своих сайтов (а какая же это сетка?).

Речь о блогах – если на блогхостинге, то там не поймешь, весь ЖЖ по сути "легальная" линкованная сетка. Если stand-alone сплоги – слинкованы или нет? как в бан ушли – как сетка или просто набиты генерированным контентом? Ведь отношение к ссылкам запросто может зависеть от всего этого...

И Сапу смело можно рассматривать как сетку. :) Очень часто прокачивают сайты, покупая ссылки в той же Сапе, так что слинкованы сапосайты плотненько.

Ladycharm, поздновато я откликаюсь, но...

Я последовательно употребил термины "страница", "документ" и "тело сообщения" - откуда взялся смелый вывод, что под этим подразумевался HTTP-Response в целом? :) Когда речь изначально вообще шла о HTML-странице, о разделении её кода (HTML-тегов) и контента (текста).

Ну, а дальше дискуссия вообще ушла в сторону стрельбы по нарисованным силуэтам лиц, не читавших RFC2616 и не желающих смотреть, какую временную метку отправляет бот в If-Modified-Since... А вам сказать, почему мало кто заморачивается анализом этого заголовка? Как и прочих?

Берем "наше всё" – дико распространенный PHP. Берем в комплекте к хостингу с FastCGI – тоже довольно распространенный случай. И... видим эти заголовки запроса не лучше собственных ушей, поскольку функции getallheaders() нет в наличии – она только в модуле Апача.

А делать движок для однократного применения никому не хочется.

PPS: Тема LastModified для сайтов в 200 страниц не актуальна - и так всё переиндесируется.

Это вы умозрительно?

Исходное положение: сайтик с "чем попало из головы" в качестве контента, примерно год нет ни изменений, ни пополнения контента, ссылок на него тоже практически нет (по одной закладке с мистер-Вонг и Мемори - это смешно). И за весь этот год редкий день бот не наведывался на сайтик. Страниц примерно 40 штук. :)

Попробуйте поиграть с заголовками всерьез. Сапо-ВМ вас на руках носит будут... ;)

PS: Заголовок - это не то, что написано на странице сайта в секции <head></head>, хотя некоторые мета-тэги модифицируют отправляемые веб-сервером заголовки HTTP.

Что-что?

И каким же это способом содержимое тела сообщения модифицирует уже отправленный заголовок? В раздел "Непознанное", однозначно. Пусть Малдер и Скалли разберутся в феномене. Тут без машины времени не обошлось, нутром чую...

18 мая, четыре попытки:

189.14.95.3

113.254.11.119

125.234.1.98

121.30.255.38

Всего: 238