Комментарии - Cherny - Профиль вебмастера - Форум об интернет-маркетинге

Как узнать какие страницы во время апдейта базы проиндексировал робот?

9 марта 2004, 15:14

Blaster, лучше всего профильтровать логи по User-agent нужного поисковика. Оттуда сразу все видно. Не знаю, есть ли в лог-анализаторах аналогичные функции.

Тэг

8 марта 2004, 14:55

Я больше года назад проверял, тогда не учитывался, как и title ссылок.

Вопрос о формировании ссылки

8 марта 2004, 14:50

Возможно, я ошибаюсь, но модуль mod_rewrite дает только психологический эффект. С технической точки зрения, он просто выдает http заголовок Location: <другой адрес>.

Lupus, вы действительно ошибаетесь. Все зависит, конечно, от правил перезаписи, но в большинстве случаев получаются дубли страниц с "динамическими" и "статическими" адресами.

ламерский вопрос про дорвеи

5 марта 2004, 07:47

wolf, согласен, не учел.

retider, рецепт прост. Определить параметры по умолчанию и при запросе скрипта без параметров подставлять их. А еще лучше эмулировать статику, там таких проблем не возникает.

ламерский вопрос про дорвеи

5 марта 2004, 06:07

(такой ссылки нет, но ведь робот может просто проиндексировать то, что лежит на сервере)

Если ссылки нет, то робот сам усекать параметры не станет.

Как правильно вычистить ссылки из базы ?

4 марта 2004, 06:48

В этой статье много ошибок. Например формат файла не обязательно должен быть юниксовым, можно использовать несколько строк User-agent в одной записи, но основная ошибка та, что все строки в поле Disallow должны начинаться с корня (/), а них в примерах это не так.

Лучше уж потратить время и прочитать стандарт, где-то на citforum.ru был его перевод, а вышеприведенную статью лучше не читайте. 🙅

откат Yandex'a?

28 февраля 2004, 06:15

Тогда я не прав. Надо будет перечитать RFC.

откат Yandex'a?

27 февраля 2004, 18:22

и быть может кто-то знает почему программа webbug по версии HTTP 1.1 находит страницы и дает информацию по ним, а во версии HTTP 1.0 на существующие страницы говорит что "HTTP/1.1 404 Not Found" - это так и должно быть?

Я знаю, так и должно быть, потому что в версии 1.0 протокола HTTP отсутствовала поддержка виртуальных хостов, поэтому на запрос страницы отвечает дефолтный сайт на этом IP. По-моему так.

глюки со статистикой Hotlog

27 февраля 2004, 15:29

Это что-то новенькое. Хотлог стал точнее логов? Может это какие-то логи неправильные?

Бывает, что логи не дают полной картины, если перед перед сайтом стоит акселератор. Хотя, не в разы, конечно.

301 и 404 error pages

24 февраля 2004, 15:01

редирект тут в обоих случаях

Для первого случая, ИМХО, лучше сделать отдельную страницу 404.shtml, на которой внятно говорить, что страница не найдена, дать ссылку на главную... Иначе Гугл может в результате криво склеить страницы, сделать главной какую-нибудь www.site.com/bla-bla.html и будет потом морока по расклейке.

Для чего нужен второй редирект мне не понятно.

Яндекс Вебмастер вынес товарные фиды в отдельный раздел

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ

Cherny