andrej-ilin

andrej-ilin
Рейтинг
42
Регистрация
28.03.2005

Kost, автор задачи не я. Я то, как раз, дал человеку практический совет, исходя из предоставленной информации.

Вот постановка задачи

Каширин:


Цитата:Сообщение от andrej-ilin
User-Agent: Yandex
Disallow: /index.php


Тоже не верно. Потому что вы не закрыли страницы типа /dir/ и исходите из предположения, что все страницы сайта есть index.php с параметрами, а топикстартер явно написал, что их - большинство , то есть не все!

Еще пицот баксов уходят мне

У меня с советских времен аллергия на людей, которые мне объясняют что я неверной дорогой хожу или неправильную музыку слушаю или что-то там не то думаю.

Поэтому я не смог удержаться и не попросить автора предъявить "правильный" robots.txt, который лишен подобных "недостатков".

Наверное, слова "тоже не верно", "исходите из предположения" и "еще пицот баксов уходят мне" в поцитированном сообщении были лишними.

P.S. А вот с Винни-Пухом я согласен. Неправильные пчелы есть!

Сам видел.

K. Ermakov, в браузере выбираем Файл > Сохранить как > Веб страница, полностью и получаем набор файлов. На сервере, конечно, некоторые файлы не хранятся, а создаются динамически.

Ну а про странички на фреймах я уже говорил.

Kost:
Тогда можете сформулировать тех. задание в личку. Но это уже не бесплатно.

Спасибо. Ну, robots.txt я уж как-нибудь сам напишу.

Я просто хотел проиллюстрировать то, что в общем виде решение не дано. Вы предлагаете запретить индексацию всех файлов и директорий на сервере. Но страница может состоять не из одного файла, поэтому Ваше решение нельзя назвать универсальным.

Kost:
Файлы с кириллическими именами, на китайском языке и т.д. в расчет не берем

В реальности мало кто создает сайты соответсвующие стандартам, и роботы вынуждены следовать за людьми, чтобы проиндексировать их творчество.

Kost, а если у меня главная страница на фреймах сделана, и еще я хочу чтобы картинки с главной страницы тоже в индекс попали?

Каширин:
вы не закрыли страницы типа /dir/ и исходите из предположения, что все страницы сайта есть index.php с параметрами

А откуда Вам стало известно о моих предположениях? Если задача состоит в написании универсального robots.txt, запрещающего Яндексу индексацию всех страниц сайта кроме главной, то, может быть Вы огласите правильное решение для всего множества всевозможных URL?

User-Agent: Yandex

Disallow: /index.php

cheboor:
Программа ищет код ссылки посимвольно, наличие даже символа перевода строки в "теле" ссылки воспринимается как отклонение от нормы, соответственно программа рапортует об отсутствии искомого текста на сайте.

cheboor, Вы сами прекрасно сформулировали то, что хотят пользователи.

cheboor:
Если ссылку изменили без моего ведома - это не правильно, программа должна меня известить.

Вы же понимаете, что есть разница между тем, когда ссылка удалена, или изменен код ссылки. Вообще, было бы не плохо, чтобы программа еще показывала изменения и позволяла принять их одним кликом мышки, если они не принципиальны.

Одно не понятно - при чем тут <noindex>?

Olisher:
Проверено на одном сайте

Наверное правильнее было бы написать "замечено на одном сайте", а для проверки одного сайта явно не достаточно.

А вот пример использования атрибута alt от гуру вебдизайна:

alt="Жак Ширак. Фото <a href=&quot;http://lenta.ru/info/afp.htm" target=&quot;_blank&quot;>AFP</a>."

http://lenta.ru/r/illustrated.html

Всего: 667