Igor.O,
Подход к вопросу только с одно стороны, всегда ведет к неверным решениям.
Какраз Ваше решине возможно только с теоритической стороны.
Технически - не решимо.
Если бы это могло быть решено технически, то и ПС нашла-бы первоисточник.
PS те, кто хотят себя защищать, делают мелкие "пометки" в текстах.
- в рсс для разных служб выкладывают чуть измененный материал (чтобы всегда можно было найти "следы")
- в текст HTML подмешивают скрытый код, который "всплывет" на чужом сайте за счет стилей.
- частичная генерация в JS.
будеш самым забаненым ....
а разве, это кто-то утверждает?
Разработчик,
Верно. Кешируется то, что робот схавал. Вопрос только как давно.(?) У яши, да и у гуглера просто не хватит сил, чтобы в один момент времени перечитать все сайты. А если между такими реиндексами будет время, скажем 1-2 дня, то построенные на таком принцыпе "плагиаторы" - просто нелепы.
Поэтому сейчас выбран вариант, который реализовать "хватает сил". У кого больше ссылок на статью - то и автор(?).
Логика проста, много ссылок - значит больше заметили, - а значит там наиболее интересно.
Вопрос авторства и первоисточника - вопрос не для ПС, она (пс) должна просто найти то что просили, и при этом быстро и , повозможности, качественно.
Пусть 1 раз в час, но все страницы всех сайтов.
1. Не все сайты обрабатывают ошибки 304/305.
2. Робот ходит по разным сайтоам с разной частотой.
3. Интенсивность обновления сайтов - различная.
В таки условиях привязка к любым временным параметрам невозможна.
Если они попробуют это делать, их просто "за......" юристы серьезных компаний.
Яша, как и другие ПС, не должны пытаться взять на себя роль суда.
Ага, если заставить бот перечитывать все сайты с интервалом в 5-10 сек. =)))
Зачем ПС этим знаиматься?
Вук,
1. Этим просто неудобно пользоваться.
2. Сколько там ссылок? Есть слова Садовского, что документ с 200 ссылками индексироваться не будет(?).
3. Просто гора ссылок, на архивы, которые нужно читать отдельно. Вам нравится самому такой подход?
Для начала послушайте, то что Вам сказал Разработчик. Плохого не посоветует.
На счет яши - он говорит, что ему интересны сайты с оригинальными материалами или сервисами доступа к материалу(утрированно). Судествует кучи сайтов, которые просто у себя собирают RSS с других сайтов, но делаю удобный интерфейс доступа.
В Вашим случае (тольок без обид) - кривой сайт
_ttp://www.marketelectro.ru/biblio/normativ/ - это же кошмар юзера
ужасно исполнен
_ttp://www.marketelectro.ru/articles/problems/article_0304.html
Хотя бы ляпы уберите.
Все будет хорошо, если Вы возьметесь за работу и сделаете все нормально. Такой сайт стыдно показывать широким массам.
PS Только не нужно ссылаться на то, что таких "кошмаров" полно в сети, если конечно Вам не хочется поплнить их список.
Так работа над продвижением сайта с этого и начинается. Проверка хостинга, движка/cms, и т.д.
Лично я не беру в работу сайты которые имеют в этом кривизну (стараюсь чтобы сайты были без cms или имели гибридную схему). Или клиент согласится на реконструкцию, либо мы не договорились.
Иначе тяжело говорить о результатах.