T.R.O.N

T.R.O.N
Рейтинг
314
Регистрация
18.05.2004

Igor.O,

Подход к вопросу только с одно стороны, всегда ведет к неверным решениям.

Какраз Ваше решине возможно только с теоритической стороны.

Технически - не решимо.

Если бы это могло быть решено технически, то и ПС нашла-бы первоисточник.

PS те, кто хотят себя защищать, делают мелкие "пометки" в текстах.

- в рсс для разных служб выкладывают чуть измененный материал (чтобы всегда можно было найти "следы")

- в текст HTML подмешивают скрытый код, который "всплывет" на чужом сайте за счет стилей.

- частичная генерация в JS.

Igor.O:
интервал и будешь самым авторитетным ньюсмейкером тогда?

будеш самым забаненым ....

tolik777:
Так что мое ИМХО: даже если вы написали статьу и Яндекс проиндексирует ее первым на вашем сайте, то еще нет 100% гарантии, что потом ваш сайт не выпадет из базы и уже ваш сайт станет проиндексированым позже, чем сайт с плагиатом.

а разве, это кто-то утверждает?

Разработчик,

Верно. Кешируется то, что робот схавал. Вопрос только как давно.(?) У яши, да и у гуглера просто не хватит сил, чтобы в один момент времени перечитать все сайты. А если между такими реиндексами будет время, скажем 1-2 дня, то построенные на таком принцыпе "плагиаторы" - просто нелепы.

Поэтому сейчас выбран вариант, который реализовать "хватает сил". У кого больше ссылок на статью - то и автор(?).

Логика проста, много ссылок - значит больше заметили, - а значит там наиболее интересно.

Вопрос авторства и первоисточника - вопрос не для ПС, она (пс) должна просто найти то что просили, и при этом быстро и , повозможности, качественно.

Разработчик:
Так быстро - не стырят)

Пусть 1 раз в час, но все страницы всех сайтов.

1. Не все сайты обрабатывают ошибки 304/305.

2. Робот ходит по разным сайтоам с разной частотой.

3. Интенсивность обновления сайтов - различная.

В таки условиях привязка к любым временным параметрам невозможна.

Данил:
Можно использовать в расчете релевантности...

Если они попробуют это делать, их просто "за......" юристы серьезных компаний.

Яша, как и другие ПС, не должны пытаться взять на себя роль суда.

Разработчик:
По дате индексации метод определения первоисточника не устраивает?

Ага, если заставить бот перечитывать все сайты с интервалом в 5-10 сек. =)))

Данил:
Правы, тем более, что позже ПС будет легко определить плагиат...

Зачем ПС этим знаиматься?

Вук,

1. Этим просто неудобно пользоваться.

2. Сколько там ссылок? Есть слова Садовского, что документ с 200 ссылками индексироваться не будет(?).

3. Просто гора ссылок, на архивы, которые нужно читать отдельно. Вам нравится самому такой подход?

Вук,

Для начала послушайте, то что Вам сказал Разработчик. Плохого не посоветует.

На счет яши - он говорит, что ему интересны сайты с оригинальными материалами или сервисами доступа к материалу(утрированно). Судествует кучи сайтов, которые просто у себя собирают RSS с других сайтов, но делаю удобный интерфейс доступа.

В Вашим случае (тольок без обид) - кривой сайт

_ttp://www.marketelectro.ru/biblio/normativ/ - это же кошмар юзера

ужасно исполнен

_ttp://www.marketelectro.ru/articles/problems/article_0304.html

Хотя бы ляпы уберите.

Все будет хорошо, если Вы возьметесь за работу и сделаете все нормально. Такой сайт стыдно показывать широким массам.

PS Только не нужно ссылаться на то, что таких "кошмаров" полно в сети, если конечно Вам не хочется поплнить их список.

Грибо:
Да, странички строятся динамически, сайт построен на CMS mambo, что поделать... сайт не я делал..

Так работа над продвижением сайта с этого и начинается. Проверка хостинга, движка/cms, и т.д.

Лично я не беру в работу сайты которые имеют в этом кривизну (стараюсь чтобы сайты были без cms или имели гибридную схему). Или клиент согласится на реконструкцию, либо мы не договорились.

Иначе тяжело говорить о результатах.

Всего: 4849