Достижения Яндекса в борьбе с дублями контента

1 23
ZoomY
На сайте с 07.11.2008
Offline
165
#21

farlow, сайт-оригинал может иметь полный функционал для работы, сайт-копия - только клонированный текст без функционала, соответственно неверное определение первоисточника может привести к тому что пользователь будет в принципе не в состоянии найти то, что ему надо, а будет находить только пустышки с таким же текстом.

Кроме того вопрос авторского права я тоже считаю важным - в примере когда с сайта воруется контент и размещается на других сайтах.

Размещу ваши статьи на сайтах с тИЦ до 1400 по 5$ (/ru/forum/846111) Сейчас многие ищут хостинг за пределами России. Ukrnames - один из лучших вариантов: (http://ukrnames.com/?ref_id=114) и лидер рынка, и привычно, и по-русски, и вне юрисдикции РФ.
Megamozg
На сайте с 25.09.2006
Offline
147
#22
ZoomY:
пользователь будет в принципе не в состоянии найти то, что ему надо, а будет находить только пустышки с таким же текстом.

А разве сейчас все не именно так работает в Яндексе? :)

Не надо курить много китайской травы...
WS
На сайте с 17.11.2010
Offline
25
#23
Megamozg:
Это уже будут не дубли. А если Яндекс определит их как дубли, то это проблемы алгоритма Яндекса.

Ну смотрите есть три разных сайта в каждом одинаковый текст описания нового фильма (причем нигде не написано что это фильм и Я ещё не знает что это фильм, скажем описываются похождения вампира в ночной Москве) и 3 разные ссылки скачать полную версию, скачать превью и купить диск.

С точки зрения любой ПС это будет три одинаковые статьи про вампира и я не могу представить алгоритмы которые сумеют определить что это не дубликаты.

farlow
На сайте с 07.05.2008
Offline
102
#24
ZoomY:
farlow, сайт-оригинал может иметь полный функционал для работы, сайт-копия - только клонированный текст без функционала, соответственно неверное определение первоисточника может привести к тому что пользователь будет в принципе не в состоянии найти то, что ему надо, а будет находить только пустышки с таким же текстом.

хм, так что же ищет пользователь? текст, товар, что то еще?

ZoomY:

Кроме того вопрос авторского права я тоже считаю важным - в примере когда с сайта воруется контент и размещается на других сайтах.

АВТОРСКОЕ ПРАВО? ЕЩЕ ОДИН КОПИРАСТ:?*

farlow добавил 13.01.2011 в 18:58

WhiteSmartFox:
Ну смотрите есть три разных сайта в каждом одинаковый текст описания нового фильма (причем нигде не написано что это фильм и Я ещё не знает что это фильм) и 3 ссылки скачать полную версию, скачать превью и купить диск.
С точки зрения любой ПС это будет три одинаковые статьи и я не могу представить алгоритмы которые сумеют определить что это не дубликаты.

хорошо, а без алгоритмов яндекса вы лично сможете определить какой именно сайт удовлетворяет вашему запросу?

а создать алгоритм, который бы вычленял именно то что нужно вам - думаете очень сложно?

если вы сами сможете для себя сформулировать - что вам нужно, почему яндекс не может?

яндекс конечно сыроват, но мы вроде сейчас про идеологию

Ищу дизайнера, вебмастера
WS
На сайте с 17.11.2010
Offline
25
#25
farlow:
создать алгоритм, который бы вычленял именно то что нужно вам - думаете очень сложно

Что мне не сложно, а что будет искать ЛЮБОЙ пользователь сложно: кому-то нужно заказать DVD c фильмом, кому-то посмотреть превью, а кому-то скачать фильм.

WhiteSmartFox добавил 13-01-2011 в 19:03

farlow:
если вы сами сможете для себя сформулировать - что вам нужно, почему яндекс не может

Потому что пока ПС не имеют искусственного интеллекта к примеру :) Если бы ПС могла всегда понимать что нужно каждому пользователю выдача состояла бы из одного результата. :) В данном случае Яндексу надо было бы проанализировать ссылки, "посмотреть видео" и определить что это не дубликаты, а это пока мало реально.

farlow
На сайте с 07.05.2008
Offline
102
#26

и все таки, если рассмотреть частность,

в данном случае, не вижу необходимости публиковать все дубли

1 23

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий