Не плагиат! Но как реагируют поисковики?

imho-no
На сайте с 07.04.2008
Offline
186
#31

novitskii,

novitskii:
Регистрация: 11.06.2006
продайте акк, а?

imho-no добавил 24.10.2010 в 15:53

novitskii:
Я склоняюсь к идее о том, что робот может выборочно сверять тексты с некоторыми трастовыми сайтами похожей тематики.

а как определить тематику? это просто что ли?

Ньютон сидел под деревом, тут ему упало на голову яблоко. Он его поднял, вытер рукавом камзола и закусил яблоком портвейн "777"

- про что текст?

1. про англицкого ученого?

2. про фрукты семейства Розовых?

3. про моду 1660-х годов и фурнитуру отделки камзолов?

4. про спиртное?

Я - советский пионер. Надо переводить бабушек через дорогу и Бога - нет. юзаю этот хостинг http://ipipe.ru/?pid=16015 (http://ipipe.ru/?pid=16015). полёт нормальный!
novitskii
На сайте с 11.06.2006
Offline
69
#32
imho-no:

а как определить тематику? это просто что ли?

Могу предполагать по нескольким параметрам.

imho-no:

- про что текст?

1. про англицкого ученого?
2. про фрукты семейства Розовых?
3. про моду 1660-х годов и фурнитуру отделки камзолов?
4. про спиртное?

Про всё по чуть-чуть.

Продаю очень крутой движок для музыкальных сайтов. По вопросам в icq.
I
На сайте с 15.10.2010
Offline
39
#33
novitskii:
Я вот тут на форуме читаю подобные темы и меня все больше и больше мучает вопрос:
вот многие говорят что за воровство контента - банят. А давайте подойдем с другой стороны.
Заходит поисковый робот на сайт, на какую то его страницу. Видит текст.....

Вас мучает техническая сторона вопроса.

Когда я проверяю текст на антиплагиате в программе (а я это делаю всегда) то меня тоже мучают смутные сомнения. За какие-то 1-2 минуты програмка ни ахти какая, на ни ахти каком комьютере, что может просмотреть все тексты интернета? Что-то в это не верится.

Однако программа выдает не только "есть -нет", она выдает даже % схожести.

Техника на грани фантастики. Не знаю как это делается и можно ли этому верить.

Стараюсь не заморачивать свою голову лишними вопросами, у меня и без этого вопросов без ответов - уйма.

администратор сайта PSYCONSULT (http://http://psyconsult.fata-morganaa.ru/) БОНСАЙ (http://bonsai.fata-morganaa.ru/)
strana
На сайте с 25.08.2008
Offline
116
#34

Читаю все примеры о статьях, а никто не упоминает о новостях - ведь дублаж чаще всего встречается на новостных сайтах.

Новости - не предмет авторского права. Авторские тексты - да, фотографии - да, а вот новости - нет. И почему, если "Ежедневник Мухосранска" опубликовал новость о том, что сивая кобыла дворника Петьки объелась апельсинами, а я перепечатал ее на сайте о мире животных, то поисковик должен выбросить страницу с моей перепечаткой из индекса? Для моих читателей новость интересна, но в регионе Мухосранска не живут и на сайт его "Ежедневника" попадут только через поисковик или через ссылку, которую дают перепечатавшие новость сайты.

Или вариант второй. Партнеры большого новостного агенства печатают новости, которые агенство им предоставляет. По большому счету, меняют только заголовок, да и то необязательно. Поисковик должен их всех выкинуть из индекса за копипаст? Нет, конечно, да он их и не выкидывает, а для тех, которые не включает - причины комплексные, а не "копипаст, ерго аут".

novitskii
На сайте с 11.06.2006
Offline
69
#35

Я не интересовался технической стороной вопроса.

Меня смущает то, что такое (выявление копипаста) вообще возможно.

I
На сайте с 15.10.2010
Offline
39
#36
novitskii:
Могу предполагать по нескольким параметрам.


Про всё по чуть-чуть.

в таком случае поисковику надо пройти миллионы сайтов по всем мыслимым и не мыслимым параметрам. (как впрочем и программе "Антиплагиат")

Чем больше параметров, тем больше сайтов.

Однако возмите обратный пример:

вы в поисковике задаете какую-то фразу (смысловой набор слов)

и тут же (за секунды) поисковик выдает вам несколько тысяч, а то и миллионы сайтов, у которых это словосочетания встречаются. Правда поисковики (и гугл (раз уж это раздел про гугл) ) так усердствует, так врет, что в поиске встречаются далеко не на последних страницах такие сайты в которых эти словосочетания вообще не встречаются.

Например:

На фразу:

Ньютон сидел под деревом, тут ему упало на голову яблоко. Он его поднял, вытер рукавом камзола и закусил яблоком портвейн "777" "

Он вам выдаст:

Ньютон велкий физик.

А все таки она вертится!

Ему на голову упал кирпич

Руки вверх!

Камзолы шили из парчи.

Ну и еще полмиллиона сайтов.

В конечном поиске (на последних страницах) может выдать сайт, где будет подчеркнуто:

666 - это подпись дьявола

Курьезы поиска Гугле конечно не сравнимы с курьезами Рамблера :)

Но тема несколько о другом.

novitskii
На сайте с 11.06.2006
Offline
69
#37

Ладно, не будем вдаваться в тех сторону вопроса. Опять таки я просто написал свои мысли по этому поводу.

I
На сайте с 15.10.2010
Offline
39
#38
novitskii:
Я не интересовался технической стороной вопроса.
Меня смущает то, что такое (выявление копипаста) вообще возможно.

100% возможно.

Задайте поиск в Гугле (к примеру) и за секунды (и куда меньше секунд) поисковик выдаст искомую фразу.

Вас смушает, я понимаю что. То что прохождение роботом миллионов сайтов, с сотнями страниц...

Сколько нужно времени роботу, что бы обнаружить сходства?

Вполне возможно что он просто собирает данные, а данные потом обрабатываются машиной, который он просто выдает данные.

Так что это все же технический вопрос.

Но ваше сомнение и у меня возникает.

Я уже выразил его неоднократно.

И как пример:

Повторю:

Если копипайст не приверствуется и даже банится ( как вариант) то каким образом робот распознает разницу:

между злостным копипастом мерзавца, который лямзит текст со всех сайтов на свой

и оправданным копипастом (вынужденным)?

kimberlit
На сайте с 13.03.2007
Offline
370
#39
indan:
Правда поисковики (и гугл (раз уж это раздел про гугл) ) так усердствует, так врет, что в поиске встречаются далеко не на последних страницах такие сайты в которых эти словосочетания вообще не встречаются.
Например:


На фразу:

Ньютон сидел под деревом, тут ему упало на голову яблоко. Он его поднял, вытер рукавом камзола и закусил яблоком портвейн "777" "

Он вам выдаст:

На первом месте эта тема.

I
На сайте с 15.10.2010
Offline
39
#40
novitskii:
Ладно, не будем вдаваться в тех сторону вопроса. Опять таки я просто написал свои мысли по этому поводу.

Конечно. Тем более , если это и побочный вопрос, но он к месту.

и тем более, что и меня смущает, то и вас (я просто не высказал его, а вы высказали)

___________________________

indan добавил 24.10.2010 в 16:40

strana:
Читаю все примеры о статьях, а никто не упоминает о новостях - ведь дублаж чаще всего встречается на новостных сайтах.
....................
. Поисковик должен их всех выкинуть из индекса за копипаст? Нет, конечно, да он их и не выкидывает, а для тех, которые не включает - причины комплексные, а не "копипаст, ерго аут".

Совершенно верно!

Когда я читаю:

Текст должне быть уникальным и только уникальным!

То приведенные вами примеры у меня сразу всплывают в голове. Я тут же задаю себе вопрос:

А НОВОСТИ?

Что? Робот различает текст - Новости и текст - не новости?

Различать могут редакторы сайтов с которых скажем "слямзили" новости.

Они заранее пишут (оговаривают условия ) условия публикации новости на других сайтах.

Но какое дело роботам до этого?

PS.

Это еще один аргумент в сторону того, что роботы не смотрят ; "копипаст - или уникальный текст" и не оценивают сайты по этой выборке.

_________________________________

indan добавил 24.10.2010 в 16:49

kimberlit:
На первом месте эта тема.

Я не говорю о 1 месте.

Вы почитайте ниже.

скажем на 10 странице поиска.

PS.

проверил. 10 страницы нет.

Есть одна страница.

последующие сайты меня привели в восторг: (гугл рулит!)

Анекдоты разные. Часть 2.

Чукча сидит на дереве и пилит под собой сук. Мимо проходит прохожий и говорит: ...... Они: "Приехал кран, поднял, поставил на Камаз, и больше не видели". ...

ПохожиеComfort - Анекдоты

Потянул он за дверцу... и тут же ему на голову свалился куль с песком, ..... А бык его на смех поднял, мол, как это тебя жена и так далее и тому подобное... ...

Только кириллица, без служебных слов и окончаний - Измышления из ВМ

... 2094 эмигрантов 242 эмигрант 2095 яблоко 242 яблок 2096 ааа 241 аа 2097 ...... 3 иформац 42418 ихи 3 их 42419 ицхака 3 ицхак 42420 ически 3 ическ 42421 ...

___________

Раньше я замечал за Гуглом особенность выдавать сотни тысяч сайтов.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий