Кривой алгоритм Яндекса по определению первоисточника достал!

123
kbv79
На сайте с 24.03.2007
Offline
167
#11
G00DMAN:
Алгоритм есть и он со временем улучшается. Если на сайте размещаются авторские статьи и у автора есть свой стиль - он будет первоисточником. Если же на сайт заливается тупо "уник" от копрорайтеров, то какая разница, кто там будет выше? :)

Что мне кажется, что анализ каждого сайта такими методами Яндекс просто не потянет..

Delarante
На сайте с 13.07.2008
Offline
69
#12
The WishMaster:
Зачем? В выдаче далеко не всегда нужен именно первоисточник.

Потому-что большинство копипастеров создают ресурсы исключительно для манипулирования поисковыми алгоритмами.

Яндекс это понимает и изворачивается как может дабы понять кто является оригиналом а кто копией...

Delarante добавил 03.09.2010 в 01:41

G00DMAN:
Если на сайте размещаются авторские статьи и у автора есть свой стиль - он будет первоисточником. Если же на сайт заливается тупо "уник" от копрорайтеров, то какая разница, кто там будет выше? :)

Имеется ввиду исключительно стиль подачи контента?

Я думал кроме некой "трастовости" ресурса с этой проблемой больше бороться нечем...

Ваня Хельсинг
На сайте с 26.09.2007
Offline
230
#13
tysson:
если бы все так просто было, этого топика бы не было, и многих подобных

Конечно не панацея. Сам периодически вынужден менять тексты на главных, но всё же частенько помогает.

Качественная работа с репутацией в сети. Ищу постоянных заказчиков (http://webimho.ru/topic/2699/) Отличный хостинг для белых сайтов (http://goo.gl/o2vSB)
G00DMAN
На сайте с 19.04.2008
Offline
122
#14
kbv79:
Что мне кажется, что анализ каждого сайта такими методами Яндекс просто не потянет..

Какими такими? Есть много методов такого анализа, в т.ч. и достаточно простые. Каждый текст все равно обрабатывается, по нему считается куча параметров, и такие вполне могут считаться.

Delarante:
Имеется ввиду исключительно стиль подачи контента?

Имеется ввиду стиль написания текстов конкретным автором. Скорее всего тексты одного автора имеют некие общие свойства, не обязательно уникальные для каждого автора, которые легко просчитываются. Т.е. у текста, после его обработки, появляется несколько специфичных параметров. При определении первоисточника смотрится, сколько страниц с такими параметрами на сайте, если много в абсолютном или относительном выражении, то это скорее всего первоисточник, т.к. автор публикуется именно здесь. Как-то так вроде алго сейчас работает, но может и нет. Наверняка никто не скажет, не очень понятно, как тут можно исследовать. :)

Ну и из этого есть забавный вывод - если для ГС собирать статьи только одного продуктивного журналиста из сети (копипастом), то он с большой вероятностью будет чем-то вроде "сборника авторских текстов" и имеет меньше шансов попасть под АГС.

Определение авторства может быть и сложным. Например, петрозаводские математики разработали какие-то алгоритмы, с помощью которых точно определили у одного из старых текстов авторство Достоевского. Доказали это словесникам и текст уже включили в наследие писателя. :)

Илья Зябрев, AlterTrader Research Ltd. Последние статьи: Об отмене ссылок в Яндексе. (www.altertrader.com/publications38.html)|Поведенческие факторы (формулы) (www.altertrader.com/publications36.html) Жадные алгоритмы Яндекса. (www.altertrader.com/publications20.html)|MatrixNet для «чайников». (www.altertrader.com/publications19.html)
Pavel Medvedev
На сайте с 27.01.2006
Offline
166
#15
G00DMAN:
если для ГС собирать статьи только одного продуктивного журналиста из сети (копипастом), то он с большой вероятностью будет чем-то вроде "сборника авторских текстов" и имеет меньше шансов попасть под АГС

Как пирожки и в АГС и в бан разлетаются такие авторские сайты, даже с уником от одного копирайтера. Видно если оно так и есть как написано, то это далеко не самый приоритетный из параметров в оценке сайта.

Консультирую по SEO. Опыт c 2005: окна топ1,Ашан,Фишки,Спортс и др. Пишите в FB.
G00DMAN
На сайте с 19.04.2008
Offline
122
#16

sni, при чем тут копрорайтеры? Я про журналистов писал. :)

Вы подумайте, как составляет тестовую выборку Ашманов и что делать Яндексу, чтобы получить по этому критерию приличный показатель по честняку. Тогда все может получиться с ГС. :)

[Удален]
#17

А у Яши есть алгоритм определения первоисточника? 🍿

Расскажите об этом сайтам СМИ, которые в 90% случаев стоят внизу копипастеров.

Rapidmann
На сайте с 18.11.2008
Offline
66
#18
totalitarist:
Если в прошлом году и ранее алгоритм определения первоисточника у Яндекса был одним из лучших, то сейчас ситуация значительно изменилась.

В прошлом году у него такого алгоритма и в помине не было. Только в этом яндексоиды писали у себя в блоге, что всерьез займутся развитием алгоритма или формулы, или чета там еще, для наилучшего определения первоисточника. Раньше об этом даже никто и не заикался.

vinantonie:
по опыту скажу, что первоисточником считается тот сайт, контент на котором был быстрее проиндексирован поисковиком.

Уверены что он считается первоисточником и будет выдаваться выше всех остальных? Пусть даже и так - гипотетически он будет считаться источником, но на практике первым будет необязательно этот "первоисточник".

medea:
возможно, яндекс и умеет определять первоисточник, но это не значит, что он должен его выше ранжировать )

+1. Совершенно верно подмечено. Выше пойдет ресурс где есть еще какая-либо информация по теме, или куда перешло значительно больше посетителей с поиска если он был ниже остальных сайтов по этой новости ранее, в конце концов тот ресурс, у которого выше трастовость так называемая...

praide:
ИМХО у него никогда не было алгоритма по определению первоисточников. И не скоро будет, если будет....

Есть и они об этом писали в своем блоге. Другой вопрос, что он может не на 100% определяет выдачу, ведь это в принципе логично. Кроме того что сайт первоисточник накладывается еще куча параметров.

Ваня Хельсинг:
А вы не пробовали, сразу после заливки статьи, тупо ссылочку на статью в ЖЖ например кинуть? Попробуйте... ;)

А почему бы не в Я.ру? Вроде там индексация мгновенная внутри сервиса, а значит и эта ссылка ему попадется в считанные минуты. Да и можно пойти дальше - репост пресс-релиза текста на 20 фришных блого-платформ.

Блог где ненавидят рекламу VTYC.ru (http://www.vtyc.ru) Сайтик про девайсы и интернеты всякие (http://www.itw.su)
kbv79
На сайте с 24.03.2007
Offline
167
#19
G00DMAN:
Какими такими? Есть много методов такого анализа, в т.ч. и достаточно простые. Каждый текст все равно обрабатывается, по нему считается куча параметров, и такие вполне могут считаться.
Имеется ввиду стиль написания текстов конкретным автором. Скорее всего тексты одного автора имеют некие общие свойства, не обязательно уникальные для каждого автора, которые легко просчитываются. Т.е. у текста, после его обработки, появляется несколько специфичных параметров. При определении первоисточника смотрится, сколько страниц с такими параметрами на сайте, если много в абсолютном или относительном выражении, то это скорее всего первоисточник, т.к. автор публикуется именно здесь. Как-то так вроде алго сейчас работает, но может и нет. Наверняка никто не скажет, не очень понятно, как тут можно исследовать. :)

Ну и из этого есть забавный вывод - если для ГС собирать статьи только одного продуктивного журналиста из сети (копипастом), то он с большой вероятностью будет чем-то вроде "сборника авторских текстов" и имеет меньше шансов попасть под АГС.

Определение авторства может быть и сложным. Например, петрозаводские математики разработали какие-то алгоритмы, с помощью которых точно определили у одного из старых текстов авторство Достоевского. Доказали это словесникам и текст уже включили в наследие писателя. :)

Количественные методы, конечно, простые по своей сути, но все-таки требуют определенных мощностей. Яндексу придется увеличить свои ресурсы минимум в 2-3 раза.

Кроме того, одно дело когда анализируют Шолохова-Достоевского, а другое - массовый анализ рядовых пользователей Интернета.

Mefis
На сайте с 11.06.2010
Offline
33
#20
G00DMAN:
Алгоритм есть и он со временем улучшается. Если на сайте размещаются авторские статьи и у автора есть свой стиль - он будет первоисточником. Если же на сайт заливается тупо "уник" от копрорайтеров, то какая разница, кто там будет выше? :)

Какая разница - свои статьи, собственноручно написанные или написанные проф. копирайтером спецом для данного сайта? Или Яндекс настолько продвинулся что теперь выкупает стиль написания контента?

Яндекс это русский поисковик, а это многое значит. В буржунете напротив, авторские права это очень серьёзно, потому Гугл подходит к этой проблеме посерьёзнее.

Качественный хостинг в Германии на SAS дисках (http://www.dashost.com/)
123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий