Общие признаки распознавания дорвеев поисковыми системами

greenwood
На сайте с 08.09.2003
Offline
519
#131
юни:
greenwood, уходить надо с myie

низя ... :)

он пока гугле не продался ...

eN_Slon
На сайте с 13.02.2007
Offline
159
#132
greenwood:
низя ... :)
он пока гугле не продался ...

телнет и только телнет :)

Парсинг, граббинг, автоматизация всего что вы можете сделать в браузере(и не только) сами. Любое кол-во, любые защиты.
5
На сайте с 08.05.2006
Offline
105
#133

имхо ботам пофиг на то какой javascript, шифрованный или не шифрованный, врятле стали с нуля писать движок чтобы рендерить html и жабоскрипт, просто взяли webkit (http://webkit.org/projects/javascript/index.html) или gecko (http://www.mozilla.org/newlayout/) и заточили под свои нужды. Выполняется в браузере, будет выполняться и ботом, основанном на браузерном движке, а то что mouseover пока что не отслеживается так это дело времени.

booch
На сайте с 06.03.2007
Offline
125
#134

gecko частенько выползает с яндековской подсети

Идея года! Такого в онлайн играх ещё не было. (http://ams-ter.mybrute.com) Перспективный блог (http://seoamster.ru)
Добрый дорвейщик
На сайте с 11.12.2007
Offline
83
#135

Многие из высказывающихся считают, что редирект палится яндексом по факту, через тулбар (я до недавнего времени тоже был в их числе). В рамблере же нет тулбара, а разница жизни дора с редиректом и без тоже наблюдается ;).

Вообще... сдался вам этот редирет? И с безредиректными проблем хватает 😂.

5
На сайте с 08.05.2006
Offline
105
#136

1. http://www.google.ru/search?q=google+quality+rater&um=1&complete=1&hl=en&safe=off&rlz=1B3GGGL_enRU259RU259&ndsp=20&ie=UTF-8&sa=N&tab=iw Там на некоторых сайтах есть скрины и топики за 2005-год, там народ спалил по реферерам, сейчас интерфейс переделали и реферер не передается. Дорвеи однотипные, еще один добавочный критерий в 2. и 3. вносит человек, после чего на основании нескольких факторов доры выносятся нах из индекса. Да, и кстати там не один человек оценивает а несколько.

2. http://www.google.ru/search?q=decision+tree&sourceid=navclient-ff&ie=UTF-8&rlz=1B3GGGL_enRU259RU259&aq=t

3. http://www.google.ru/search?q=neural+network&sourceid=navclient-ff&ie=UTF-8&rlz=1B3GGGL_enRU259RU259

курите наздоровье, палю тему как доры пачками из выдачи вылетают ;-)

5hark добавил 14.02.2008 в 15:27

цитата из книги:

The classifiers discussed in this chapter learn how to classify a document by being
trained. Many of the other algorithms in this book, such as the neural network you
saw in Chapter 4, learn by reading examples of correct answers. The more examples
of documents and their correct classifications it sees, the better the classifier will get
at making predictions. The classifier is also specifically designed to start off very
uncertain and increase in certainty as it learns which features are important for mak-
ing a distinction

видимо у яши и других поисковиков нет таких возможностей по наему обучателей нейронных сетей как у гугла или они это внутри делают, не афишируя. в любом случае за всем этим стоит математика и статистика, а не тупо ручной бан по стуку как тут упомянули ранее

[Удален]
#137

Ихмо главный фактор - текст, + возможно внутренняя перелинковка играют важную роль в продолжительности жизни дора.

H
На сайте с 23.01.2007
Offline
90
#138

У меня первый опыт создания дорвеев вышел неудачным, в яндексе прожили всего один ап, рамблер ещё не проиндексировал, только гугл пока не банит.

[Удален]
#139
hitboy:
У меня первый опыт создания дорвеев вышел неудачным, в яндексе прожили всего один ап, рамблер ещё не проиндексировал, только гугл пока не банит.

один ап - это дня 3 ? Не мало :) Так что опыт не такой уж и неудачный...

H
На сайте с 23.01.2007
Offline
90
#140
VipRaskrutka:
один ап - это дня 3 ? Не мало :) Так что опыт не такой уж и неудачный...

да 3 дня, но проиндексировано было по 1-3 страницы, так что трафу было мало

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий