Склейка текста

BUFO
На сайте с 15.06.2003
Offline
224
792

Хочу обсудить такой вопрос. Склейка в русских поисковиках происходит по первому зарегенному документу или как? Пытался в Яндексе найти пару нормативных документов, чтобы выложить на сайт - сплошная бодяга на народе, какая-то закодированная в коде и не копируется без ручной переделки. Хотя документы - общедоступные :dont:

Back Door Man
На сайте с 20.08.2003
Offline
151
#1
Склейка в русских поисковиках происходит по первому зарегенному документу или как?

Нет, иначе слишком многое бы склеилось.

По полному совпадению текстов многих документов сайта(за вычетом HTML, разумеется) и структуры сайта.

Дмитрий
М
На сайте с 17.11.2003
Offline
121
#2

Скажите, пожалуйста, если такие наблюдения были.

А как много времени надо на "расклейку" :)

Сейчас на сайте много дублированных файлов, копии которых в ближайшее время будут удалены. КАк скоро в поисковиках будут находится именно те файлы, которые нужны, а не дубликаты?

С уважением, Мадина
BUFO
На сайте с 15.06.2003
Offline
224
#3
Сейчас на сайте много дублированных файлов, копии которых в ближайшее время будут удалены. КАк скоро в поисковиках будут находится именно те файлы, которые нужны, а не дубликаты?

Речь шла о текстах, а не файлах. Просто есть большое подозрение что к примеру Яндекс выдает по одному идентичному документу а другие убирает из выдачи, более того, кто-то говорил что из выдачи могут убираться и страницы содержащие фрагменты зеркального текста из-за чего и возник вопрос

М
На сайте с 17.11.2003
Offline
121
#4
Речь шла о текстах, а не файлах.

Пардон, я тоже имела в виду файлы с одинаковыми (совершенно) текстами, но с разными названиями.

Сейчас в выдаче - преимущественно старые. Все эти файлы имеют другие названия.На сайте старых ссылок на них уже нет. Приходит либо с поисковиков, либо по старым внешним ссылкам

Back Door Man
На сайте с 20.08.2003
Offline
151
#5

Нечеткая склейка разработана теоретически (http://www.dialog-21.ru/direction_fulltext.asp?dir_id=15539&forum_id=&parent_message_id=), но, насколько мне известно в Яндексе не реализована.

Свидетельство тому - слишком много повторяющихся документов: http://www.yandex.ru/yandsearch?text=%C3%CE%D1%D2+10032-80+&stype=www

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий