Приоритет при склейке

123
E
На сайте с 05.10.2005
Offline
172
#11
aka352:
По логике тот, что был создан раньше

Да, скорее всего, главный фактор - временной. Я однажды, не дожидаясь, пока новый домен зарегистрируется и пропишется в ДНСах, дал ссылку на технический адрес сайта, и Яндекс его поймал. Давно уже все ссылки в сети до единой ведут на главный домен, а Яндекс все знай себе выдает технический.

Кстати, вопрос по теме. Как будет правильнее написать robots.txt для устранения этого недоразумения?

UserAgent: *

Host: главное_зеркало.ru

UserAgent: *

Host: www.главное_зеркало.ru

UserAgent: *

Disallow:

Host: www.главное_зеркало.ru

открытая многоязычная словарная база (http://tolmacz.ru)
pole
На сайте с 03.05.2005
Offline
53
#12
aka352:
Jet, не будут выводиться до тех пор, пока есть оригинал.
Дубли из базы не удаляются, они просто не выводятся.

Я провожу обмен бизнес-статьями. Как сделать так, чтобы их не склеили?

Вообще, что является главным критерием склейки?

- название html файла?

- title?

- meta?

- тексты ссылок в статье?

- сама статья?

Если всё, кроме текста статьи разное, то что? Я будет посимвольно сравнивать?

RU-CENTER - сила! (http://www.nic.ru/)
T.R.O.N
На сайте с 18.05.2004
Offline
314
#13

pole,

Вы говорите о полной склейке или о "нечетких" дублях?

Основным критерием является текст статьи (html подавляется)

Если одинаковые статьи размещены на различных сайтах, это еще не повод для их склейки.

Имхо, существует некое "критическое количество" одинаковых стариц, после которого начинается склеивание, или удаление/занижение дублей.

От воздержания пока никто не умер. Хотя никто и не родился! Prototype.js был написан теми, кто не знает JavaScript, для тех, кто не знает JavaScript (Richard Cornford)
A.Perez
На сайте с 04.10.2005
Offline
55
#14

то есть два домена должны в какой то определенной степени дублироваться.. а если зеркалится только одна страница? с сайта?

Бесплатный трафик (/ru/forum/176138)
T.R.O.N
На сайте с 18.05.2004
Offline
314
#15

A.Perez,

а если зеркалится только одна страница? с сайта?

Может быть расценена как дубликат. Тогда индексироваться будет тольок одна, которая стрше. (Но такое наступает, имхо, когда количество дублей,значительное)

pole
На сайте с 03.05.2005
Offline
53
#16
T.R.O.N:
A.Perez,
Может быть расценена как дубликат. Тогда индексироваться будет тольок одна, которая стрше. (Но такое наступает, имхо, когда количество дублей,значительное)

На меня сейчас ссылается порядка 20 почти одинковых бизнес-статей с разных сайтов. Но если смотреть тех, кто на меня ссылается через ЯБар, то показывается всегда одна-две статьи. Причём каждый раз (раз в два дня) разные. Типа одни статьи на меня не ссылаются, а другие нет. Т.е. их вообще нет в ссылающихся страницах. Потом одни появляются, а другие пропадают. Потом снова наоборот. И такая чехарда постоянно. В чём может быть причина?

M
На сайте с 16.11.2005
Offline
1
#17
espada:

UserAgent: *
Disallow:
Host: www.главное_зеркало.ru

Правильнее :


UserAgent: *
Disallow:

UserAgent: Yandex
Disallow:
Host: www.главное_зеркало.ru

Директива Host не входит в стандарт robots.txt и поддерживается только яндексом

Snake
На сайте с 18.06.2004
Offline
148
#18

Да T.R.O.N, абсолютно прав.. эксприменты показали:

1. Страница которая старше попадает в базу и идет основной, а дубли выкидываются.

2. Самое интересное: страница которая меньше(по размеру) считается основновной в том случае если дата одинакова!(Здесь можно понять янексоидов.. они же борються за кол-во полезной инфы с базе, и нафига хранить документ больший по объему)

ЗЫ: Кстати ИМХО

Avatar
На сайте с 18.05.2003
Offline
168
#19

А я вот полагаю, что в автоматическом варианте и без роботс.тхт главным вполне могут выбрать тот, у которого больше веса (ссылок извнек примеру).

Во всяком случае зеркала с www и без у меня похоже именно так выбирались (роботса не было)

SS
На сайте с 03.09.2004
Offline
141
#20
А я вот полагаю, что в автоматическом варианте и без роботс.тхт главным вполне могут выбрать тот, у которого больше веса (ссылок извнек примеру).

Да, примерно так я тоже полагаю.

Только иногда они спонтанно расклеиваться умеют (были прецеденты), так что с роботсом оно как-то понадежнее.

«Клянусь своей жизнью и любовью к ней, что никогда не буду жить ради другого человека и никогда не попрошу и не заставлю другого человека жить ради меня» (с) Джон Галт
123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий