Продвинутые анализаторы контента - это утопия из той же серии, что и машинный перевод. При существующем темпе и векторе развития технологий, мы очень не скоро этого дождемся.
Пока же гугл, на мой взгляд, имеет самый адекватный подход к учету ссылок. Система, при которой ссылки с сайтов порталов, с узко специализированных сайтов, с блогов и гостевых книг учитываются по разному - имеет право на жизнь. В выдачу попадают, как сайты узко тематические, так и сайты аггрегаторы контента. Также не забыты недавно появившиеся, моментально ставшие популярными, сайты, ссылки на которые лавинообразно растут откуда только можно (блоги, гостевые, итп).
Конечно, приходится бороться со спамом, но 1000 китайцев решает :)
Есть такое понятие, как нечеткие дубли. Технология имеет широкий круг применения - выявление зеркал сайтов, поиск плагиата, детектирование спама.
Кое что есть в статье Сегаловича
Также ищите по ключевым словам - шинглы, десятисловие, нечеткие дубли
Я в отличии от некоторых никем не горжусь :), и вопросы не задаю... просто констатирую факты.
Смотрим сюда , по запросу не окученому оптимизаторами вполне показательный результат. Не завидую я ни жителям НН, ни вам, ни тем более Томам Крузам, Кириенкам и прочим Траволтам. Насчет конституции читайте тут и не забудьте пробить сайт в каталогах, чтобы не было больше на форуме таких тем, не в кассу :)
P.S. что мне держать при себе, я сам разберусь
Неа, пробить remobil в каталогах, будет то же самое.
Через пару апдейтов слетит он, если не будет работать.
Вы-то учитесь, только другим мозги не парьте. У меня люди, которые занимаются этим, (особенно если это сайт их клиента), вызывают обратную реакцию.
P.S. - не люблю саентологов и проч. сектантов
Надо учитывать, что для того чтобы сработала директива hosts, надо чтобы сайты были на одном IP
А линкатор, что по Вашему?
На одном домене, яху хавает бесконечный дорвей уже месяца 4 как, обычно со скоростью 0,4-0,7 Mbps. Но стоит серваку ребутнуться - график резко проваливается и восстанавливается в течении нескольких часов. А на прошлой неделе хостер сервак раз десять ребутнул за ночь, и график плавненько начал падать, вплоть до 20 kbps.
Можно брать способ на вооружение -)
Афигеть картина. 6 мужиков, в субботу вечером, трудятся над 90 сайтами, и ждут, ждут ответа ... Но ответа нет. И вот, с pgp диска, достаются пароли к платникам ... страшно представить -)
Джонни, давай лучше я вам пароль к платнику дам, а ты ссылку поставишь? :)
А то девушку жалко, ведь судя по тому, что у тебя 18 сайтов, вас там пятеро сидит ... :D
Тоже сталкивался с ситуацией, когда морда вылетала только по одному запросу, обычно через 1-2 апдейта все становилось на место. Интересно сделать поиск по сайту "валенки б у", будет ли там главная вообще. Если нет - имхо довод в пользу кластера.
С другой стороны, последнее время все чаще и чаще сталкиваюсь с пессимизированными тем или иным образом сайтами. Также слышал, что Яндекс применяет санкции за быстрое появление большого кол-ва ссылок. Имея 7 страницу по запросу, в топе которого сайты с более слабыми ссылками - есть повод задуматься.
Имхо надо ждать пару апдейтов, смотреть за ситуацией. И еще раз проверить сайт, может дело в какой-то мелочи.
Если есть желание можешь скинуть сайт в личку, посмотрим вместе