Bor-ka

Bor-ka
Рейтинг
256
Регистрация
16.11.2004
webdev, seo, ceo
Sergey_Z:
а о тематике документа.

скорее о его тематикаХ

Bloody dude:
Веду сайт, который генерирует контент.

класс, он сам генерирует? тматический? и уникальный :) сорри за иронию, но я тоже хочу себе сайт, генерирующий хороший контент :)

и то, что Вы появляетесь на 3-4 дней выше копиров ни о чем не говорит, может у Вашего сайта вИЦ большущий?

Егор:
Т.е. я продвигаю "хлеб"

и

Егор:
я разбавляю сайт "вафлями"

логично, все это пищевые продукты, получите увеличение тематики.

Bloody dude:
В том-то и дело, что я уверен в обратном

а на чем основывается Ваша уверенность? Яндекс обладает телепатией и ходит первым в гости к автору контента?

Bloody dude:
Совершенно распространенная ситуация, правда?

правда

Bloody dude:
Но если у ПС есть фильтры на содержание линков и их качество,

здесь поподробнее

Bloody dude:
что мешает сделать фильтры контента

здесь поподробнее

Bloody dude:
По крайней мере, по высокочастотникам написать программу для этого можно

стоп, а кто говорит о высокочастотниках? Статью "влияние погоды на марсе на размножение кроликов" (с) нельзя назвать высокочастотником.

Bloody dude, а Вы уверены, что Яндекс проиндексируем первым именно первоисточник информации? Может он его через сутки проиндексирует, кога инфу растащат на 1000 сайтов?

Егор:
По дате?

дате чего? индексации? первой индексации? или дате документа (абсолютно неактуальные значения)

Bloody dude:
Ну, в большинстве случаев она не так уж и сложна

расскажите, пожалуйста, алгоритм определения

Bloody dude:
То есть, на мой взгляд, самый корректный и правильный путь для поисковиков - решить, каким образом определять первоисточник информации.

имхо, задача не решаема. это не могут решить люди, а Вы хотите машину это заставить делать. В один день вышло 10 одинаковых книжек в разных обложках 10 авторов, вопрос - кто у кого стыбзил?

тогда крупные вероятно будут описаны в каталоге и тематика им будет задана человеком, а все остальные попадут либо в автотематику, либо будут считаться нетематичными.

UPD: я долго думал над определением тематичности документов, думаю такое вот весовое определние вполне имеет право на реализацию. Причем определение тематики может происходить не только и не столько для сайта, как для документа (ресурсов правда потребуется поболее).

Всего: 2019