скорее о его тематикаХ
класс, он сам генерирует? тматический? и уникальный :) сорри за иронию, но я тоже хочу себе сайт, генерирующий хороший контент :)
и то, что Вы появляетесь на 3-4 дней выше копиров ни о чем не говорит, может у Вашего сайта вИЦ большущий?
и
логично, все это пищевые продукты, получите увеличение тематики.
а на чем основывается Ваша уверенность? Яндекс обладает телепатией и ходит первым в гости к автору контента?
правда
здесь поподробнее
стоп, а кто говорит о высокочастотниках? Статью "влияние погоды на марсе на размножение кроликов" (с) нельзя назвать высокочастотником.
Bloody dude, а Вы уверены, что Яндекс проиндексируем первым именно первоисточник информации? Может он его через сутки проиндексирует, кога инфу растащат на 1000 сайтов?
дате чего? индексации? первой индексации? или дате документа (абсолютно неактуальные значения)
расскажите, пожалуйста, алгоритм определения
имхо, задача не решаема. это не могут решить люди, а Вы хотите машину это заставить делать. В один день вышло 10 одинаковых книжек в разных обложках 10 авторов, вопрос - кто у кого стыбзил?
тогда крупные вероятно будут описаны в каталоге и тематика им будет задана человеком, а все остальные попадут либо в автотематику, либо будут считаться нетематичными.
UPD: я долго думал над определением тематичности документов, думаю такое вот весовое определние вполне имеет право на реализацию. Причем определение тематики может происходить не только и не столько для сайта, как для документа (ресурсов правда потребуется поболее).