Nikitoz, большое спасибо за материал!
сайт или страница сайта?
именно так. на счет северной америки не уверен.
угу
только все этиматики имеют определенные соотношения для конкретной страницы.
в общем ушел писать алгоритм и его реализовывать в небольшой тестовой программной модели.
вполне возможно, однако думаю Яндех работает над этим.
угу, оказывается в одной ветке я активно участвовал, но ничего не помню. читаю как в первый раз свои сообщения :) вот что значит была пора защиты диплома :)
greenwood, действительно, по поиску нашел несколько топиков:
/ru/forum/81156
/ru/forum/75928
/ru/forum/51705
ушел читать
я предполагаю, что тематика комплексное понятие, например документ на 40% туризм, на 20% отдых и на 10% бизнес к примеру. возможно такой подход ошибочен, хочется это обсудить.
да как угодно, нужно определеить некое соотношение текста одной или нескольким тематикам.
думаю нет (оно хоть на сколько то %-в соответствует некой тематики), хотя здесь тоже нужно смотреть в контексте определенных методов определения.
думается это сайты женской тематики (красота, косметика, шмотки) или забогорные.
Hekcfy,
какое расширение файлов? они (расширения) ассоциированы с PHP?
..... справок не дает. Спроси у Яндекса :)
есть, сайты не валялись.
со стороны самого сайта в базе главная страница середины октября + постоянно "вчерашняя" от быстроробота.