ну Вы слишком страшный пример привели :) меня больше интересовало определение тематики документов несколько другого типа. Естественно прикладное применение планируется не для ПС :)
поведение использовать не могу, т.к. не ПС.
Nikitoz, большое спасибо за материал!
сайт или страница сайта?
именно так. на счет северной америки не уверен.
угу
только все этиматики имеют определенные соотношения для конкретной страницы.
в общем ушел писать алгоритм и его реализовывать в небольшой тестовой программной модели.
вполне возможно, однако думаю Яндех работает над этим.
угу, оказывается в одной ветке я активно участвовал, но ничего не помню. читаю как в первый раз свои сообщения :) вот что значит была пора защиты диплома :)
greenwood, действительно, по поиску нашел несколько топиков:
/ru/forum/81156
/ru/forum/75928
/ru/forum/51705
ушел читать
я предполагаю, что тематика комплексное понятие, например документ на 40% туризм, на 20% отдых и на 10% бизнес к примеру. возможно такой подход ошибочен, хочется это обсудить.
да как угодно, нужно определеить некое соотношение текста одной или нескольким тематикам.
думаю нет (оно хоть на сколько то %-в соответствует некой тематики), хотя здесь тоже нужно смотреть в контексте определенных методов определения.
думается это сайты женской тематики (красота, косметика, шмотки) или забогорные.
Hekcfy,
какое расширение файлов? они (расширения) ассоциированы с PHP?
..... справок не дает. Спроси у Яндекса :)