Mr_Promoter, нет точных алгоритмов по кластеризации текстов. НЕТУ!!! Будет... ну вот когда я институт закончу и напишу докторскую по этой теме, срублю за этот бабла, вот тогда все будет в шоколаде :)
неверная трактовка. Не АДСЕНС определяет, а операторы, которые добавляли этот сайт в адсенс! И то... сейчас адсенс мне показывает про оффшорные компании... :)
это совсем не довод!!! И чтобы войти в систему адсенс, там операторы своими глазками определяют тематику сайта :)
Mr_Promoter, ну если обратиться к гугле, то у него морды РУЛЯТ :) Несостыковочка :) И где написано, что гугль определяет тематику? Ткните плиз неразумного... А то недавно помню был спор о том, что и Яндекс давно решил задачу кластеризации :)
и не будет еще лет 5 точно :) Ибо кластеризация - сложнейшая штука и не родился еще человек, способный ее решить :)
Не продается. Ни модуль. Ни готовая спамилка.
topol, гы-гы :) хостинг rusonyx. Самый дешевый тарифный план на vps :) А шустрый, потому как эвристический алгоритм. И никакого С++, чистый пхп.
эээээ.... А глупый вопрос можно? Проиндексиные страницы показываются после апа? Никогда не думал над этим, а тут вот прям не дождусь...
а никто и не говорил, что это велосипед :) Данного уровня распознавания вполне достаточно, дальше ковырять смысла нет да и желания тоже. Это всего лишь маленькое звено в одной большой системе :)
90% картинок такого вида распознает. Там просто большая часть алгоритма - эвристика, ибо скорость :) + от шума на 100% не избавиться => погрешности имеют место быть :)
в большинстве png :)