У меня может развиться комплекс неполноценности -- неужели я задал такой глупый вопрос :)
60 просмотров, ни одного мнения.
Или никто не интересуется с каких поисковиков по каким словам пришли? Возможно, все используют desktop-парсеры логов?
:) Это понятно. Тем не менее, точной (или хотя бы коррелирующейся с мнением поисковиков) формулы мы не вывели. А жаль.
Вывод: мой способ подсчета (37.5%) ничем не хуже всех остальных.
Именно читал, со всем вниманием.
Речь иногда идет не о сравнительном анализе наш/конкурент, а собственно о оптимизации (т.е. подсчете своего). С прицелом на правильное понимание поисковиком.
В этом я вижу основную проблему -- как отнесется поисковик к моим подсчетам.
Попробовал этот на аналогичном примеру английском тексте:
"mother write letter.
mother write book.
mother write newspaper." (3 предложения)
плотность фразы "mother write" -- 14,3%
при добавлении еще одного предложения: "father write letter." (стало 4 предложения) плотность искомой фразы неожиданно не упала, а возросла до 20%.
Мое смущение относительно алгоритма подсчета также возросло :)
И мне бы того хотелось. Вопрос в том, как их подсчитать, чтобы не прогадать :)
Простите за бестактность, что есть PAN?
А это уже интересно. Стоит обдумать как одну из версий.
P.S. вобще-то меня больше интересует не столько Яндекс, сколько Гугль. И английская морфология. Что можно отметить в этом ракурсе?
Очень удачно, что веду диалог именно с вами :)
В вашей подписи есть линк на кучу софта, среди прочего несколько анализаторов плотности. Их результаты анализа аналогичного текта колеблятся от 33% до 100%. Это раз.
Кроме того, меня смущает что при построении списка возможных фраз не были учтены знаки препинания, т.е. фактически анализ проведен без разбивки на предложения. Надеюсь, поисковики поступают также :)
Вот и я об этом.
Весь текст я привел -- три предложения (для простоты).
Искомая фраза (запрос) -- "мама мыла".
У меня получается 37.5%
Всего 2х-словных фраз: 8
Встречается: 3
Что я делаю не так?
Если можно -- поподробнее насчет "относительности". Какие есть варианты?
З.Ы. Я грешным делом считал, что плотность фраз зависит исключительно от фразы и текста, т.е.отношение количества использования фразы к общему количеству фраз текста. Вот с вычислением последнего и проблема.