Допустимая частота употребления слова в документе

1 234
[Удален]
#31
Как писал Lor

Правильно. И ларчик открывается очень просто: нет смысла писать контент с калькулятором в руках, потому-что любой нормальный текст автоматически содержит необходимый процент ключевых слов. Это и учитывается поисковиками при анализе страницы. Сегодня поисковикам уже не надо изобретать велосипед, потому что он уже изобретен - это системы анализа страниц для контекстной рекламы, типа AdSense. Эти методы анализа будут совершенствоваться и конкретный "золотой процент" ключевых слов перестанет играть какую либо роль.

Так вот что такое "необходимый процент" я и пытаюсь понять и описать языком математики. Либо другой вариант, брать чистые, не оптимизированные тексты по каждой группе и вычислять процент ключевых слов, что делать сильно лениво.

[Удален]
#32
Как писал greenwood
забыли только о рапределении ключевых слов на страничке ...
а вообще мои опыты говорят о том,что на 1 к контента невозможно сделать более 4,5 % плотности ключевика не нарушив осмысленной читабельности ( речь идет только о чистом контенте )

1000 килобайт - это примерно 200 слов, по моей 2-ой формуле (кстати там опечатка, результат ещё на 20-ть надо поделить) для такого объёма и получается предельное значение Y=0.049, т.е. 4.9%, что примерно сходится с вашими данными. Значит буду формулу пристраивать в алгоритм и прощай дорвеи :)

greenwood
На сайте с 08.09.2003
Offline
519
#33
1000 килобайт - это примерно 200 слов

не маловато слов будет ?

Lor
На сайте с 28.05.2004
Offline
353
Lor
#34
Так вот что такое "необходимый процент" я и пытаюсь понять и описать языком математики.

Я не думаю, что системы анализа контента просто вычисляют плотность ключевых слов и на основе этого определяют тематику страниц. Тут должно быть все сложнее, потому что необходим учет синонимов, омонимов, стоп-слов, подлежащих, сказуемых, прилагательных и т.д. и т.п. Конечно, сегодня поисковики не столь совершенны, чтобы моделировать человеческое восприятие контента, но это вопрос времени и не очень отдаленного. Опять же: разные языки - разные алгоритмы.

Йопез - форум без модераторов. https://yopez.com
[Удален]
#35
Как писал greenwood


не маловато слов будет ?

Разумеется опечатался, 1 килобайт = 1024 байта =~ 200 слов.

[Удален]
#36
Как писал Lor

Я не думаю, что системы анализа контента просто вычисляют плотность ключевых слов и на основе этого определяют тематику страниц. Тут должно быть все сложнее, потому что необходим учет синонимов, омонимов, стоп-слов, подлежащих, сказуемых, прилагательных и т.д. и т.п. Конечно, сегодня поисковики не столь совершенны, чтобы моделировать человеческое восприятие контента, но это вопрос времени и не очень отдаленного. Опять же: разные языки - разные алгоритмы.

Никто не говорил о кластеризации по темам, я просто хотел примерно прикинуть границу, перейдя которую оптимизатор получает не текст, а баланду сдобренную ключевыми словами.

greenwood
На сайте с 08.09.2003
Offline
519
#37
Тут должно быть все сложнее, потому что необходим учет синонимов, омонимов, стоп-слов, подлежащих, сказуемых, прилагательных и т.д. и т.п.

я раньше так-же полагал ... но пришел к выводу что ничего этого в поисковиках пока нет ... а если и есть то совсем немного в плане может быть каких то их экспериментов ...

так что вы правы .... видимо это в будущем ... если не придумают какое нибудь чудовище типа PR - 2 :)

Lor
На сайте с 28.05.2004
Offline
353
Lor
#38
прикинуть границу, перейдя которую оптимизатор получает не текст, а баланду сдобренную ключевыми словами.

Так оптимизация - это и есть "баланда, сдобренная ключевыми словами", а если без баланды, то это - юзабилити. :)

но пришел к выводу что ничего этого в поисковиках пока нет

А как, по твоему AdSense и rorer.ru работает?

И кстати, если эти ребята(rorer.ru) продадут технологию какому-нибудь поисковику или сделают свой поисковик, то придеться забыть о понятии "затачивание страниц". :)

[Удален]
#39

Интересно, кто из поисковиков в рунете первый предложит подобную технологию. И как это отразится на работе оптимизатора. Ваши ставки.

greenwood
На сайте с 08.09.2003
Offline
519
#40
И кстати, если эти ребята(rorer.ru) продадут технологию какому-нибудь поисковику или сделают свой поисковик, то придеться забыть о понятии "затачивание страниц".
Иногда система ошибается при определении тематики, когда делает выбор между двумя близкими тематиками, например «Автомобили» и «Автозапчасти»,

ничего себе точность в 97 % .... да таких примеров ее лёгоньких микроошибок можно привести тысячи .... всё это скорее носит рекламный характер а не чудеса какого-то таинственного анализатора. Недумаю, что такую лабуду купят поисковики ... у них и самих предостаточно накоплено статистических данных и прочей информации для точного определения тематики ....

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий