ФАК - плотность ключевых слов

greenwood
На сайте с 08.09.2003
Offline
519
#71

эко, как euhenio прорвало :)

fireone
На сайте с 07.07.2006
Offline
127
#72
euhenio:
И: лень цитировать другие ответы на тему "достаточно одного включения фразы в текст документа", но ёкарный бабай! ЭТО НЕ ИМЕЕТ ОТНОШЕНИЯ К ОПТИМАЛЬНОСТИ! Да, можно вывести с одним включением. Да можно и без него. НО ОПТИМАЛЬНО ЛИ ЭТО?

И что по-вашему оптимально? Одни вопросы и ни одного ответа. Также как и по вашему мнению вся тема.

euhenio:
Эта x##ня (пардон, "неподтвержденные данные") недостойна называться ФАКом

сделайте лучше.

Нужны люди: пом-ик оптимизатора () и оптимизатор () Вливайтесь в сильнейшую команду страны ;) 89057335033, Александр Шокуров;
ХренРедькиНеСлаще
На сайте с 27.07.2006
Offline
57
#73

Возьмем Яндекс.

И возьмем только по контенту релевантность. Так вот из опытов:

Самая релевантная страница та, где больше ключевикА.

Но!!! Не должно быть никаких других ключевиков, число которых превышает наш (обратите внимание на единственное число!) любимый ключевик.

это для однословных запросов.

Для многословных:

Самая оптимальная та, где число НАЙДЕННЫХ больше.

Но! Число найденных должно совпадать с числом самого частого ключевика.

Данные получены экспериментально по методике Миныча. Не далее как вчера еще раз проверил для народовских сайтов, не имеющих ссылок на них.

Насколько релевантнее тоже можно предсказать и точно подсчитать. И насколько релевантность снижается если мы начинаем другие ключевики на тех же страницах спамить.

Нагдядный пример таков.

На странице 100 слов "репа". И другие слова, но их меньше чем 100. Так вот, сколько там еще других слов: НЕВАЖНО! Важно, что по отдельности нет ни одного, с более чем 100 экземплярами. А сколько вообще слов на странице вообще не важно.

Но если на страницу поместить дополнительно 150 слов "фуфло", то релевантность страницы по отношению к запросу "репа" резко снизится.

В некоторых единицах снизится в sqrt(150/100) раз.

И еще до 7 раз ключевика на странице - тошнота не меняется. Более семи - начинает расти.

🚬

Дайте мне рюмку опоры и мир засветится всеми цветами радуги.
euhenio
На сайте с 21.09.2001
Offline
357
#74

по-моему: по-простому нормально делать около 5% (точнее данные есть, и мои же, но они староваты), а вообще для яндекса надо втыкать в статью Сегаловича "яндекс на ромип-2004". Там очень многое описано.

сделайте лучше.

-не вопрос, делаю: "оптимальная частота или граница частот (мин-макс) существует, ищите ее, найдите и не сдавайтесь". Это лучше, чем говорить про "одно вхождение достаточно".

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
euhenio
На сайте с 21.09.2001
Offline
357
#75

ХренРедькиНеСлаще,

Самая релевантная страница та, где больше ключевикА.

Но!!! Не должно быть никаких других ключевиков, число которых превышает наш (обратите внимание на единственное число!) любимый ключевик.

-с учетом весов слов, не так ли? :) я имею в виду - с учетом idf

ХренРедькиНеСлаще
На сайте с 27.07.2006
Offline
57
#76
euhenio:
с учетом весов слов, не так ли? я имею в виду - с учетом idf

Да,euhenio, конечно.

Уточню, правда, если "репа" это наш запрос и на странице самый частый ключевик. то вес других слов совершенно не важен.

Важен для запросов типа (ключевик1|ключевик2) или (ключевик1 ключевик2)

euhenio
На сайте с 21.09.2001
Offline
357
#77

ХренРедькиНеСлаще, а откуда берутся функции вида sqrt(150/100)? Про перенормировку частот написано у Сегеаловича, но там он некий набор возможных функций приводит. И нормировку по размеру документа, как один из вариантов. Ну и главное, про tf*idf там конкретно написано.

Про "Самая релевантная страница та, где больше ключевикА." - можно конкретный пример или механизм действий? Увы, но слова "по методике Миныча" - сложно применить на практике :)

webcat
На сайте с 19.10.2005
Offline
137
#78
euhenio
а вообще для яндекса надо втыкать в статью Сегаловича "яндекс на ромип-2004". Там очень многое описано

pro-maker эту ссылку уже здесь приводил

http://company.yandex.ru/articles/romip2004.xml

А от себя добавлю ещё пару ссылок необходимых новичкам

Информационный поиск

http://ru.wikipedia.org/wiki/%D0%98%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D1%8B%D0%B9_%D0%BF%D0%BE%D0%B8%D1%81%D0%BA

Релевантность из википедии:

Релева́нтность (англ. relevant) — применительно к результатам работы поисковой системы — степень соответствия запроса и найденного, уместность результата.

Это субъективное понятие, поскольку результаты поиска, уместные для одного пользователя, могут быть неуместными для другого.

Основным методом для оценки релевантности является TF*IDF–метод, который используется в большинстве поисковых систем (как в интернет-поисковиках, так и в справочных системах (MSDN).

Его смысл сводится к тому, что чем больше локальная частота термина (запроса) в документе (TF) и больше «редкость» (т.е. чем реже он встречается в других документах) термина в коллекции (IDF), тем выше вес данного документа по отношению к термину - то есть документ будет выдаваться раньше в результатах поиска по данному термину.

Автором метода является Gerard Salton (в дальнейшем доработан Karen Sparck Jones).

http://ru.wikipedia.org/wiki/%D0%A0%D0%B5%D0%BB%D0%B5%D0%B2%D0%B0%D0%BD%D1%82%D0%BD%D0%BE%D1%81%D1%82%D1%8C

ХренРедькиНеСлаще
На сайте с 27.07.2006
Offline
57
#79
euhenio:
а откуда берутся функции вида sqrt(150/100)?

Это просто Миныч дал формулу.

euhenio:
Про "Самая релевантная страница та, где больше ключевикА." - можно конкретный пример или механизм действий? Увы, но слова "по методике Миныча" - сложно применить на практике

Если бы это было раньше, то можно было бы проверить запросами вида (ключ1::вес1|ключ2::вес2) меняя веса, сейчас яндекс это не позволяет, мы исхитрились по своему. но это уже секрет фирмы. без санкции Миныча раскрыть не могу, а его не будет до 1 ноября.

В общем, что могу написать, то написал...

Вы можете немного по топорному, но проверить так:

сделать много страниц на народе, подобрать из переколдовки некоторый набор слов с определенной плотностью заполняющий некоторый диапазон весов (как можно более широкий).

Затем сгенерить странички содержащие 1,2, 3,4, 5, 6,........1000 уникальных ключевиков для интернета.

Разбавить эти странички одним и тем же набором слов, который подобрали из переколдовки (по одному слову). И залить эту смесь на народ, случайным образом переставляя ключевики (от их положения для однословных запросов ничего не зависит).

Затем анализируете запросы (ключ1|ключ2), где ключи взяты из вашего набора переколдовки и строите диаграммки ступенек как у миныча на

У МИНЫЧА Яндекс Рамблер и другие Алгоритмы поиска и ранжирования документов

kod_ssilki_ru
На сайте с 02.03.2005
Offline
176
#80
ХренРедькиНеСлаще:
Для многословных:

Самая оптимальная та, где число НАЙДЕННЫХ больше.

Но! Число найденных должно совпадать с числом самого частого ключевика.

Большая просьба - поясните, пожалуйста, для тех, кто в танке, скажем на многословном примере "изготовление сайтов"

Аккаунт закрыт 21.07.2009 ЛС (PM) отключены. Всем успехов! И Спасибо тем, кто был добр ко мне. Этот аккаунт ломали 18.05.2010 в 11.13 с ip 118.97.72.37 189.42.222.213 202.146.241.19 82.198.27.9

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий