Как массово собрать LSI ключи?

Lazy Badger
На сайте с 14.06.2017
Offline
228
#41
Samba1982:
проблема заключается не в том что изучение методики LSI могло быть не корректным

Использование (в меру понимания темы экспериментатором) могло быть ошибочным

Samba1982:
скорее в том что самый корректный сбор rLSI может строится только на поисковой выдаче ... то есть по определению лучше сделать не получится

Вот уже некорректное допущение, предполагающее, что ранжируемые страницы (все и каждая) содержат полный корпус rLSI. А это вообще-то не так скорее, чем так

Производство жести методом непрерывного отжига
samimages
На сайте с 31.05.2009
Offline
427
#42
donc:
Это скорее семантика всего документа целиком.

Документа или сайта, в случае с Яндексом? Оне, "продавцы LSI", не хотят отвечать на этот вопрос... даже не догадываюсь почему, а я вот почти уверен что сайта.

Опыт как иммунитет — приобретается в муках! Хостинг: экономия до 1300 руб + домен в подарок ( https://clck.ru/XLscf ) / Аудит семантики от 15К [долго] - ЛС
Badmaestro
На сайте с 11.07.2008
Offline
242
#43

Samba1982, а по какому принципу собираете LSI сейчас на конкурентах? Почему забили на это дело, если раньше дало такой результат?

SEO без воды ( https://kupit-slona.ru ) Продвижение сайтов от 500 $ в мес ( https://searchengines.guru/ru/forum/1038146 ) Аренда грузинского Adsense ( при доходе от 1000$ в мес. Adsense активирован, выплаты идут. )
donc
На сайте с 16.01.2007
Online
679
#44
samimages:
Документа или сайта

Документ - отдельная страница на сайте. Но мы же понимаем, что документов может быть и ПДФ, который тоже ранжируется. Поэтому - документ. Вовсе не обязательно весь сайт вылизывать по текстам.

Продвижение сайтов от 25 000 в мес, прозрачно, надежно https://searchengines.guru/ru/forum/818412 , но не быстро, отзывы
B
На сайте с 10.03.2017
Offline
52
#45

Для сбора низкочастотников и в дальнейшем их использования для LSI текстов мне нравится https://mutagen.ru/?p=about . Вполне удобная штуковина, на мой взгляд.

El_grapaduro
На сайте с 01.09.2008
Offline
315
#46

А вот по какому принципу формируются эти ключи на основе контента?

Можно например взять, скачать базу у букварикса - https://www.bukvarix.com/english-keywords.html

Поставить ее, прогнать свои ключи в ней и получим результат. Потом из этого результата нужно как то выбрать то, что подходит.

C
На сайте с 26.05.2018
Offline
12
#47

Пришел пару дней назад за помощью на форум - думал, это я плохой сеошник. Пока не почитал, что вы тут несете... 🤣

Ребята, LSI - это латентно-семантическое индексирование или, как любят выпендриваться гуру, "сингулярное разложение терм-документной матрицы". Работает эта хня следующим образом.

Есть матрица (сетка) терминов (слов) и их упоминаний в разных документах. Например:

или так, если от предыдущей картинки у вас случился разрыв шаблона:

Поисковик смотрит, какие термины упоминаются в каких документах и таким образом точнее определяет тему, полноту ее раскрытия в материале, общее качество текста.

Сюда относятся не только "синонимы", а и НЧ-хвосты из нескольких слов (монограммы, биграммы, триграммы ... n-граммы; собираем в вордстате; юзаем удобное расширение для хрома Wordstat Helper), которые позволяют вполне успешно оптимизировать страницу для продвижения по трафику под пару сотен запросов.

Еще нужны слова, характерные для большинства документов топа выдачи. Т. е. если встречается слово "реструктуризация" в большинстве текстов конкурентов на 1-3 страницах, значит оно маст хэв.

Проверить все это дело по Яндексу можно интрументом Арсенкина:

https://arsenkin.ru/tools/sp/ (парсинг подсветок)

или банальным сео анализатором адвего (где видна частота упоминания слов; берем 5-10 текстов конкурентов, проверяем, сверяемся -> lsi ключи):

https://advego.com/text/seo/

Исходя из написанного выше совершенно глупо отрицать то, что LSI влияет на ранжирование. Поэтому, прежде чем сочинять ахинею и вводить новичков в заблуждение, УСТЫДИТЕСЬ И ПОГУГЛИТЕ! 🙅

Ну а что касается самого топика, то как вы такое массово соберете? Только ручками. По своему опыту скажу, что сбор лси под 1 кластер таким способом = 5-15 мин, если руку набить. Удачи. Ну или если у вас большие планы, можете самописный php-парсер всего этого этого добра сделать. Тогда будет массово.

[Удален]
#48
Cepreu:
Еще нужны слова, характерные для большинства документов топа выдачи

для им самым популярным будет руб - по любому запросу

самая популярная биграмма составленая методом пересечения соседних лем руб руб :)

Cepreu:
общее качество текста

можно конечно оценить с помощью "школьного теста" - запросу это вообще отношения не имеет ;)

P.S. и до кучи, в подавляющем большинстве коммерческих запросов чистые тексты на фиг не нужны, а поиграть с текстовой составляющей документа практически не реально из-за особенностей цмс и отсутствием у вас реального текстового корпуса данного документа ;crazy:

SmileP
На сайте с 18.02.2010
Offline
386
#49
burunduk:
а поиграть с текстовой составляющей документа практически не реально из-за особенностей цмс и отсутствием

Если только свой "плагин" пилить и/или ручками копать.

Cepreu:
и НЧ-хвосты из нескольких слов

Уже давно копают яндексоиды в эту сторону

http://romip.ru/romip2006/03_yandex.pdf

Второй набор тегов использует слова, встречающиеся в документе . Идея метода заключаетс я в том, что некоторые группы слов час - то встречаются вместе. Найдя такие группы, мы можем назначить им теги. После этого каждому документу мы можем назначить тег, если в документе встречается много слов из группы этого тега. Для построения таких групп был использован принцип минимальной длины описания (Minimal Description Length, MDL)
Cepreu:
Исходя из написанного выше совершенно глупо отрицать то, что LSI влияет на ранжирование.

ИМХО, в нормально написанном контенте оно и так есть. Больше подходит для доров и упоротых контентщиков, 100500 символов за копейку. Последние зачастую такого спама наделают в погоне за 100% уникальностью, что никакой lsi не поможет.

Cepreu:
или банальным сео анализатором адвего

Сюда же текстовый анализатор от мегаиндекса ну и акварель (кажется) от Чекушина

---------- Добавлено 05.06.2018 в 01:28 ----------

burunduk:
для им самым популярным будет руб - по любому запросу

По любому коммерческому запросу;)

donc
На сайте с 16.01.2007
Online
679
#50
Cepreu:
Пришел пару дней назад за помощью на форум - думал, это я плохой сеошник. Пока не почитал, что вы тут несете..

Главное отличие новичка от профи простое. Новичок начитается бложиков всяких улыбак-теоритикоф - и принимает это за истину. А за профи - 10 и более летний опыт продвижения множества сайтов.

Специалист, палю тему, порой и сам не может толком объяснить, почему так надо, а так нет. Он это просто знает. А вот когда перестает работать - начинает ковырять, производить эксперименты, на интуитивном уровне. Сайтов у него много, А-Б тестирование доступно, надо только работать...

Для текстов есть технические объективные понятия - тошнота, объем, водянистость. Есть субъективные - полезность и читабельность. Даже самый технически гениальный текст с идеально подобранной частотностью и ЛСИ вылетит из топа по ПФ, если это бредятина. И без ссылок он туда не зайдет, как правило.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий