Cepreu

Рейтинг
12
Регистрация
26.05.2018
burunduk:
вообще-то, не единственный и не самый простой ;)

можно понять о чём текст имея только 1 текст, а не целый корпус обработанных текстов в обучающей выборке, причём чем больше текст тем точнее его разбор ;)

Каким образом? Я знаком в общих чертах с принципом работы нейросетей, и вы, думаю, тоже. Самообучение требует большого разнообразия данных, согласны? Как человек поймет, о чем книга, если она будет на клингонском, а он, к тому же, никогда ничего до этого не читал? Все познается в сравнении.

Я считаю, что LSI очень сильно влияет на выдачу. Конечно, оно не решает, потому что есть заголовки, ссылки и т.д.(тоже тематику задают), но релевантность самого контента - это его заслуга, и только его. Никаким другим способом, кроме как путем построения терм-документной матрицы, невозможно точнее определить тематическую принадлежность текста. Разве что на кофейной гуще погадать )

Ну это опять таки всего лишь мое скромное мнение. Если у кого-то есть конструктивное опровержение, с удовольствием выслушаю 🍿

donc:
Специалист, палю тему, порой и сам не может толком объяснить, почему так надо, а так нет.

Специалист, который не понимает, что LSI - единственный, в общем и целом, способ для робота связать кучу непонятных ему слов в один общий смысл - это плохой специалист, имхо. А который ничего не может объяснить при этом - подавно)) Нейросети работают примерно как мозг человека. Если человеку несколько раз дать по балде после слова "лопата", то он начнет ожидать тумаков после этого слова в будущем, ровно как и поисковик начинает ожидать определенные термины после анализа собранных данных.

Частотность - другой разговор. Тут ничего не берусь утверждать наверняка, но по мне щепетильный подбор окончаний и просчет количества вхождений - это уже задротство какое-то для гиков и маньяков. Считаю, достаточно 1 упоминания каждого ключа в любом виде по ситуации (точное / неточное / разбавленное и т.д).

P.S. Не надо воспринимать LSI как способ создать какой-то "перекачанный" дор, чтобы повысить позиции - нет. Это способ помочь роботам понять, о чем собственно текст, за счет чего, возможно, он будет лучше ранжироваться и показываться по большему числу дополнительных запросов.

Ну это всего лишь мое скромное мнение, господа специалисты 🍿

Landrew:
Здравствуйте, прочитал статью /ru/news/1561863
в связи с чем появилось пару мыслей об одном сайте.
Есть у меня клиент 800 страниц в индексе, не так давно, многие из статей были по смыслу очень похожие, соответсвенно сайт сильно проседал из-за канибализации запросов, заточил каждую под определенный ключ, чтобы смысл не особо повторялся, помогло, трафик полез вверх, но теперь опять стоим ни назад ни вперед. Я вот и думаю может попробовать удалить 10-50 самых не популярных страниц сайта, на которые трафика совсем не идет. Взял данные из метрики за год и выявил "топ-50" самых не просматриваемых страниц сайта. Так вот кто что думает по этому поводу, избавляться от них или не стоит?

Подумайте сами, зачем удалять то, что имеет возраст, статический вес и даже приносит трафик? Доработать - это другое дело, удалять - категорически нет. Никто же не отнимает себе левую руку, потому что с левой стороны тело выглядит не таким сильным, как с правой 😂

JastaFly:
Доброго всем времени суток) Какие тексты предпочтительнее большой текст которые раскрывает всю тему одним махом или же группа менее значительных такстиков, каждый из которых раскрывает какой то более частный аспект тематики. Плюс маленьких текстов очевиден, в тайтлы можно запихать больше ключей, но с другой стороны я слышал что у поисковиков наметился тренд вытаскивать в топ крупные опусы в стиле Илиады на 10 - 15к. Как быть???
ИМХО Лучше маленькие тексты, так как я люблю находить мне нужную инфу быстро не тратя много времени на чтение хрен пойми чего и всякий раз натыкаясь на какой то многотомник вместо статьи у меня адски пригорает 😡
А всё эти рассказы про тренд на большие тексты это следствие большого траста раскрученных статейников вроде fb.ru

На самом деле вопрос стоит не так. Не важно, какого размера текст. Важно его качество. Если тема не раскрыта, а сам текст не релевантный, то вы хоть 100к напишите, КПД такого контента будет 0 целых 0 десятых. Следовательно:

  • не делайте "объем ради объема" - это не работает
  • работает "объем ради раскрытия темы"
  • если тему можно полностью раскрыть 1 предложением, не надо писать на эту тему диссертацию - напишите 1 предложение
  • избегайте пустословия и словоблудия
  • доносите максимально кратко, но не в ущерб смыслу написанного и его пониманию читателем

"Лонгрид" - это не длинный текст, а ГЛУБОКИЙ ТЕКСТ. На западе его частенько называют deep read.

"группа менее значительных текстиков" - это скорее вопрос кластеризации. Если темы хорошо дополняют друг друга, то их можно группировать по смыслу. Например, из тем "как скачать вк на телефон" и "как скачать вк на компьютер" можно сделать одну статью "как скачать вк" с соответствующими подразделами. Но из тем "как скачать вк на телефон" и "как настроить профиль вк" одна статья уже не получится - это будет очень тупая статья и ранжироваться она будет плохо.

Пришел пару дней назад за помощью на форум - думал, это я плохой сеошник. Пока не почитал, что вы тут несете... 🤣

Ребята, LSI - это латентно-семантическое индексирование или, как любят выпендриваться гуру, "сингулярное разложение терм-документной матрицы". Работает эта хня следующим образом.

Есть матрица (сетка) терминов (слов) и их упоминаний в разных документах. Например:

или так, если от предыдущей картинки у вас случился разрыв шаблона:

Поисковик смотрит, какие термины упоминаются в каких документах и таким образом точнее определяет тему, полноту ее раскрытия в материале, общее качество текста.

Сюда относятся не только "синонимы", а и НЧ-хвосты из нескольких слов (монограммы, биграммы, триграммы ... n-граммы; собираем в вордстате; юзаем удобное расширение для хрома Wordstat Helper), которые позволяют вполне успешно оптимизировать страницу для продвижения по трафику под пару сотен запросов.

Еще нужны слова, характерные для большинства документов топа выдачи. Т. е. если встречается слово "реструктуризация" в большинстве текстов конкурентов на 1-3 страницах, значит оно маст хэв.

Проверить все это дело по Яндексу можно интрументом Арсенкина:

https://arsenkin.ru/tools/sp/ (парсинг подсветок)

или банальным сео анализатором адвего (где видна частота упоминания слов; берем 5-10 текстов конкурентов, проверяем, сверяемся -> lsi ключи):

https://advego.com/text/seo/

Исходя из написанного выше совершенно глупо отрицать то, что LSI влияет на ранжирование. Поэтому, прежде чем сочинять ахинею и вводить новичков в заблуждение, УСТЫДИТЕСЬ И ПОГУГЛИТЕ! 🙅

Ну а что касается самого топика, то как вы такое массово соберете? Только ручками. По своему опыту скажу, что сбор лси под 1 кластер таким способом = 5-15 мин, если руку набить. Удачи. Ну или если у вас большие планы, можете самописный php-парсер всего этого этого добра сделать. Тогда будет массово.

snipero4ek:
Но на этом особо не вывезешь, потому что реклама все чаще персонализированная.
На игровой тематике много не заработать на контексте, я сам продал свой игровой сайт с 3к уников трафа в день, и не жалею.
Имеет смысл делать под конкретную игру/жанр/серию и потом сотрудничать с издателем, но это уже другая история и мало кто до нее дойдет.

Какой доход был от 3к на контексте, если не секрет?

Эдуардoff:
На фоне падения заработков из-за всяческих нововведений мне важнее заработать. Юзер контент увидит если он незагажен всплывающими окнами, грибками и прочим дерьмом, у адсенса этого практически нет. А сайты без рекламных блоков или в некликабельных местах оставим альтруистам, волонтерам, тем кто зарабатывает ссылками и тем кто зарабатывает на показах. Зачем создавать контент, тратить на это время и деньги (тот же домен, хостинг, мое время, которое я мог потратить на зарабатывание денег), если нет выхлопа.
У меня есть проект для души - политфорум, я с него ничего не имею, хотя были прямые предложения от политсил

Попробуйте переместить сайдбар в левую часть на неделю и посмотрите, как изменится ваш доход и поведенческие факторы на сайте (длительность сеанса, глубина просмотра, отказы и тп). Если все пучком, то почему бы и нет 🍿

Эдуардoff:
Я всегда ставлю сайдбар слева, инуитивно. Думаю там больше кликов. Но есть ли какие на эту тему исследования? В смысле если использовать стандартный современный дизайн - шапка,текстовая обл. и сайдбар

Если у вас типа MFA сайт, то можно хоть с обеих сторон по сайдбару с рекламой влепить - я такие видел пару штук. Вопрос в том, что вам важнее: чтобы пользователь увидел рекламу (сайдбар слева) или основной контент, ради которого пришел (слева контент).

sweet1:
Я имею ввиду про расположение блоков текста. Например если блок текста расположен в 50px от хедера или в 100px от хедера. Вот это влияет? То есть именно это влияет не значительно?

Напрямую - нет. Поисковику пофиг как вы располагаете инфу на странице. Главное, чтобы для пользователя это было удобно.

sweet1:
Влияет ли дизайн (верстка) сайта - расположение блоков текста на позиции сайта в выдаче?
Проблема в том, что я на скорую руку сверстал сайт в стиле 90 г. (просто времени не было сверстать красиво).
Прошла неделя.
Сейчас вижу, что по некоторым НЧ запросам страницы попали в топ.
Сайт как бы удобен для людей. Но верстка как-будто сейчас 1990 г.
Если поменять просто дизайн, то есть возможность свалиться по позициям?
Структура (url-ы останутся одинаковыми).

Влияет, но незначительно. Если все остальное норм, то смена верстки мало что изменит.

Обратите внимание, что дизайн косвенно влияет на позиции, потому что учитываются поведенческие факторы, которые, в свою очередь, во многом зависят от того, приятен ли сайт визуально. В остальном достаточно логичной структуры и валидной семантической разметки.

12 3
Всего: 26