lkm

lkm
Рейтинг
370
Регистрация
16.03.2012
wmag:
Написал в личку

Кому? Похоже, romaamor заразил всех.

romaamor, хряпнул что-ли? )

wmag:
ну да... от 22 до 33к по разному бывает.

У меня беда, что процентов 70 из них не показывают рекламу (((

Если есть желание сайт показать, можно в личку.

wmag:
Поделюсь и своими наблюдениями...
вообщем у меня примерно по 5-6 баннеров гугла на странице, в статистике Яндекса порядком 30к просмотра страниц... однако показа объявлений 40-50к.
Вывод:
более половины загрузок страниц - реклама не транслируется...

Раньше были блоки объявлений, в которых можно было "вшить" свою рекламу, если гугл не готов что-то показать...
в новом интерфейсе я не могу найти этой возможности - куда прописать свои объявления, если гугл не готов показывать - НЕПОНЯТНО 🤪

С этой новой его функцией, что он мол сам подберет оптимально место для показа - тоже не все понятно...

Кто может помочь? Не вижу куда прописать свою рекламу, если Гугл не готов показывать что-то своё...
Вручную побегал по сайту из под ИНКОГНИТО и какой то кошмар... больше половины страниц БЕЗ рекламы ((((

30К просмотров в день?

Никак не влияют.

Что-то скучно стало в разделе. Подкину темку:

По данным IAB Russia, объем интернет-рекламы в России за первое полугодие вырос на 19%, до 110,8 млрд руб. Лидирует по темпам роста видеореклама outstream (в тексте или ленте социальной сети), затраты на которую практически удвоились, до 1,8 млрд руб. Объем рекламы в результатах поиска вырос на 15%, до 47,2 млрд руб., а таргетированной интернет-рекламы — на 27%, до 44,9 млрд руб.

https://www.kommersant.ru/doc/4094954

romaamor:
Да,

И по странам -


Эффективность
Crystal_Lizard:
Иногда дно бывает ниже, чем вы думаете. (с)

Это называется - мне в этой жизни больше нечем заняться.

jano:
юзер агент: "https://www.google.com" "Mozilla/5.0(Linux;U;Android 5.1.1;zh-CN;OPPO A33 Build/LMY47V) AppleWebKit/537.36(KHTML,like Gecko) Version/4.0 Chrome/40.0.2214.89 UCBrowser/11.7.0.953 Mobile Safari/537.36"

Где вы тут увидели маскировку под гугл-бота?

Dodgerdodger:
откуда инфа?
Ashlander:
Тот же вопрос.

Имеется в виду вот это - https://support.google.com/adsense/answer/9467650

Serg_CS:
Самый главный из них - что подразумевает большинство сеошников под LSI. То, что предлагается на практике, совершенно таковым не является. Это всё равно, что называть системник процессором.


https://moikrug.ru/alsafr вот тут подробная инфа из первых рук - он уже 9,5 лет уже как разработчик только в этом направлении, а сейчас еще и совмещает это с руководительской должностью.

Тут вопрос в том, что вы понимаете под этим. Если спеца, который непосредственно реализует (на C/C++) просчёт факторов ранжирования или хранение поискового индекса (что близко к специальности data engineer), то его в первую очередь интересует производительность, ресурсоемкость и отказоустойчивость поискового движка, а не влияние ранжирующих факторов факторов на качество выдачи. А вот руководитель такой службы вполне может играть роль data scientist, который формирует гипотезы и дает техзадание своим подчиненным, и он же в итоге принимает решение, какой алгоритм выкинуть в помойку, а какой выкатить в прод. Data scientist всегда ближе к разработчику. Уж точно, это не менеджер, который не разбирается в матчасти, а только рисует диаграммы Ганта и считает KPI.


Но источник всё равно более авторитетный, чем статьи сомнительных авторов из SEO комьюнити, называющих вещи не своими именами.


В видео упоминается Палех, и кроме того, на следующем же слайде, среди "работающих" методов идет DSSM, лежащий в основе как Палеха, так и Королева. Королёв, как известно, это почти Палех, только расширенный с тайтла+заголовков на весь текст документа, и вычисляемый теперь не в рантайме, а фоново при индексировании. Андромеда вообще никак не соотносится с текстовой релевантностью, это просто маркетинговое название для нескольких фич (значки для сайтов, быстрые ответы и т.п.). Если прослушать еще дальше - там будет как раз про выделение "значимых" для ранжирования слов, но не по LSI, а по поведенческим факторам (больший вес словам, которые присутствуют на страницах с лучшим CTR в выдаче - положительная обратная связь, по факту).

Поисковые алгоритмы - это не то, что делается и выкатывается за короткий срок - это могут быть годы экспериментов и поиска рабочего решения. Вот маркетинговые названия очередным алгоритмам могут придумать достаточно быстро - сегодня Королёв, завтра какой-нибудь Циолковский.

BM25 там употребляется в контексте того, что авторы всех этих чудо-алгоритмов в своих академических работах любят сравнивать с ним результаты, полученные этими алгоритмами. Т.е. типа "наша модель работает лучше, чем BM25, на столько-то процентов". Но на практике ничего из этого не используется в реальных системах. Тоже самое можно сказать про кучу простых ML-алгоритмов, таких как k-means, decision trees, svm - всё это хорошо для обучения начинающих DS, работает на специально отобранных датасетах, а стоит только попытаться сделать на базе этих методов что-то практическое - результат сильно разочарует.

Есть ряд очевидных ограничений, почему LSI в чистом виде не может применяться поисковиками.

Во-первых, необходимость жестко задавать количество тем - а это в масштабах поисковой системы попросту невозможно - темы практически безграничны и ежедневно появляются новые. Суть алгоритма LSI вкратце: исходно есть матрица слово-документ в масштабах корпуса, LSI её сжимает по количеству документов до жестко зашитого числа документов, которые обзывает темами. DSSM это тоже по сути сжатие с потерями, но оно сохраняет больше информации за счет наличия нелинейных связей. Связи, выдаваемые LSI, получаются всегда линейны. И никакой магии - LSI не в состоянии определить реальное количество тем в корпусе - можно лишь прогнать алгоритм с несколькими жестко заданными значениями и попытаться выбрать наилучшую модель исходя из каких-то метрик качества.

Во-вторых, в любом маломальски крупном тексте упоминается множество разных тем, даже в рамках одного абзаца. А ранжировать на соответствие запросу нужно целые документы.

И наконец, метод очень вычислительно тяжелый. Сложность пропорциональна квадрату количества документов в степени количества тем. Для масштаба веб-корпуса не применимо в принципе. Зато в различных публикациях на искусственных корпусах в десяток тыщ документов считаются и хвастают, как обгоняют по качеству bm25. Кроме того, авторы этих работ редко берут веб-корпус, обычно ограничиваются литературными документами. Особенность веб-корпусов - не всегда правильно с точки зрения языка строятся фразы, и не всегда можно правильно извлечь абзацы (пример - карточки товара, там нет абзацев как таковых), да еще и спамный контент может подпортить всю статистику.

Про RTFM посмешило, учитывая что поисковики не особо где разглашают внутренние детали реализации своих алгоритмов. Но совет дельный, если применять его к тем, кто употребляет аббревиатуру LSI не к месту :)

Говоря о понимании поисковиком смысла, надо сначала договориться об определениях. Навскидку, чтобы роботу понять смысл фразы "салоны красоты рядом", вычисленная модель LSI или даже DSSM для этого будет бесполезна - нужен переколдунщик, который оттригерится на слово "рядом" в запросе, возьмет регион выдачи, услугу и поищет организации в базе знаний, в том же яндекс.справочнике или на картах.

Пожалуй, главный претендент в номинации пост года на Серче.

Всего: 3323