Поведенческие технологии в Яндексе

123 4
234sha
На сайте с 30.01.2007
Offline
323
#11

Рецепт дня:

Больше сисег на сайт для дрочер.в и ПФ просто будут тащиться от сайта😂

Люби жену, родителей, вино, быстрые тачки и бокс.
Talisman13
На сайте с 20.01.2007
Offline
211
#12
Denisg:
таким образом, в будущем к компьютеру детей станут подключать уже с малых лет.

Через USB или через блютуз? Ужос!

Denisg
На сайте с 10.01.2008
Offline
136
#13
Talisman13:
Через USB или через блютуз? Ужос!

Ну вот как будут подключать незнаю, сейчас, например за детьми смотрят при помощи видеоняни.

https://rapidshare.com/files/460981457/______________________2.xlsx

Все-таки прихожу к мнению о том, что Яндекс может отфильтровывать результаты исключая НЕУНИК по дате влёта.

Denisg
На сайте с 10.01.2008
Offline
136
#14

В поисковой системе можно узнать дату влета в индекс. Тем самым определить оригинал.

Например, сайт: http://www.babyblog.ru/user/lenta/Simka2007/1 выстреливает первым если задать область влета – 2006-2007 годом по запросу из одного предложения, например: «С одиннадцатой по двадцатую неделю беременности будет происходить стремительный рост плода». Далее, ограничив область запроса с предложения до нескольких слов «стремительный рост плода» мы обнаруживаем сайт уже на второй позиции. На первой оказывается сайт narod.ru. Вероятно, это связано с тем, что Яндекс отдает приоритет своим сайтам перед другими. При том, что четкой последовательности «стремительный рост плода» в тексте не встречается – таким образом ПС считает другие факторы ранжирования более важными относительно этого.

Возможно по словам “стремительный», «рост», «плода» - поисковая система может отнести сайт к разряду «беременность», потому что в выдаче по запросу «стремительный рост плода» даже с ограничением по дате мы видим сайты этой тематики.

При увеличении длины даты вхождения с увеличением количества сайтов ОРИГИНАЛ сайта находится уже на 24 позиции, на третьем листе, при том, что в первой десятке оказываются сайты с текстом «стремительного роста плода», сайты с подсветкой сниппета с разбросом вхождения, например «резкого роста потребностей плода», и сайты, посвященные смежной тематике, по словам-омонимам, например: «роста плодов потребность томатного растения в воде резко», с преобладающей выдачей именно сайтов такой тематики.

При увеличении даты разброса, с увеличением количества сайтов исходный оригинал находится на позициях все ниже и ниже – напрямую связанную с конкурентностью, но по логике вещей сайт должен быть выше в этом случае, т.к. он является наиболее релевантным с точки зрения поиска – вхождение фразы – или, Яндекс ищет в этом случае не по прямому вхождению, а каким-то образом оценивая общую фразу на страницах всех, учавствующих в ранжировании сайтов.

Если ограничить дату вхождения датой 20090319, то в таком случае в выдаче появляется страница того же сайта, но уже на первой позиции – возможно это дата внесения в индекс документа с сайта. При этом именно этот документ, а не тот, что был ранее отчего-то считается самым релевантным. (?) (Какой алгоритм был и какие были апдейты в это время).

При увеличении даты влета до сегодняшнего времени в выдаче поисковой системы появляется другой сайт, с подсветкой сниппета, «стремительный его рост. … Рост плода», отличающейся от исходной.

При этом страница http://www.babyblog.ru/user/lenta/Simka2007/1 по сути должна конкурировать со страницей: http://www.babyblog.ru/cb/index/11. Поисковая система считывает информацию о дате публикации – это очень важный момент.

Конкуренция показана на странице: http://yandex.ru/yandsearch?date=&text=%D1%81%D1%82%D1%80%D0%B5%D0%BC%D0%B8%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9+%D1%80%D0%BE%D1%81%D1%82+%D0%BF%D0%BB%D0%BE%D0%B4%D0%B0+date%3A20060101..20100101&site=http%3A%2F%2Fwww.babyblog.ru%2F&rstr=&zone=all&wordforms=all&lang=all&within=0&from_day=&from_month=&from_year=&to_day=&to_month=&to_year=&mime=all&numdoc=10&lr=213

При поиске на сайте конкуренция, составленная страницами определяется внутренней оптимизацией страниц – таким образом выше оказывается именно та, которая оптимизирована по классическим канонам поисковой оптимизации.

С четким вхождением и ограничением по дате, соответствующей дате индексации первой рассматриваемой страницы, например: http://www.babyblog.ru/user/lenta/Simka2007/1 при поиске отображается одна она. При этом, при увеличении даты влета в индекс наблюдается интересный эффект – поисковая система отображает уже 2 ответа вместо одного, но показывается только лишь один ответ. При этом URL страницы уже другой, и другой title.

Интересно – как поисковая система относится к одной и той же информации на сайте но с разными title, url.

В поиске по дате вхождения с 2006 по 2007 год встречается лишь эта одна страница категории (рубрика) сайта, а в поиске до 2008 года встречается уже сам документ – одна страница сайта. При этом для более поздней даты показывается ЕЩЁ.

В поиске до 20081030 по точному вхождению появляется еще одна страница с сайта с другим title, http://www.babyblog.ru/user/Keiti/129375. При этом по данным даты, входящей в контент сайта информация на сайте появляется 20 мая и влетает в индекс уже 30 мая.

По поиску в индексе появляются документ, оказывающийся выше по списку среди найденных уже 6 документов (Нашлось 6 ответов), в то время как отображаются только лишь 4 ответа в списке. При этом преобладают сайты, имеющие вид форумов – с большим количеством контента на страницах.

Страницы с того же самого сайта в выдаче при этом отсутствуют! (возможно это и есть эти две страницы, но судя по тому насколько быстро происходит копирование необязательно)

С увеличением даты вхождения до 20101030 по точному вхождению цитаты из документа (выборки текста) в индекс появляются уже 186 ответов, при этом в выдаче отображаются только лишь 13. Это означает что Яндекс выводит не все документы из прочитанных.

В поиске по сегодняшний день включительно выводится уже страница сайта, относящаяся к тематическому подразделению сайта, т.е. http://www.babyblog.ru/cb/index/11.

Вполне вероятно что Яндекс хранит уже пересчитанные формулы для выдачи по старым сайтам для экономии мощностей серверов, с датой обновлении сайтов некоторой, меньше заданного значения.

По широкому вхождению фразы: «С одиннадцатой по двадцатую неделю беременности будет происходить стремительный рост плода» в индеке поиска по примерной дате вхождения сайта мы видим страницу http://www.babyblog.ru/user/lenta/Simka2007/1

На второй и третьей позиции оказываются сайты, имеющие в сниппете выдачи ключевые слова из текста, учитывающие максимальное количество слов в пределах сниппета. При этом учитываются слова не только в исходной форме, но и слова в разных падежах и склонениях. По увеличению даты влета в индекс поисковая система сохраняет за собою точное вхождение по ключевым словам – т.е. выводит неуникальный контент. Приоритетным является вывод контента с точным вхождением.

С увеличением даты влета в индекс, начиная с 2009-2010 года (год Семьи) в индексе начинают появляться все больше и больше дублей, при этом сайт с оригинальной информацией исчезает из выдачи, так как дата внесения в индекс для домена становится поздней, и ПС ранжирует документы, появившиеся в индексе позднее, считая их главными.

При поиске сайтов с ограничением по регистру, поисковая система в выдаче на первой странице в общих результатах выдает 10-30% сниппетов, отличающихся от точного регистра.

В текущей версии алгоритма поисковая система выводит при запросе «!Стремительный рост плода» сайты, на которых встречаются слова в точно заданном регистре, при этом начинающиеся со слова «Стремительный», таким образом выводя рерайты исходного текста, но при этом в выдаче наблюдается и сниппет, в котором виден Title, при этом сайт имеет другую направленность. Это означает, что самым важным фактором ранжирования является контент.

Ориентируется в определении слова Яндекс на исходную словарную форму слова. При поиске по дате Яндекс выводит в первую очередь – по ранжированию страницы с точным вхождением контента и уже после смотрит на дату – таким образом страница с категориями окажется в поисковой системе, даже если была проиндексирована (переиндексирована) значительно позже указанной даты, если эта страница – категорий. Предпочтения поисковая система отдает документам. (Возможно эффект предпочтения категориям связан с выпадением сайта из индекса полностью с последующей переиндексацией)

В поиске по датам встречаются интересные эффекты, в виде выпадения информации из индекса. Например, при поиске по дате до даты публикации включительно сайт есть – возможно быстроробот прошелся по сайту быстро. Далее, с указанием поиска по дате на день больше сайта нет и вновь сайт появляется при поиске после.

Пришел к выводу что: если в выдаче имеется много неуникального контента, то, в таком случае поисковая система может выводить не столько сайты, сколько информацию – например, если мы посмотрим новости за сегодняшний день, то увидим, что выдача под вторую десятку заполнена рерайтом новости. Таким образом Яндекс может предложить в выдаче наиболее релевантный запросу поиска результат, при этом в качестве сниппета к новостному сайту может вывести «Где читать» с возможностью выбора пользователем предпочитаемой онлайн-газеты.

Denisg
На сайте с 10.01.2008
Offline
136
#15

datot, я читал и изучал отчеты, которые выкладываются на сайте seonews.com - очень интересно, рекомендую вам.

По отчетам можно понять примерно, какая демография у пользователей интернета - например, эту же статистику вы сможете получить и здесь.

Denisg
На сайте с 10.01.2008
Offline
136
#16

Ещё несколько мыслей о ПФ:

Главная задача - удержать пользователя на сайте. Поэтому сайт должен быть максимально похож на сервис, т.е. максимально представлена информация по тематике - к примеру: интерес пользователя/смежный интерес

пользователя/интерес партнера/сервис для пользователя/

На сайте должна появляться динамика прироста посетителей. Например, одним из поведенческих факторов в ранжировании будет прирост пользователей на сайте с определенной скоростью. При изменении этой скорости ПФ включает реверсивную отдачу.

Показатель отказов - это такая система, которая рассчитывается наряду с увеличением трафика на сайте. Она должна быть пропорциональна. Но при этом, если на сайте имеется некоторый тематический прирост, то процент отказов в общей массе должен коррелировать с тематическими пользователями, т.е. при превышении

определенного порога - процент прироста не может быть меньше чем общее число посетителей на сайте по тематике.

Понятие глубина просмотра должно коррелировать с количеством страниц на странице и глубиной вложенности. Т.е. если число категорий на странице не увеличивается сильно, и при этом глубина просмотра увеличивается, то, в этом случае получается что фактор будет иметь значение. Т.е. поведенческие факторые есть суть того, что включается в расчет формулы при изменении. Если на сайте в течение определенного

времени не производится обновления, то ПФ начинает работать с отрицательной динамикой. Время, проведенное на сайте - показатель заинтересованности пользователем - при этом, если информация актуальна и на сайте одновременно изменяется параметр - максимальное значение новых посетителей, с

минимальным количеством отказов и одновременным увеличением глубины просмотра, то, в таком случае фактор становится важным, решаюшим. Вполне возможно что ПФ рассчитывается по формулам min и max значений.

Следущим в совокупности факторов продвижения будет прирост просмотров страниц - это вообще говоря показатель, который позволяет оценивать уровень коммерциализированности сайта. Как правило сайты с большим количеством просмотров являются информационными и делаются специально, чтобы пользователь

обновлял страницу чаще - разделение по страницам. Кроме этого это могут быть и просто интересные сайты - креативные и известные, куда хочется вернуться ещё и ещё.

Дальше - по количеству отказов, на сайте, где почти нет информации и куда пользователь попал по дурацкой ссылке извне скорее всего будет отказ. Этот критерий придуман, чтобы отсекать ГС. По сути своей показатель отказы и есть АГС.

Число посетителей на сайте - это некоторый параметр, позволяющий отследить прирост, и взвесить динамику прироста: часовую, суточную, недельную, месячную и т.д. Таким образом возможно оценить уровень доверия к сайту при постоянном приросте или же в зависимости от тематики сайта в интернете по схожим запросам и

сайтам конкурентов (по нахождению информации, схожей по содержанию - "шум", "блогосфера" и т.д.) можно будет оценить уровень известности ресурса и движения его в оффлайн и онлайн. Далее, этот фактор будет ещё и показателем сезонности пользовательской активности. Таким образом на сайте подарков, картинок и т.д.

показатель "посетители" должен быть критичным, в то же время этот показатель будет таким же критичным для сайтов производственной тематики, где в общем-то активности не наблюдается вовсе.

Новые посетители - это показатель, который говорит о том, сколько на сайте есть человек, которые зашли по рекомендации, по постингу на интересных тематических и нет форумах. Т.е. если посетитель пришел на searchengines.ru с habrahabr.ru, то, в таком случае "Новые" активизируется и начинает принимать участие в

формуле ранжирования.

Вовлечение пользователя - показатель, характеризующий, как пользователь ведет себя на сайте - т.е. человек может заходить в утреннее время, в вечернее или дневное преимущественно. Это зависит от тематики сайта, кроме того, это зависит и от самого пользователя: кто-то привык читать одну новость по утрам, кто-то сразу все новости по всем новостным группам, кто-то не читает новости вовсе, а зашел на сайт и

нажал кнопку "Форум".

Кроме этого Яндекс будет определять в какое время и какие пользователи заходили на сайт. Т.е. если сайт является автомобильной тематикой и пользователь заходил на сайт утром, при этом глубина просмотра была 2-3 страницы, с общим проведенным временем около 10-20 минут, то это повысит сайт в результатах поиска.

Если же глубина просмотра составила 1, а время проведенное на сайте 30 минут, при том что пользователь заходил, скажем в любое время, то в этом случае имеется в виду то, что сайт скорее всего неинтересен, или это был редирект с другого сайта или сайт подвергается хакерским аттакам.

Запросы сайта в секунду порождают эффект, когда Яндекс определяет - насколько часто обращаются к сайту, т.е. имеется ли интерес во времени. Если на информационный сайт приходится максимум запросов в ночное время, при этом сайт указан в рубрике "Информация", а контент должен быть присвоен с деловыми новостями,то, тогда Яндекс посчитает что сайт аффилированный или

это сателлит.

Один из пользовательских факторов - возврат одного конкретного посетителя? Каким образом можно оценить то, как пришел именно этот и конкретно этот посетитель? К примеру по одному IP. Но одним IP пользуется весь офис. По версии браузера, по поведению пользователя на сайте. По входу в аккаунт, если этот пользователь пользуется системой.

Просмотры пользователями - чтобы сайт получил высокие значения при ранжировании число визитов посетителя должно быть по средним от минимальных до максимальных значений, при этом число просмотров должно быть в максимуме и пропорционально числу визитов на сайт. Глубина просмотра при этом становится не таким важным параметром. Кроме подобных страниц, которыми пользователь будет пользоваться постоянно - как справочными материалами или как источником информации (анализ поведения пользователем на странице говорит именно об

этом) на сайте должны быть ещё и страницы с максимальной глубиной просмотра - скорее всего это будут какие-либо мультимедийные источники или что-то, связанное с получением знаний, т.е. расширенная система каталогизации на странице. Таким образом в этом случае отказы будут не так важны, а визиты и просмотры

будут увеличиваться косвенным образом.

На сайте должны располагаться элементы, которые так или иначе связаны с максимальным проведением времени пользователя на сайте - вполне возможно это некий медийный контент, связанный с тематикой сайта. Это может быть анонс промо страницы с игрой, или некоторое онлайн приложение, которое требует действий

пользователя с клавиатуры - при этом человек так или иначе проводит время на сайте, а Яндекс высчитывает заветные секунды и минуты.

Datot
На сайте с 09.07.2007
Offline
1095
#17
Denisg:
datot, я читал и изучал отчеты, которые выкладываются на сайте seonews.com - очень интересно, рекомендую вам.

По отчетам можно понять примерно, какая демография у пользователей интернета - например, эту же статистику вы сможете получить и здесь.

Я Вам скажу честно. Не читал, и читать не буду. Статистика статистики рознь. Мне есть где собрать достоверную статистику для своих проектов.

Если Вам интересно, дайте пару дней, я такие отчеты представлю, что поведется любой.

Кстати, могу попутать год, примерно 1989. Директор отдела мясомолочной промышленности СССР Статуправления попался на взятке в 1 лям рублей, за недостоверную инфо по статистике. Я к тому, что как выгодно, так и подашь. А если есть свои проекты, то статистику лучше собирать самому (если она нужна).

Вы пишите некоторые вещи верно, но врядли до конца понимаете суть вопроса. Такое кол-во букв в своих постах используйте лучше на своем блоге.

Накрутка ПФ @samdatot Группа полезных сеошников https://t.me/karkali Что надо знать владельцам сайтов https://dzen.ru/tunnel.ru
suhoi.super
На сайте с 03.06.2011
Offline
1
#18

Лайки, скоро будем их накручивать, а потом появится еще что нибудь. и будем продолжать подстраиваться и накручивать, писать портянки, удерживать усеров порнухой на сайте и т.д.

234sha:
Рецепт дня:
Больше сисег на сайт для дрочер.в и ПФ просто будут тащиться от сайта

а потом будут вновь возвращаться в выдачу продолжая искать ответы на свои вопросы, и время на сайте првратиться в минус. Да и доля возвратов уменьшится, и последующих отказов увеличится.

On Air
На сайте с 01.03.2009
Offline
119
#19
Denisg:
datot, я читал и изучал отчеты, которые выкладываются на сайте seonews.com - очень интересно, рекомендую вам.
.

Охрененно интересно читать сообщения от 2007 года)) Свежих там и в помине не было)

WatchYou - сервис товарных видеорекомендаций (http://demo.watchyou.ru/)
M
На сайте с 15.01.2011
Offline
43
#20
Chessmaster:
Это характерно только для западных ПС, где работают умные и творческие люди, а для Яндекса главное деньги а не качество поиска...

Ну и что же эти умные и творческие не могут Яшку нагнуть? Наверное, слишком творческие.

mersi добавил 12.06.2011 в 08:23

zhitov:
Насчет серебрянников - у РСЯ порог входа 300 уников, у Адсенса - 0. И кто из них более "продал идею"?

Однако, браво!

+1

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий