ПФ -это не рубильник, а модный тренд. Покажи мне того, кто задешево рвет топы с помощью поведенческого (кроме мегасео, которые так сладко поют, что закрадываются сомнения о том есть ли мальчик). Пощупать ПФ, в отличие от ссылочного, нельзя. Вот если бы Яндекс сниппеты подписывал "найден по ПФ", тогда да, понимаю.. 😂
Ну флаг им в руки -) я предупредил -))
Презентация сама по себе малоинформативна, NDA яндексовское все-таки надо соблюдать. Самое интересное я говорил на словах. Так что ищите видео.
Я надеюсь после моего доклада крупные игроки 100 раз задумаются перед тем как вкладывать бабло в накрутку ПФ
Приветствую. Интересный проект.
- Как решаете проблему с дублями страниц?
- Не собираетесь переходить на распределенную систему обхода (distributed crawlinlg), как в Majesticseo?
- А индексировать контент помимо ссылок?
- А .. ранжировать? Хост граф на 18 млн хостов впечатляет -) Например можно считать BM25 по текстам ссылок, коммерческость, и много чего еще.
извините если сильно загрузил вопросами, которые пришли, пока изучал ваш проект
Да, конечно не о разовой, а об аггрегированной за довольно продолжительный период.
За какой объем времени точно, к сожалению, не знаю. Но думаю за пару недель у гугла вполне может набраться мегабайт-другой в среднем на юзера.
Я тут собирал как-то информацию о CTR из разных источников.
А что тут развивать? Это немного оффтопик вообще-то -). Из каких логов эти данные - писали выше. Информация у меня из личного общения с инженерами Google.com. "Протаскивают" - это значит учитывают при рассчете факторов ранжирования. Попутно с данными выполняют кучу разного рода оптимизаций, иначе никакой Map reduce или Google FS не справится с перелопачиванием данных по миллиарду пользователей.
Жаль что те у кого есть информация по теме разно-уровневых индексов не спешат ей делиться -)
Ссылки с твитов точно влияют на скорость индексации. На ранжирование же оказывают влияние ссылки только с авторитетных аккаунтов. Правда влияют они пока только на результаты в real-time поиске. По крайней мере по моим данным месячной давности.
Вообще Гугл сейчас усиленно занимается алгоритмами определения авторитетности пользователей, смотрите например патент Agent Rank. Так что в скором времени, ссылка из сообщения авторитетного пользователя будет цениться не меньше чем ссылка со страницы с высоким PR.