ivb

Рейтинг
0
Регистрация
19.02.2008

2texter:

Например по той причине что по тем же пластиковым окнам в топе выдачи выдаются сайты компаний которые их производят, а не, тематических порталов которые им посвящены и содержат каталоги производителей и продавцов окон по стране. И ещё большой вопрос что же важнее покупателю, найти быстро конкретную продвигающую себя компанию или информация о том что такое "пластиковые окна" и ссылки на каталоги компаний.

Если же говорить о том почему выявление платных ссылок востребовано, то дело не только в том как портится выдача поисковиков, но и в том как портятся сами сайты их размещающие.

К примеру, у меня необходимость выявления таких ссылок возникла во время экспериментов по тематической классификации сайтов и определения их "коммерциализированности" - фактически, без отсева всех неестественных ссылок многие алгоритмы работали чрезвычайно неточно.

День добрый.

Раз уж критикуете - так можно критиковать и меня напрямую, собственно я автор. Равно как и будут вопросы - отвечу.

Относительно ссылок в контексте, то "чувак в курсе" и ссылки в контексте можно выявить точно также как и ссылки в блоке, сложнее, но можно - вопрос в том нужно ли.

По поводу того что я знаю о продвижении, то я неслучайно указываю прямым текстом что в SEO не специализируюсь - я занимаюсь конкретно анализом содержимого веб страниц для самых разных задач. То что при этом удаётся ещё и выявлять "продвигаемые ссылки" - это побочный эффект от экспериментов с другими алгоритмами. Например, наличие платных ссылок мешает некоторым алгоритмам определения тематики сайта.

По поводу скрипт в паблик - это скрипт в выкладываться точно не будет. Будет книжка и, скорее всего, её часть в онлайне которая опишет все правила использованные при анализе скриптом плюс те которых там не имелось.

---

Иван Бегтин

Уважаемые, собственно автор алгоритма я. Vindovs, просто дал ссылку тут.

Рейтинг рассчитывается по основе "веса" ссылки и группы ссылок - это цифра которая рядом рейтингом и далее по делиться на 4 шкалы:

- от 4 до 10 - низкая вероятность

- от 10 до 20 - средняя вероятность

- от 20 до 50 - высокая вероятность

- выше 50 - практически гарантия

Соответветственно алгоритм не говорит "да" или "нет", а рассчитывает ссылочный "потенциально платный" вес.

Что такое "?" я не в курсе:) подробностей алгоритма раскрыть не могу, скажу лишь что там сейчас порядка 13 критериев и логика заточена не только самой ссылки, но совокупной окружающей её на странице информации. Соответственно страницы где платных ссылок меньше 4 пока не определяются и, скорее всего, определяться не будут.

http://venality.name не распознаёт как минимум:

- oldvladivostok.ru

- www.trud.ru

- www.rg.ru

- www.gzt.ru

и ещё массу до кучи.

---

12
Всего: 14