Метод случайного выбора страниц и сайтов?

euhenio
На сайте с 21.09.2001
Offline
357
2375

Собираюсь провести исследование зависимости ВИЦ от разных х-к сайта (среднее число линков in, out, число страниц). Для этого можно использовать программные методы работы с Яндекс-Баром.

Но нет метода подбора случайных страниц. Если искать, то по какому-то параметру они будут неслучайными... Может быть, что-нибудь предложите? Пока что я надумал найти все страницы, на которых встречаются линки со словом "www". Предположительно, есть или нет www в урле - довольно-таки случайно. Таких по Яндексу около 18 тыс.

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
Polite Moose
На сайте с 22.04.2002
Offline
85
#1

Я могу ошибаться, но на ВИЦ существенно влияют и внутренние ссылки, которые (от которых) зависят от способа навигации по сайту. Имхо, без ручного анализа отследить систему внутренних ссылок весьма проблематично.

А если не учитывать внутренние ссылки, то картина может быть очень размазаной и неточной.

Пример из моей практики - сайт имел "первую" вводную страницу с которой шли ссылки внутрь сайта и на "главную", на которую и была завязана вся навигация. На "первую" страницу ссылок изнутри не было. После простановки ссылок со всех страниц на первую, ВИЦ разом скаканул с 2 до 60. А ведь таких "первых" но не "главных" страниц очень много. А ВИЦ показывается только для "первой".

Если бы была возможность узнавать ВИЦ для всех страниц, или хотя бы для самой весомой, которая, наверняка, центральная в навигации, то иследование было бы намного точнее.

Может быть хором попросить Яндекс о такой возможности? :) Я понимаю, что это создаст излишние нагрузки на сервера Яндекса, но может быть сделать доступ к такой информации не по дефолту, а по спец. разрешению или отдельным пунктом в меню статистики по текущему сайту? Ведь данные по ВИЦ конкретных страниц всё равно есть, а пользоваться вышеуказанным сервисом, всё равно будет незначительное кол-во владельцев ЯБ.

Удачи, доброго пива (http://www.fifth-ocean.ru/) и настроения! Релевантность определяется не тИЦ, не ВИЦ, не количеством ссылок, не частотой ключевого слова, а соответствием запросу!
F
На сайте с 15.11.2000
Offline
116
#2
Первоначальное сообщение от euhenio
Собираюсь провести исследование зависимости ВИЦ от разных х-к сайта (среднее число линков in, out, число страниц).

Не думаю, что оно выявит что-то особенное. Я на этом форуме уже исследовал зависимость веса сайтов (аналог ВИЦ) в Апорте от числа ссылок, известного Яндексу. Ну есть корреляция, и что с того? Хотя на результат взглянуть интересно, но с практической точки зрения он мало что даст.

Но нет метода подбора случайных страниц.

Насколько я понял, нужен случайный выбор не страниц, а сайтов. Есть два неплохих варианта решения.

  • При исследовании интернета Лоуренс и Гиль использовали генерацию случайного IP-адреса с последующей проверкой, есть ли такой сайт. Для рунета надо будет дополнитель проверить наличие русского языка на странице, либо по базе whois найти, зарегистрирован ли сайт на россиян. Минусы метода -- много лишних проверок; случайность не полная, если на одном IP сидят несколько сайтов.
  • Взять список доменов второго уровня для рунета здесь или здесь, и выбирать случайный из них. Минус метода -- не учитываются домены третьего уровня, которые составляют заметную часть рунета.
  • Взять N случайных страниц из списка сайтов индекса цитирования Яндекса и из сформированного массива выбирать случайный сайт. Минус -- не учитываются сайты, ИЦ которых менее 10, но они-то нас и не интересуют. Думаю, это лучший вариант.

С уважением,

Александр Садовский.

[Удален]
#3

Алгоритмы расчета ВИЦ у Яндекса неизменны? Насколько я помню, Сегалович намекал, что это не так. А вы, Александр, приветствовали регулярную смену алгоритмов с целью затруднения жизни оптимизаторам.

На всякий случай еще раз приведу статистику ВИЦ по одному из своих сайтов

18.мар 156

25.мар 264 (*)

01.апр 262

03.апр 280

10.апр 280

23.апр 280

30.апр 280

07.май 292

14.май 321

20.май 321

26.май 321

03.июн 321 (*)

06.июн 216

10.июн 216

Ежеквартальная смена алгоритма налицо.

euhenio
На сайте с 21.09.2001
Offline
357
#4

Спасибо за советы.

А если не учитывать внутренние ссылки, то картина может быть очень размазаной и неточной.

-Да, конечно.

но может быть сделать доступ к такой информации не по дефолту, а по спец. разрешению или отдельным пунктом в меню статистики по текущему сайту?

-за деньги, например :) Мне не верится, что они на это пойдут...

Ну есть корреляция, и что с того? Хотя на результат взглянуть интересно, но с практической точки зрения он мало что даст

-Во-первых, будет статистика по среднему числу ссылок на странице. Это может быть полезно для оценки "связности" рунета. И связности для "безопасных" островков ссылок:). Ну и ВИЦ, я надеюсь, позволит определить damping factor, если обрабатывать не страницу, а сайт. Правда, то же можно было бы сделать и по одному сайту, тщательно просчитав ссылающиеся на него сайты - но мы рискуем попасть на необновленный ВИЦ именно для этого одного сайта.

Алгоритмы расчета ВИЦ у Яндекса неизменны? Насколько я помню, Сегалович намекал, что это не так. А вы, Александр, приветствовали регулярную смену алгоритмов с целью затруднения жизни оптимизаторам.

-Мне, честно говоря, в это слабо верится. Если немного менять d, ВИЦ будет очень сильно скакать, особенно у цитируемых сайтов. Но этого не наблюдается.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий