А не скачать ли нам базу ссылок рунета? :)

euhenio
На сайте с 21.09.2001
Offline
357
#11

Newm, ну, такие вещи, как отпадение части ссылок из выдачи - сложно перебить чем-то.

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
wayfarer
На сайте с 28.12.2003
Offline
141
#12
euhenio:
-по моему, дороговато будет. :)

нормально, главное уловить смысл


1. никак. т.к. неизвестно.
уже неучитываем некий%, плохо...

2. они идут как обычные ссылки
тут ты неправ, они (ссылки) ведут на страницы которых не существует 302 и Location

3. коэффициенты в формуле? они в широких пределах могут варьироваться - от 0.75 у сайта с 4 хитами на хост до 0.9 у сайта с 10 хитами на хост.
какие мы брать будем? или будем считать по всему обозначеному пределу?:)

4. распределение страниц по сайту нереально знать - для этого надо прокачать весь рунет. :) придется пользоваться предположениями. Но тут надо думать. Например, из общего числа страниц на сайте и средних данных по числу ссылок с морды внутрь - определять примерно число уровней структуры и предполагать, тчо ссылка идет с одного из этих уровней.
без этого знания вся затея имхо это гадание на кофейной гуще, отсюда можно будет выловить только распределение мордоссылок, что реальной картины не даст по общей задумке
Предпочитаю наличку
Dm
На сайте с 11.03.2002
Offline
108
Dm
#13
euhenio:
Короче, есть предложение. Скинуться деньгами и скачать по 500 тыс. хостов ссылающиеся на них страницы, и по новым найденным хостам - тоже. Информацию поделить.

Евгений, если я правильно понял xml Яндекса это xml интерфейс к такому же поисковику. Можно ли чуть подробнее, как ты представляешь себе скачивание ссылок на 500 тыс. хостов? Какие запросы планируешь задавать и где гарантия, что они будут уникальными?

Я за ДСДЛ (/ru/forum/135358)
euhenio
На сайте с 21.09.2001
Offline
357
#14
тут ты неправ, они (ссылки) ведут на страницы которых не существует 302 и Location

-ты собираешься каждую ссылку проверить, прокачав ее? :) А ссылки отображаются в выдаче.

какие мы брать будем? или будем считать по всему обозначеному пределу?

-вообще-то, я хочу взять данные и поделиться с соседями. Как считать - персональное дело каждого. Можно, как обычно, взять 0.85, что соотвествует 6.66 хитов на хост :)

без этого знания вся затея имхо это гадание на кофейной гуще, отсюда можно будет выловить только распределение мордоссылок, что реальной картины не даст по общей задумке

-ну, в среднем по больнице должно выйти нормально. Надо просто подумать, как выцепить еще и число проиндексированных страниц без доп. запроса в Я-ХМЛ. Ну лил можно физически выкачать морды сайтов и посмотреть, сколько с них реально ссылок внутрь. Но это уже совсем другая история.

Ну и опять-же, считаем кто как хочет. :)

euhenio
На сайте с 21.09.2001
Offline
357
#15

Dm,

Можно ли чуть подробнее, как ты представляешь себе скачивание ссылок на 500 тыс. хостов? Какие запросы планируешь задавать и где гарантия, что они будут уникальными?

-задаем 500 тыс. запросов вида #link="www.site.ru*"|#link="site.ru*"

Если в ссылающихся находим новые домены, скачиваем данные и по ним тоже.

S
На сайте с 27.04.2005
Offline
25
#16

А может обратиться с ком. предложением в Яндекс? Они ещё и скидку сделают... особенно, если услугой будем регулярно пользоваться.

100$ в месяц на благое дело не жалко ;)

Вот только попрогать самим тоже придётся, а то от инфы больно мало толку будет.

euhenio
На сайте с 21.09.2001
Offline
357
#17

А наценку они не сделают вместо скидки? :)

wayfarer
На сайте с 28.12.2003
Offline
141
#18
euhenio:
-ты собираешься каждую ссылку проверить, прокачав ее? :) А ссылки отображаются в выдаче.

Жень ты собираешся учесть добрую половину всех ссылок которые нафиг не нужны:)



-вообще-то, я хочу взять данные и поделиться с соседями. Как считать - персональное дело каждого. Можно, как обычно, взять 0.85, что соотвествует 6.66 хитов на хост :)
ок, оставим кто по какому коэффициенту будет считать, давай разберемся что мы вообще будем считать:)


-ну, в среднем по больнице должно выйти нормально. Надо просто подумать, как выцепить еще и число проиндексированных страниц без доп. запроса в Я-ХМЛ. Ну лил можно физически выкачать морды сайтов и посмотреть, сколько с них реально ссылок внутрь. Но это уже совсем другая история.
Ну и опять-же, считаем кто как хочет. :)
В среднем по больнице нифига не получится:)

просто к примеру есть 2 препятствующих фактора

1. сквозные ссылки /более весомый фактор

2. яндекс зараза:) ну никак не хочет давать нам инфу о количестве ссылок и самих ссылках которые лежат вне диаппазона в 1010 результатов которые он отдает, хотя эта величина мала и ей можно пренебречь

Идея:) навеяно в среднем по больнице

берем общее число сайтов в яндексе и присваиваем каждому среднее число ссылок на сайт... отличную среднюю температуру получим;)

euhenio
На сайте с 21.09.2001
Offline
357
#19

wayfarer,

Жень ты собираешся отсечь добрую половину всех ссылок

-не понял, почему я собираюсь отсечь? Есть ссылка. Она отображается в выдаче, но ведет на редирект. Ну и хрен с ней.

давай разберемся что мы вообще будем считать

-я хочу Вицы считать. Но не хочу никому навязывать - считайте, кому что нравится. :)

В среднем по больнице нифига не получится

-ну, если учесть, что алгоритм расчета Вица и ссылочного ранжирования неизвестны, тогда и вообще ничего не выйдет? :)

Прикинуть число уровней структуры на сайте можно. Даже исходя из предположения, что один уровень структуры кроме морды, и любая внутренняя ссылка принадлежит этому уровню - этот расчет ПР уже гораздо точнее, чем расчет только по мордам.

wayfarer
На сайте с 28.12.2003
Offline
141
#20
euhenio:

-не понял, почему я собираюсь отсечь? Есть ссылка. Она отображается в выдаче, но ведет на редирект. Ну и хрен с ней.

я там исправил сообщение



-я хочу Вицы считать. Но не хочу никому навязывать - считайте, кому что нравится. :)
вот и я хочу, но без структуры сайтов, вИЦа каждой страницы, учета сквозных ссылок это будет всего-лишь охота на ведьм, т.к. не получится даже приблизительного результата


-ну, если учесть, что алгоритм расчета Вица и ссылочного ранжирования неизвестны, тогда и вообще ничего не выйдет? :)
Прикинуть число уровней структуры на сайте можно. Даже исходя из предположения, что один уровень структуры кроме морды, и любая внутренняя ссылка принадлежит этому уровню - этот расчет ПР уже гораздо точнее, чем расчет только по мордам.
уровень структуры тоже ничего не даст, т.к. уровень это одно, он например может быть завязан только через карту сайта (что кстати практикует одна небезизвесная компания) а может быть завязан на ключевой узел, а еще вариант что завязано на все кроме главной...

эх... может лучше денег на робота и ресурсы пособираем?:)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий