Kryukov

Рейтинг
12
Регистрация
11.11.2005

itman, Любое ссылочное кольцо - не такая уж страшная беда, суммарный ранк системы все-равно 1. Т.е. я о чем... Бытует мнение, что в кольце PR каждого будет неуклонно расти до бесконечности - это не верно. Просто у каждого он будет колебаться около какого-то значения, причем, чем больше итераций, тем погрешность будет меньше. Вот если внутрь кольца засадить "толстого" участника, ясен пень, в системе произойдет перераспределение. Ну у кого таковой имеется - флаг бы ему в руки.

Беда в том, что существует масса запросов типа "рецепты" "гороскопы" и пр. Сайтов такой тематики пруд-пруди. Вопрос, а показывать-то что? У кого чаще и жирнее написано? (это я для противников использования посторонних факторов). Можно, конечно, отослать меня создавать компьютерный интеллект, или можно спросить у оператора - пусть скажет свое мнение (тоже выход :)

А борьба за PageRank идет у конкурентов за "хорошие" запросы с помощью оптимизаторов. Ну и пусть себе конкурируют в рамках дозволенного :) Кто лучше "честно" сделал - тот и имеет бутерброд с икрой.

itman:
1) Общепринятое мнение, что пейджранк - это маленькая добавка. Я с этим согласен
2) Чтобы с его помощью не накручивали сильно, его влияние должно расти сильно медленнее чем сам pr. то есть все сайты с большими pr примерно эквивалентны между собой. pr нужен чтобы отличить крутые сайты от некрутых, то бишь прибавлять нужно что-нибудь вроде log(pr).
3) Может лучше не прибавлять а умножать на что-нибудь вроде 1 + log(pr). Хотя не суть важно.

Истинный PR (правильно посчитанный) поднять не так уж просто, как кажется на первый взгляд. Я имею ввиду, что увеличить его в разы - это серьезная работа оптимизаторов (коих много тусуется на этом сайте), а уж увеличить на порядок - вообще практически невозможно. Но в целом могу согласиться, что он (PR) должен давать выигрыш _ПРИ_ПРОЧИХ_РАВНЫХ_УСЛОВИЯХ_ (или близко к тому)

ЗодчийТеней, Я вам открою страшную :) истину - 50% запросов (цифра примерная, могу ошибаться, но не в разы) составляют запросы без конкретики. Типа "поиск работы" и пр. К тому же, пользователь имеет свое собственное представление о том, что должен ему ответить поисковик (например, бытует мнение, что по запросу "банк России" первым в списке кандидатов должен появиться сайт www.cbr.ru - а собственно почему?). Надо или подстраиваться под нужды пользователя или учить его (вешь потенциально опасная, обидится и уйдет на гугль :) )

!Иван FXS:
[вес документа]=([PageRank документа]/[нормировка PageRank] + [релевантность документа поисковому запросу]/[нормировка релевантности] + {прочие факторы}/{нормировка каждого из прочих факторов})/[полное количество слагаемых в скобках]

;-)

Т.е. Вы считаете, что PR линейно влияет на результат и ни один из факторов не может оказывать влияния на другой. По жизни я сейчас так и сделал, но правильно ли это...

bvd:

Если г-н Kryukov готов предоставить для тестирования свою ПМ (+ в достаточной мере документированные возможности по расчету ссылочной связности), то, мне кажется, это будет интересно.

Собственно и качественные рекомендации могут быть только как результат эксперимента.

Ну, откровенно говоря, к такой постановке вопроса я, кажется, не готов. Пардон, чем же я сам тады заниматься буду :). Впрочем, подумать надо...

Спасибо itman за занятную ссылку

Кстати, решил добавить вопрос. А что означает это самое "в достаточной мере документированные возможности по расчету ссылочной связности"? Т.е. вы хотите знать считалось ли это как описывал Брин с Пейджем? Или Вы хотите узнать, как мне это физически удается? Или еще что-то?

itman:
Ага, тот самый Крюков. :-) И спрашивает нас как учитывать PR при оценке релевантности. Дима, скажите, а не хватит ли Рунету поисковых машин? Яндекс, Рамблер, Апорт, Гугль, Яху, Мсн, еще же ведь есть как минимум пара стартапов Нигма, Вебальта.

Зря Вы так :) Вопрос интересный и вовсе не праздный. Мне он интересен со многих точек зрения, в том числе и с той, как об этом думают люди, находящиеся на некоторой дистанции от создания хьюдж енжин. Что касается поисковиков - так это мое хобби, к тому же, это замечательное место для экспериментов (правда не очень дешевое). Так что, если кому не жалко - идеи в студию. Возможно я поделюсь опробованными моделями :)

Dip, Может прокомментируете свое ИМХО :) (я тоже так когда-то считал, может опять вернусь ;) )

ЗодчийТеней:

именно его, описаны лишь правила и принципы, но реализация индивидуальна в каждом конкретном случае своя

Мне не интересно, как его другие считают :) ибо в своей коллекции 120 млн. документов я его уже посчитал для каждого документа.

ЗодчийТеней:

касательно моего мнения, он позволяет повысить релевантность выдаваемых страниц :-), но вот алгоритм оценки, я бы тоже очень хотел узнать, мне еще лишь предстоит реализовать нечто подобное, хотя я и не согласен на все 100 с методикой, но альтернативы не вижу, а над ней бились умы на порядки выше доступных мне :-)

PageRank - всего лишь одна из метрик в оценке релевантности, по моему мнению, отнють не самая важная, а вот степень и характер ее влияния хочется знать :)

ЗодчийТеней:
касательно "ПОСМОТРЕТЬ" а почему собственно нет? форум посвящен именно поисковым системам, выложите на суд общественности свою реализацию

Прототип на www.turtle.ru

ЗодчийТеней:
создаем поисковик заново :-),шуту конечно не полностью а лишь 99% :-) но боюсь что алгоритм ПР вам никто не расскажет, лишь догадки и предположения
з.ы. хотелось бы взглянуть на этот поисковик, если можно конечно

Алгоритм вычисления ПР (если Вы имели ввиду PageRank) известен и описан фиг-знает с каких времен, задолго до гугля. Интересует _ВАШЕ_МНЕНИЕ_ о степени и характере его влияния на результирующую релевантность. Именно не то, как это у кого-то сделано, а предположения, как может/должно влиять. Это и есть догадки и предположения :) а я готов их попробовать

Что касается вопроса посмотреть, я не уверен можно ли тут давать прямые ссылки.

1 2345 6
Всего: 59