- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи
И выявили более 7 млн подозрительных пользователей
Оксана Мамчуева
Да нет, я так не думаю. Кстати, ты так и не ответил на мои возражения по поводу индикации PR в тулбаре. Хотелось бы что-нибудь от тебя услышать по этому поводу.
Казак, вот ты в который раз не отвечаешь на вопрос про "малоценные ссылки". Ты писал:
-дело в том, что эта оговорка про малоценные ссылки во многих случаях дала бы тебе возможность оправдываться. Но я этого не хочу допустить :)
Ладно, не хочешь отвечать - не надо. Поработаем с тем, что есть.
Расчеты, приведенные ниже, делаются на основе шкалы Казака - округлении PR до десятых долей, предполагая, что PR всегда <1:
_____________
Рассмотрим приснопамятный Cossack's web, и именно раздел Web design:
PRtoolbar=6/10 http://www.cossack.org.uk/web_design/
С нее мы видим 17 ссылок на пункты меню, и 12 ссылок на статьи.
Возьмем одну из статей, не из начала, чтобы она не попала в анонсы на главной, например авторскую "статью" Web Site Templates, написанную 23 сентября:
PR=5/10, http://www.cossack.org.uk/web_design/publication34
__________
Начинаем считать.
Поскольку для оченьнизкоцитируемой, но проиндексированной Гуглем страницы PRtoolbar=0/10, делаем вывод, что (1-d)<0.1 -- это для ориентировки, хотя это и не сильно важно.
(1-d - это по формуле минимальный ПР, который имеет страница).
Что у нас для http://www.cossack.org.uk/web_design/ ?
PR=0.55 - 0.6499, пусть по максимуму 0.65
Ссылок 29-30, но 17 из них из меню - повторяются на всех страницах, а уникальных, возьмем по минимуму - 10 (это ссылки на статьи).
Зачем я беру максимальный ПР и минимальное количество сслыок в расчете? Затем, чтобы частное от деления PR/(число ссылок) получилось максимальным.
А теперь посчитаем, какой должен быть ПР на одной из десяти страниц-статей, на каждую из которых есть одна ссылка с этого раздела:
PR=(1-d)+d*0.65/10 = (1-d)+d*0.065
Т.е., этот ПР лежит в пределах от 0 до 0.16499 по-любому, т.е. МАКСИМАЛЬНЫЙ ПР после округления = 2/10
Однако, для http://www.cossack.org.uk/web_design/publication34
ПР=от 0.45 до 0.5499, что в любом случае больше, чем рассчитанное значение по шкале Казака и линейной модели.
Т.е, даже при максимальном d=1 все равно этот ПР=0.45 не достигается!
_____________
Вывод: линейная шкала (которую использует Казак) - говно. Ибо не описывает экпериментальные данные.
И расчеты, которые Казак делает на основе этой шкалы - сами понимаете... :) Вообще - то, на эти расчеты Казак только намекает, но никогда их не показывает...
___
ЗЫ Если работать с числами PR не 0.6-0.5, а 6-5, - получится то же самое. :)
Поскольку для очень низкоцитируемой, но проиндексированной Гуглем страницы PRtoolbar=0/10, делаем вывод, что (1-d)<0.1
...
А теперь посчитаем, какой должен быть ПР на одной из десяти страниц-статей, на каждую из которых есть одна ссылка с этого раздела:
PR=(1-d)+d*0.65/10 = (1-d)+d*0.065
Т.е., этот ПР лежит в пределах от 0 до 0.16499 по-любому, т.е. МАКСИМАЛЬНЫЙ ПР после округления = 2/10
...
Т.е, даже при максимальном d=1 все равно этот ПР=0.45 не достигается!
Казак уже наверное замучался всем повторять, что d для разных страниц разный. Т.е. никакие оценки для d на его странице через d страниц с PR(bar)=0 не годятся.
PR по твоей формуле, euhenio, изменяется от 0,065 до 1.
Кстати PR=0,5325 при d=0.5
Вывод: линейная шкала (которую использует Казак) - говно. Ибо не описывает экпериментальные данные.
И расчеты, которые Казак делает на основе этой шкалы - сами понимаете... :)
Так что все твои расчеты _ничего_ не доказывают. И не смотря на то, что я не согласен Казаком, что d разный, или что шкала линейная, я считаю, что у него достаточно стройная теория, которую не так-то легко опровергнуть ;)
Кстати, а откуда он это взял? Ни у кого из отцов-основателей и их проследователей (даже самых смелых :)) я и намёка не нашел на то, что d может быть разный, во всех формулах - это скаляр, а никак не вектор. Вот даже про векторный PR в той же статье "Topic-Sensitive PageRank" встречал, но никак не про d...
ну рядом стоящие PR5-PR6 можно линеаризировать с некоторой ошибкой которую можно уменьшить подобрав d. Надо бы пример скажем страницы с PR5 которая ЗАРАБОТАЛА свой PR за счет ссылок от страниц с PR0..3
То есть через ступень, тогда линеаризировать будет труднее. Похоже что в случае если в расчетах участвую только страницы с PRN и N+1 линейная модель может быть подогнана с помощью d под любой мыслимый вариант. Для опровержения линейной модели этом случае надо делать расчеты над группами однотипных страниц...тогда вариативность d было бы крайне трудно объяснить (страницы одной тематики и одного PR то d=const).
---
Конечно в реале вероятность ухода визитера для разных страниц разная и наверное и от времени суток зависит :-)
Cage в данном случае уже зная PR-ы страниц показал возможность подогнать d...но откуда тогда гугл узнает эти разные d для разных страниц до вычисления их PR?
---
to Cage:
Т.е. никакие оценки для d на его странице через d страниц с PR(bar)=0 не годятся.
А почему собственно? Была страница с PR0, d=0.8 - поставили на нее линк с PR6, получили что страница с PR5, и что теперь у нее и d изменится? с какой стати? (content=const конечно) - то есть d не зависит от PR страницы.
Cage,
-то, что утверждал Казак - это что есть 2 типа страниц (хабы и ауторити), для которых используются разные d!
d - в данном случае ты используешь как способ подгонки! :) А на самом-то деле это осмысленный параметр. Ты, установив d "близким к нулю", фактически приравниваешь PR страницы к PR Гугля. Это как, нравится тебе? :)
Если уж ты говоришь "за различные d", проследи его связь с качеством страницы тогда. d=0 => PR=1 - самый большой ПР. Но d=0 означал бы по уму чрезвычайно низкое качество страницы.
Поэтому я здесь изменяю d в некоторых пределах, оцененных выше в единицах ПР (1-d)<0.1. Заметь, даже Казак против этого пока не возражал (может, првда, не успел? :))
Понимаешь, дело в том что шкала линейная, как у Казака, еще и не учитывает того, что d/(N) делится на число страниц.
А теорией я бы это не назвал. :) Отмазка это.
-пределы изменения d.
euhenio, wolf. Ну у меня лично уже сил нет смотреть как вы мучаетесь. Ну просто есть близкие и постоянно наблюдаемые вещи которые, тем не менее, не могут быть нами изменены. Ежедневный восход солнца, отношения мужчины и женщины, точка росы при определенных условиях, сломаная дверь морга первой Градской... ну вы можете дополнить в этот список мнение Cossack'а.
В написаном уже достаточно ссылок и достаточно рассчетов. Тот кто не сможет определиться со своим мнением по уже зафиксированной части дискуссии, ну и... бог с ним. Такого человека мучать продолжением не надо.
почему же - очень интересно! всплывают новые детали... приводятся более точные расчеты...
Про логарифмы? Хо-хо... Не смешите меня. Может вам стоит начать со свойств логарифмов? Шкала показана в Toolbar, она может соотносится с расчетными данными либо с округлением, либо с отсечкой и округлением. Кстати, формулы ты взял из 2-х разных источников, а ссылку дал на третий ;). Про то как ты там передернул - даже не хочется говорить... Ну перепутал человек, ну с кем не бывает во время праздников. Там просто слагаемые переставлены местами, видимо оно и смутило тебя. Там d или его аналог не делятся ни на что. Этот фактор действительно определят многое, и у Брина дано определение его смысла ;).
Меня интересует не правильность моего мнения, а возможность получить ответ, близкий к истинному ;). Ты это знаешь ;).
По расчетам: ты что считаешь, euhenio?
На Web Site Templates ведет только одна ссылка с Web Design, значит берем и расчитываем по ней [на основе The Anatomy of a Large-Scale...]:
.54 = 1 - d + d*(.64/28)
.54 = 1 - d + d*(.55/28)
.45 = 1 - d + d*(.64/28)
.45 = 1 - d + d*(.55/28)
Так верно? d подсчитать можешь? Оно в заданных пределах? Попробуем более сложный пример?
Про логарифмы? Хо-хо... Не смешите меня.
Никто не собирается тебя смешить. Не про логарифмы. Я имею в виду вот эти два возражения:
Возражение 1.
Получается, что не выполняется условие, что сумма PR всех документов равна 1. Как ты это объяснишь, Акис? На это условие просто забили?
Возражение 2.
По твоему, получается, что PR, положим, морды Яндекса всего лишь менее чем в четыре (!) раза больше PR, к примеру, вот такого вот шедевра веб-строительства: http://unidentified.narod.ru/ Не слишком ли большая плотность результатов?
Хотелось бы получить ответы по обоим пунктам.
Разные нотации одной и той же формулы сути дела не меняют.
Ты думаешь, подобные вещи могут смутить дипломированного математика? :)
Делится. ибо чтобы выполнялось условие единичной суммы всех PR (а это условие есть! Только кто-то о нём упорно забывает), оно просто обязано делиться, вернее, выражаясь более корректно, к свободному члену в каждом уравнении системы должен добавляться множитель 1/N, где N - число уравнений в системе или же количество рассматриваемых документов. Это можно легко показать, проведя ряд несложных манипуляций с уравнениями в системе. Попрактикуйся на досуге. Когда же Брин с Пейджем рассматривают для примера одно уравнение в своей обзорной статье "The Anatomy...", то N=1, и соответственно, они этим множителем пренебрегли. В более серьёзной статье "The PageRank Citation Ranking..." они уже используют матричную форму записи и возникает упоминание о некоем важном векторе E как множителе при свободном члене, однако его значение не конкретизируется. У Хавеливалы в эго ретроспективном обзоре классического алгоритма PageRank используется тоже матричная форма записи системы, но множитель уже конкретизируется как Nx1 вектор p=[1/N]. Неужно ты думаешь, что Хавеливала это нарочно придумал, преследуя какие-то свои цели? То что он начал сам придумывать, начинается с пункта 3 его статьи.