Несколько лет назад кто-то на форуме приводил пример...
background'ы могут быть и у body, и у table, и у td. Кроме того, у многих элементов может быть задан цвет фона, могут быть прописаны стили. Для текста тоже можно задать цвет в теге font и исправить его стилями (и сделать это не один раз). И как же машина определит, скрыт текст или нет? :)
Основная проблема здесь, конечно же, в картинках (background)...
http://en.wikipedia.org/wiki/Cult_film
Как это использовать Вы должны решить сами в меру своих потребностей и способностей. А на вопрос, что дает формула, есть ответ в моей теме "Формула релевантности".
Не понятно зачем. В моем методе это не нужно :)
Это действительно так. Но не стоит забывать, что количество характеристик сайта, доступных Яндексу для анализа ограничено. Большинство из них доступны для анализа.
Вы согласны с тем, что решив прямую задачу не всегда можно решить обратную. Я тоже с этим согласен. Только в данном случае это не так. Рассматриваемая задача очень похожа на задачу параметрической идентификации, которые успешно решаются. Не вдаваясь в подробности, предлагаю Вам обратить внимание на пример (я же привел пример ☝). В нем решена обратная задача. По-моему более наглядное доказательство того, что обратная задача в данном случае имеет решение, и представить сложно :).
Когда-то давно мы разговаривали с Казаком про его теорию разных d (при расчете PR). Я предположил, что поисковой системе так считать было бы очень трудно. Он мне задал вопрос, который я теперь хочу задать Вам. А хранить копию каждой (!) страницы в Интернете легче?
На мой взгляд, нелинейные зависимости - это обязательное условие адекватного формирования выдачи. Можно взять ту же плотность слова в тексте. Неужели это правильно, что с увеличением плотности до 100% страница получает наибольшую прибавку к релевантности "за плотность"? Конечно нет! Плотность слова в тексте равная 100%, это 100% поисковый спам.
По-моему гораздо более адекватно себя бы вела функция
=33*A1+3000*A1^2-280000*A1^3+8*10^6*A1^4-6*10^7*A1^5
(можете построеть ее в Excel для значений от 0 до 0,09).
Релевантность плавно растет до 7%, а потом резкий спад. Если бы она не уходила сильно в минус при плотности >%9, она была бы почти совершенна :). Но подобрать более удачную формулу - дело техники.
Я уже когда-то писал, что фильтры и глюки, в результате действия которых страницы выпадают из выдачи или опускаются слишком сильно вниз вообще не оказывают влияния на результат. Они просто не участвуют в расчетах.
Ключевые слова здесь "более менее". В SEO вообще все "более менее" известно. Уверен, что, казалось бы, на простой вопрос, оказывает ли влияние на выдачу тег <i> или <em>, Ваш ответ был бы "...ну..., может быть..., но это влияние очень мало..." :). Что касается более сложных вопросов, например,
1. На сколько более сильное влияние оказывают слова в теге <title>, чем в тексте страницы.
2. На сколько должен увеличиться ссылочный бюджет, если заказчик не хочет, чтобы слово употреблялось на сайте.
то я вообще сомневаюсь, что кто-то знает на них ответы.
Исследовать таким образом можно не только внутренние факторы, конечно же.
Но понадеемся на Миху
Человек во всем разобрался и знает, о чем говорит! :)
"Входите тесными вратами, потому что широки врата и пространен путь, ведущие в погибель, и многие идут ими;
Потому что тесны врата и узок путь, ведущие в жизнь, и немногие находят их." (Мф 7:13-14)
Во-первых, в нашем мире есть определенные "правила" и законы. Они действуют в разных смыслах. Если Вы подбросите камень - он упадет, если Вы скажете что-то обидное человеку - он обидится.
Во-вторых, у каждого человека есть свобода воли (вот про морду Вы очень удачно заметили :)). Но... свободы воли нет у животных, предметов, явлений. Они подчиняются определенным законам, которые Создателю (в отличие от людей) очень хорошо знакомы.
СКОРПИОН привел очень хороший пример с розеткой.
Другой пример. Вы выпили два литра пива. После этого я могу утверждать, что Вы захотите "справить нужду". И Вы можете говорить, что ничего не предопределено ("ибо всегда есть вероятность"), но можете мне поверить, что так оно и будет, несмотря на Вашу свободу воли :)
Что касается нашего примера с самолетом. Я считаю, что речь скорее идет не о предопределенном событии, а о наиболее вероятном. Летчики (в силу своей свободы воли) могли в самый последний момент вообще отказаться от полета. Все было бы по-другому, но согласитесь, это очень маловероятно.
Есть еще один момент. Задумайтесь не только о тех, кто по каким-то причинам не полетел и выжил. Те, кто погибли, и те, кто полетели и выжили, тоже находятся в этих цепочках причинно-следственных связей. Очень вероятно, что люди, которые выжили в этой катастрофе, должны были это пережить и должны жить дальше.
А может это повод для Вас (и для многих других) пересмотреть свое мировоззрение:
?
funnybunny, поздравляю ;)
P.S. Для размышления.
Некоторые люди в курсе, что рано или поздно произойдет конец света (в некотором смысле). Означает ли это, что все предопределено?
Мой вариант решения:
оптимизировать страницу по запросу
ставить внешние ссылки
P.S. Пара запросов для размышления
:)
Все, вопросов к Вам больше не имею.
Вот Миныч писал:
Если Вас интересует эта услуга, и нашелся человек, который (якобы) может ее оказывать, почему бы Вам не договориться о сотрудничестве? Устроит качество - Вы платите. Не устроит - проводите "разоблачение" :)
Читал я это обсуждение. Там вообще ничего не понятно (об этом уже писал Трофименко в своем блоге). Ссылки я давал чуть Выше в этой теме. Чуть более осмысленное обсуждение (имхо) есть на seochase.com. Там люди тоже задавали вопросы, и тоже на многие из них не получали ответы.
Все намного проще, правда? :)
Я знаю, что в порядковой шкале допустимы все строго возрастающие преобразования (называйте вещи своими именами). Речь не об этом.
Вы используете конкретную формулу и при этом пишете
Я предлагаю Вам использовать функцию y=x. Если Вам трудно в Вашем файле заменить Вашу формулу на эту, я могу это сделать за Вас (только скиньте мыло в личку, чтобы мне было куда выслать файл). Если Вы это сделаете, то Вы увидите, что результаты, которые у Вас были одинаковыми, станут совершенно разными...
Я предлагаю обсудить эту статью...
И Вы еще говорите о научности :)
Ранг – это номер (объекта экспертизы) в вариационном ряду (упорядоченном ряду) значений характеристики у различных объектов.
В нашем случае, это позиция страницы в выдаче.
Естественно, Вы такой термин не использовали, зато Вы с легкостью придумываете новые термины :)
Известно (хотел написать "общеизвестно", но как мы видим, это известно не всем :)), что вычитая из одного ранга другой, Вы получаете, в общем-то, бессмысленную величину. Это как перемножение номеров телефонов или сложение номеров паспортов :)
Так вот в этом и заключается вопрос. На каком основании Вы обращаетесь с рангами (объектами, измеренными в порядковой шкале) как с элементами линейного пространства? Как после этого можно делать какие-то выводы?
Ну про безграмотность лучше не будем говорить... :)
Про пользу сообществу тоже (сообщество что-то очень сомневается в пользе всех этих методов).
Но Вам (надеюсь) это было бы полезно.
Вы в своей статье мерили расстояния в "физиках", "математиках" и "главбухах".
Я Вам предлагаю сделать то же самое по запросу "недвижимость|вышивание" и поделиться с нами Вашими выводами (например, относительной релевантностью сайтов в первой десятке по запросу "недвижимость").
Цифры то произвольные, но результаты _не_ произвольные. Результаты как у Вас :)
Вы опять пропустили основные (наверное, самые неудобные :)) вопросы.
Напомню их Вам:
Эти вопросы очень наглядно демонстрируют все стороны Вашей методики...
Я Вас уверяю, гораздо интереснее и конструктивнее начать обсуждение с них, а не с какой-то там "тошноты" :)
Я считаю, что такая ситуация возможна: слагаемое (1-d) больше, чем d*sum(...).
Но ничего конкретного о них (слагаемых) я сказать не могу. Вообще-то как раз Ваш эксперимент должен был бы пролить свет на этот вопрос...
Ну Вы договаривайте :)
...основная часть, поделенная на количество ссылок, которых на странице обычно довольно много. Тут совершенно не очевидно, какое слагаемое больше.
Тем более, не будем забывать, что расчет PR - процесс итерационный. Поэтому любые расчеты для одной страницы или для одного шага пересчета не очень корректны.
Это уже обсуждалось в этой теме. PR пересчитывается сразу для всех. Расчет представляет собой решение системы уравнений. Решили. Пронормировали. Сумма равна одному.
2 alut
Вроде все верно. Я бы еще добавил, что
- диапазон ссылок "от 31 до 100 на каждой" лично для меня не очевиден;
- "округленность от 5,0 до 5,9" вполне может до 5 округляться по-другому, например, от 4,5 до 5,49.
Нет. Вот там где Вы придумали и выделяли множества различных PR, Вы можете выделить еще одно множество: PR посчитан для всех страниц, но не нормирован по единице. Такой PR можно посчитать по формуле
PR = (1-d) + d*sum(...)
Но после такого подсчета понадобится нормировка, т.к. в результате решения системы таких равенств сумма всех PR может быть больше 1. Здесь значение (1-d) ~ 0,15 и PR имеет сравнительно большое значение.
Но можно воспользоваться формулой
PR = (1-d)/N + d*sum(...)
Здесь в результате решения системы PR будет нормирован по единице, т.е. значения PR будут очень маленькими, но (обратите внимание) слагаемое (1-d) в свою очередь делится на N (число страниц в интернете, очень большое число).
Таким образом, оба слагаемых (и начальный "бонус" страницы за ее существование, и PR, передаваемый внешними ссылками) могут оказаться "сопоставимыми" друг другу (для страниц с очень низким PR).
Считается, что PR - это вероятность нахождения пользователя на какой-то странице в интернете. Также считается, что на какой-то странице он находится в любом случае, поэтому sum(PR)=1.
Конечно ее стоит почитать. И даже ссылку не плохо бы оставить, чтобы ее могли почитать все, в том числе и я ;)