Cage

Рейтинг
82
Регистрация
17.08.2002
Интересы
Музыка, электрогитара
alut:
За скрытый текст (и скрытые ссылки), по моему, давно автомат. Даже робот дмоза это умеет делать.

Несколько лет назад кто-то на форуме приводил пример...

background'ы могут быть и у body, и у table, и у td. Кроме того, у многих элементов может быть задан цвет фона, могут быть прописаны стили. Для текста тоже можно задать цвет в теге font и исправить его стилями (и сделать это не один раз). И как же машина определит, скрыт текст или нет? :)

Основная проблема здесь, конечно же, в картинках (background)...

asdfqwer:
каким образом я могу теперь это использовать и что мне дает твоя формула?

Как это использовать Вы должны решить сами в меру своих потребностей и способностей. А на вопрос, что дает формула, есть ответ в моей теме "Формула релевантности".

Miha Kuzmin (KMY):
ибо нужно во-первых иметь полностью аналогичную базу

Не понятно зачем. В моем методе это не нужно :)

Miha Kuzmin (KMY):
во-вторых, мы не знаем какие факторы, кроме общеизвестных яндекс вообще использует

Это действительно так. Но не стоит забывать, что количество характеристик сайта, доступных Яндексу для анализа ограничено. Большинство из них доступны для анализа.

Sergey_Z:
Я лично очень согласен с этим...

Вы согласны с тем, что решив прямую задачу не всегда можно решить обратную. Я тоже с этим согласен. Только в данном случае это не так. Рассматриваемая задача очень похожа на задачу параметрической идентификации, которые успешно решаются. Не вдаваясь в подробности, предлагаю Вам обратить внимание на пример (я же привел пример ☝). В нем решена обратная задача. По-моему более наглядное доказательство того, что обратная задача в данном случае имеет решение, и представить сложно :).

Shema:
Зависимость с большой вероятностью линейная (ресурсы-то не резиновые у Яндекса!)

Когда-то давно мы разговаривали с Казаком про его теорию разных d (при расчете PR). Я предположил, что поисковой системе так считать было бы очень трудно. Он мне задал вопрос, который я теперь хочу задать Вам. А хранить копию каждой (!) страницы в Интернете легче?

На мой взгляд, нелинейные зависимости - это обязательное условие адекватного формирования выдачи. Можно взять ту же плотность слова в тексте. Неужели это правильно, что с увеличением плотности до 100% страница получает наибольшую прибавку к релевантности "за плотность"? Конечно нет! Плотность слова в тексте равная 100%, это 100% поисковый спам.

По-моему гораздо более адекватно себя бы вела функция

=33*A1+3000*A1^2-280000*A1^3+8*10^6*A1^4-6*10^7*A1^5

(можете построеть ее в Excel для значений от 0 до 0,09).

Релевантность плавно растет до 7%, а потом резкий спад. Если бы она не уходила сильно в минус при плотности >%9, она была бы почти совершенна :). Но подобрать более удачную формулу - дело техники.

Shema:
есть всякого рода форс-мажорные (понижающие) факторы, я бы к ним отнёс фильтры и глюки базы

Я уже когда-то писал, что фильтры и глюки, в результате действия которых страницы выпадают из выдачи или опускаются слишком сильно вниз вообще не оказывают влияния на результат. Они просто не участвуют в расчетах.

Shema:
Вышеуказанным методом можно разве что проанализировать как влияют внутренние факторы, читай, разные теги, да это и так более менее известно и не представляет большого интереса.

Ключевые слова здесь "более менее". В SEO вообще все "более менее" известно. Уверен, что, казалось бы, на простой вопрос, оказывает ли влияние на выдачу тег <i> или <em>, Ваш ответ был бы "...ну..., может быть..., но это влияние очень мало..." :). Что касается более сложных вопросов, например,

1. На сколько более сильное влияние оказывают слова в теге <title>, чем в тексте страницы.

2. На сколько должен увеличиться ссылочный бюджет, если заказчик не хочет, чтобы слово употреблялось на сайте.

то я вообще сомневаюсь, что кто-то знает на них ответы.

Исследовать таким образом можно не только внутренние факторы, конечно же.

Но понадеемся на Миху

Недоалгебра очередная, короче.

Человек во всем разобрался и знает, о чем говорит! :)

Mr_Promoter:
В жизни таких выборов судьба дает огромное количество раз, но как правило верный путь не всегда самый очевидный

"Входите тесными вратами, потому что широки врата и пространен путь, ведущие в погибель, и многие идут ими;

Потому что тесны врата и узок путь, ведущие в жизнь, и немногие находят их." (Мф 7:13-14)

Miha Kuzmin (KMY):
Допустим, возможно предчувствие чего-то в ближайшем будущем. Думаем логически. Что это значит ? Это значит что ближайшее будущее полностью предопределено. А ведь это не так - ибо всегда есть вероятность, условно, что я дам кому-то в морду, или не дам.

Во-первых, в нашем мире есть определенные "правила" и законы. Они действуют в разных смыслах. Если Вы подбросите камень - он упадет, если Вы скажете что-то обидное человеку - он обидится.

Во-вторых, у каждого человека есть свобода воли (вот про морду Вы очень удачно заметили :)). Но... свободы воли нет у животных, предметов, явлений. Они подчиняются определенным законам, которые Создателю (в отличие от людей) очень хорошо знакомы.

СКОРПИОН привел очень хороший пример с розеткой.

Другой пример. Вы выпили два литра пива. После этого я могу утверждать, что Вы захотите "справить нужду". И Вы можете говорить, что ничего не предопределено ("ибо всегда есть вероятность"), но можете мне поверить, что так оно и будет, несмотря на Вашу свободу воли :)

Что касается нашего примера с самолетом. Я считаю, что речь скорее идет не о предопределенном событии, а о наиболее вероятном. Летчики (в силу своей свободы воли) могли в самый последний момент вообще отказаться от полета. Все было бы по-другому, но согласитесь, это очень маловероятно.

Есть еще один момент. Задумайтесь не только о тех, кто по каким-то причинам не полетел и выжил. Те, кто погибли, и те, кто полетели и выжили, тоже находятся в этих цепочках причинно-следственных связей. Очень вероятно, что люди, которые выжили в этой катастрофе, должны были это пережить и должны жить дальше.

А может это повод для Вас (и для многих других) пересмотреть свое мировоззрение:

Miha Kuzmin (KMY):
Эээ... Я не верю в бога, зелененьких человечков, ангелов и прочее... Имхо, жизнь гораздо хреновей и приземленнее.

?

funnybunny, поздравляю ;)

P.S. Для размышления.

Некоторые люди в курсе, что рано или поздно произойдет конец света (в некотором смысле). Означает ли это, что все предопределено?

Мой вариант решения:

оптимизировать страницу по запросу

купить квартиру

ставить внешние ссылки

купить квартиру москва

P.S. Пара запросов для размышления

купить квартиру -москва +москва
купить квартиру -москва !москва
Миныч:
...по вопросам, которые меня мало волнуют, так как это для меня пройденный этап.

:)

Все, вопросов к Вам больше не имею.

wolf:
Не хватает одной простой вещи - возможности точно оценить, какой вклад в ссылочное ранжирование может дать текстовая ссылка с того или иного документа. Поэтому тем, кто покупает ссылки, серьёзные части ссылочного бюджета приходится тратить впустую.

Вот Миныч писал:

Встает вопрос о покупке ссылок. Клиент имеет предложения (разной стоимости), например, от 3 морд. Я провожу анализ и ИЗМЕРЯЮ, что ссылка с 1й морды дает, например 1 яндекс , со второй 4, а с 3й, 1,5 яндекса. Вторая морда стоит 400 баксов, 3я 100, а 1я вообще не подойдет, так как ее не хватит, чтобы обойти конкурента. Т.е. я фактически могу помочь сэкономить время и минимизировать расходы на покупные ссылки.
Wolf, кто бы Вам ни оказывал эту услугу, Вам все равно (первое время) пришлось бы как-то поверять адекватность выводов своими силами (методами).

Если Вас интересует эта услуга, и нашелся человек, который (якобы) может ее оказывать, почему бы Вам не договориться о сотрудничестве? Устроит качество - Вы платите. Не устроит - проводите "разоблачение" :)

alut:
прочитайте внимательно - ссылку Вам дали - и поищите на форуме обсуждение этой темы полгода назад.

Читал я это обсуждение. Там вообще ничего не понятно (об этом уже писал Трофименко в своем блоге). Ссылки я давал чуть Выше в этой теме. Чуть более осмысленное обсуждение (имхо) есть на seochase.com. Там люди тоже задавали вопросы, и тоже на многие из них не получали ответы.

alut:
Все не так просто, как Вам кажется.

Все намного проще, правда? :)

Миныч:
Любая монотонная функция (где важно, что y1>y2, если x1>x2) пригодна для ранжирования. Или Вы какой-то другой смысл вкладываете?

Я знаю, что в порядковой шкале допустимы все строго возрастающие преобразования (называйте вещи своими именами). Речь не об этом.

Вы используете конкретную формулу и при этом пишете

Если же Вы возьмете другую ФУНКЦИЮ (НЕ РЕЗУЛЬТАТЫ ИЗМЕРЕНИЙ, а ИХ ОБСЧЕТ ИНОЙ формулой), то повторяемость БУДЕТ 100%

Я предлагаю Вам использовать функцию y=x. Если Вам трудно в Вашем файле заменить Вашу формулу на эту, я могу это сделать за Вас (только скиньте мыло в личку, чтобы мне было куда выслать файл). Если Вы это сделаете, то Вы увидите, что результаты, которые у Вас были одинаковыми, станут совершенно разными...

Миныч:
В плане более близком к науке и технике :) вот здесь:
Поисковые машины как ранжирующие системы Введение метрики и измерения я предложил один из способов измерения веса страниц для любой поисковой машины.

Я предлагаю обсудить эту статью...

Миныч:
Я нигде вроде слово "ранг" не использовал, что за зверь?

И Вы еще говорите о научности :)

Ранг – это номер (объекта экспертизы) в вариационном ряду (упорядоченном ряду) значений характеристики у различных объектов.

В нашем случае, это позиция страницы в выдаче.

Естественно, Вы такой термин не использовали, зато Вы с легкостью придумываете новые термины :)

Известно (хотел написать "общеизвестно", но как мы видим, это известно не всем :)), что вычитая из одного ранга другой, Вы получаете, в общем-то, бессмысленную величину. Это как перемножение номеров телефонов или сложение номеров паспортов :)

Так вот в этом и заключается вопрос. На каком основании Вы обращаетесь с рангами (объектами, измеренными в порядковой шкале) как с элементами линейного пространства? Как после этого можно делать какие-то выводы?

Миныч:
Проанализировать можно, но на предмет ЧЕГО? Если это будет полезно и мне и сообществу, то можно и проанализировать, а если просто из принципа, то надо подумать... Или Вы считаете, что у меня много времени на ликвидацию безграмотности

Ну про безграмотность лучше не будем говорить... :)

Про пользу сообществу тоже (сообщество что-то очень сомневается в пользе всех этих методов).

Но Вам (надеюсь) это было бы полезно.

Вы в своей статье мерили расстояния в "физиках", "математиках" и "главбухах".

Я Вам предлагаю сделать то же самое по запросу "недвижимость|вышивание" и поделиться с нами Вашими выводами (например, относительной релевантностью сайтов в первой десятке по запросу "недвижимость").

Миныч:
Возьмете произвольные цифры: получите произвольные результаты.

Цифры то произвольные, но результаты _не_ произвольные. Результаты как у Вас :)

Вы опять пропустили основные (наверное, самые неудобные :)) вопросы.

Напомню их Вам:

Взять функцию y=x (т.е. обойтись одной нормировкой без преобразований) можно?

На каком основании Вы из рангов вычитаете ранги?

Имеет ли значение запрос?
Проанализируйте выдачу по запросу "недвижимость|вышивание".

Эти вопросы очень наглядно демонстрируют все стороны Вашей методики...

Я Вас уверяю, гораздо интереснее и конструктивнее начать обсуждение с них, а не с какой-то там "тошноты" :)

Теркин:
Тут я не спрашиваю, так ли на самом деле, я спрашиваю возможность такой ситуации.

Я считаю, что такая ситуация возможна: слагаемое (1-d) больше, чем d*sum(...).

Но ничего конкретного о них (слагаемых) я сказать не могу. Вообще-то как раз Ваш эксперимент должен был бы пролить свет на этот вопрос...

Теркин:
Теперь непонятно если начальный маленький, а по ссылке передается его основная часть. То почему нельзя пренебречь маленьким значением?

Ну Вы договаривайте :)

...основная часть, поделенная на количество ссылок, которых на странице обычно довольно много. Тут совершенно не очевидно, какое слагаемое больше.

Тем более, не будем забывать, что расчет PR - процесс итерационный. Поэтому любые расчеты для одной страницы или для одного шага пересчета не очень корректны.

Теркин:
Мы сложили весь ПР получили 1.
Теперь все эти страницы поставили по одной ссылке на другие страницы. Соответственно ПР на других страницах вырос. Количество страниц не изменилось. Сумма ПР тоже выросла и уже больше 1.
По-моему нельзя предугадать сумму ПР. Можно определить самое большое значение суммы ПР и нормировать. С этим я не спорю, но сумма будет меньше либо равна 1.

Это уже обсуждалось в этой теме. PR пересчитывается сразу для всех. Расчет представляет собой решение системы уравнений. Решили. Пронормировали. Сумма равна одному.

2 alut

Вроде все верно. Я бы еще добавил, что

- диапазон ссылок "от 31 до 100 на каждой" лично для меня не очевиден;

- "округленность от 5,0 до 5,9" вполне может до 5 округляться по-другому, например, от 4,5 до 5,49.

Теркин:
Выходит что начальный ПР очень большой, а по ссылке передается очень маленькая его часть?

Нет. Вот там где Вы придумали и выделяли множества различных PR, Вы можете выделить еще одно множество: PR посчитан для всех страниц, но не нормирован по единице. Такой PR можно посчитать по формуле

PR = (1-d) + d*sum(...)

Но после такого подсчета понадобится нормировка, т.к. в результате решения системы таких равенств сумма всех PR может быть больше 1. Здесь значение (1-d) ~ 0,15 и PR имеет сравнительно большое значение.

Но можно воспользоваться формулой

PR = (1-d)/N + d*sum(...)

Здесь в результате решения системы PR будет нормирован по единице, т.е. значения PR будут очень маленькими, но (обратите внимание) слагаемое (1-d) в свою очередь делится на N (число страниц в интернете, очень большое число).

Таким образом, оба слагаемых (и начальный "бонус" страницы за ее существование, и PR, передаваемый внешними ссылками) могут оказаться "сопоставимыми" друг другу (для страниц с очень низким PR).

Теркин:
Вот здесь я не понял, почему сумма равна 1. Вы наверное хотели сказатьa не больше 1.

Считается, что PR - это вероятность нахождения пользователя на какой-то странице в интернете. Также считается, что на какой-то странице он находится в любом случае, поэтому sum(PR)=1.

Теркин:
А вообще первый раз слышу об этом. Формулу с N видел недавно в одной статье, но не придал этому значения. Видимо все-таки придется прочитать ту статью. =)

Конечно ее стоит почитать. И даже ссылку не плохо бы оставить, чтобы ее могли почитать все, в том числе и я ;)

Всего: 220