Cage

www.webshops.ru

Рейтинг

Регистрация

17.08.2002

Интересы

Музыка, электрогитара

Поиграем в icq?

22 декабря 2006, 17:13

юни:
офф небольшой...

Я так понимаю, это камень в мой огород :)

юни:
Что вот многие так заморочены заклинанием "полезные ссылки", "тематика" и прочее ЛСД/АДСЛ? Очнитесь уже, ей богу, встаньте на место обычного человека.

Оперировать только понятием "тематика" не очень корректно. Перечитайте вот это, плиз, прежде, чем мы продолжим

Я считаю, что такие ссылки программно определяются очень просто. Яндекс умеет определять тематику, у Яндекса есть информация об ассоциативных связях между словами.

юни:
Первый непреложный закон: внимание людей можно перенацелить.

А теперь давайте вспомним, с чего начался топик (благо, Вы активно участвовали в начале обсуждения :)). Напомню, топик начался с обсуждения влияния на поисковую систему таким образом, чтобы она (ПС) этому влиянию не смогла сопротивляться (или не захотела). Вы можете сколько угодно и как угодно перенацеливать внимание людей на своих сайтах, но с чего Вы взяли, что поисковая система обязательно должна такое перенацеливание учитывать?

юни:
Второй закон - тематики толком не существует: к какой сторогой тематике можно отнести те же "детские площадки"

Правильно. Вспоминаем про ассоциативные связи. Мой любимый пример: реклама пива на сайте о футболе. Это удачное размещение рекламы как раз под целевую аудиторию. Тематика совершенно разная, но существует ассоциативная связь. Если не притягивать другие темы "за уши" (человек сидит за компьютером, значит ему очень нужны ссылки на компьютерные магазины; человек иногда ест, значит ему ныжно пихать ссылки на доставку пиццы и т.д.), то получается система, которая может замечательно подавлять накрутки. И Вы поймите, каким бы ни был мудреным и правильным выбор рекламной площадки для размещения рекламы, польза от подавления влияния тысяч искусственных ссылок может быть значительно больше (с точки зрения ПС), чем учет десятка полезных ссылок, которые попадут под фильтр.

юни:
Из эти двух законов вытекает невозможность алгоритмизации полезности: её не только нельзя как-то оценить, но и даже просто выявить.

Из этих двух условий вытекает простая вещь. Если замеры качества выдачи покажут, что учет только тех ссылок, которые сама ПС посчитала полезными и естественными, дает лучший результат, то ПС будет учитывать только их. И ей будет абсолютно все равно, если Вы ее будете уверять, что пихая какие-попало ссылки где ни попадя, Вы делаете это для людей, а не для оказания на нее влияния.

юни:
ясно, как божий день: сайт этой СМИ подлежит немедленному бану за нарушение Лицензии, как за использование ненужной, бесполезной и нетематической ссылки на "Спортмастер", так и за использование столь же неправильной ссылки на "Якутские бриллианты" (тем более, рядом со "Спортмастером" - вопиющее преступление!).

Нет, что Вы. Никакого бана. Разве кто-то где-то говорил о бане? Просто эти ссылки не будут учитываться, т.к. это не добровольное "голосование" за интересность и качество сайта, а проплаченная реклама. В этом смысле мы немного расходимся во мнении с представителями ПС (я и один небезызвестный представитель :)), т.к. лично я считаю, что факт возможности и желания проплатить рекламу нужно так же записать "в плюс" рекламируемому сайту.

юни:
Поскольку математического определения термину "полезность" - не существует.

Я вообще не представляю себе "математического определения" :).

А если Вы про строгое определение, то Вам сюда.

Поиграем в icq?

22 декабря 2006, 00:55

Noga:
Можно я постараюсь ответить на Ваши вопросы-тезисы?

Да без проблем ;)

Noga:
блоки ссылок - это ужасно! Подвальный интернет должен быть ликвидирован.

Блоки ссылок - это не ужасно. И я уже объяснил почему.

А с "подвальным интернетом" борьба, скорее всего, начнется (если еще не началась). Только основной вопрос: с чего Вы взяли, что эта борьба ведется методом фильтрации ссылок по количеству и расположению?

Noga:
Ответ: нет у них такого - там модеры ручками стук проверяют и правят.

Рискну предположить, что Вы несколько отстали от последних веяний SEO :)

Noga:
какому алгоритму? То, что мы видим этот алко-ритм никогда не отследит.

Следует уточнить "То, что мы видим" - это то, как размещаются продажные ссылки сейчас, или то, что предлагает pelvis? На мой взгляд этот алгоритм блестяще справится как с одной задачей, так и с другой. У него будут некоторые проблемы, если в соответствии с идеей pelvis'а размещать по одной (!) ссылке на странице. Но Вы также должны понять, что Яндекс в состоянии проводить анализ не на уровне отдельных двух страниц (ссылающейся и целевой), а на уровне всего сайта. Если сайт напичкан "не полезными" ссылками (по одной на страницу) - то это отлично видно.

Может Вы еще наивно полагаете что не существует способа автоматически отфильтровать влияние каталожных или сеточных (имеются в виду сетки каталогов) ссылок. Достаточно иметь один каталог или один сеточный сайт, чтобы нейтрализовать влияние всей сетки каталогов целиком. Есть достаточно простые и эффективные методы...

Это я говорю к тому, что нейтрализовать такое искусственное влияние достаточно просто. И как бы pelvis ни "выступал за чистый Интернет", если такая система будет помогать ранжированию, на нее закроют глаза (я уверен :)). А если не будет, ограничить влияние неугодных факторов не составит труда.

Вы не поняли, что подкоп идет под самые основы?

С каких это пор бесполезные для посетителей ссылки в огромных количествах стали основой Интернета? :)

И чем это лучше для нас-понять смысл Вашего топика?

Наверное тем, чтобы не вкладывать силы, время и деньги в заведомо утопическую идею (по моему мнению).

Поиграем в icq?

21 декабря 2006, 23:35

pelvis:

sosed:
Вряд ли он обрадует СМИ лояльностью при массовом распространении такого типа продаж ссылок

Тогда Платонам придется изобретать другие способы ранжирования или переходить на внутренние факторы, чему оптимизаторы, как раз, и обрадуются.

Я считаю, что Ваша основная ошибка заключается в том, что Вы почему-то решили, что санкции накладываются за блоки ссылок. А ведь блоки ссылок - это не плохо (само по себе).

Подборку сайтов на определенную тему можно оформить в виде блока ссылок, и это будет очень полезный и информативный блок.

Ссылки на статьи и книги в списке использованной литературы в конце научной статьи - это тоже блок ссылок.

Вообще любой рейтинг или список сайтов, статей, компаний может оказаться блоком ссылок. И это будет не плохо, это будет хорошо и удобно.

В качестве того, что плохо, обычно называются продажные ссылки, или ссылки, не полезные для пользователя/посетителя сайта.

Я считаю, что такие ссылки программно определяются очень просто. Яндекс умеет определять тематику, у Яндекса есть информация об ассоциативных связях между словами. Имхо, этого достаточно, чтобы оценить полезность ссылки для пользователя. Причем, тут возможны варианты:

- можно определить бесполезность ссылки для пользователя и сразу ее не учитывать;

- а можно не учитывать все ссылки (все бесполезные ссылки, как вариант) на странице при условии, что на ней найдутся 3-5 бесполезных для пользователя ссылок.

Причем, второй вариант достаточно либеральный и, в некотором смысле, дает гарантию отсутствия "ложных срабатываний" алгоритма.

А теперь посмотрите на это с точки зрения Вашей идеи. Вы боретесь с блоками ссылок, а описанному алгоритму абсолютно все равно, как и где размещены ссылки, сколько их.

Вот Вы говорите, что так в СМИ, в энциклопедии... Но Яндекс знает, что это СМИ, а это энциклопедия. Если Ваши СМИ начнут напрягать Яндекс, портить его выдачу, Яндекс "одним движением руки" поправит алгоритм, и ссылки в СМИ учитываться не будут (даже если они сейчас учитываются исходя из того, что СМИ - это общетематический ресурс). И чем раньше Вы это поймете, тем лучше для Вас ;).

Блог :)

14 декабря 2006, 11:41

Михо передает всем "превeд" :)

Он очень рад, что его блог набирает популярность.

Внизу там не PPC, так что кликать не обязательно. А чтобы у Михи было больше меда, ему нужно больше ссылок на его сайт. Только он сам об этом пока не знает :)

Но в любом случае повышенное внимание к его персоне ему очень приятно ;)

Экспериментальные данные о "новом" алгоритме Яндекса

4 декабря 2006, 18:16

ХренРедькиНеСлаще:
В принципе метод не в том как Вы описали, а в этом:
1.делаются опыты
2. осмысливаются выданные на гора данные
3. строится модель
4. на основе модели делаются предсказания для опытов, которые Вы еще не делали
5. сравниваются результаты предсказаний и итоги новых опытов

Вы опять не ответили на вопросы :). По пункту 3 можно поподробнее?

Построение модели проводится в два этапа:

- выбор структуры модели

- идентификация параметров модели

Вопросы:

1. Как Вы отобрали значимые факторы?

2. Почему Вы выбрали именно такую структуру модели?

3. Какими методами Вы определяли параметры?

Если Вы не можете ответить на эти вопросы, значит никакого отношения к математике Ваши изыскания не имеют...

ХренРедькиНеСлаще:
У Вас есть предложения по модели? Давайте ее протестируем на каком нить простом примере. Так выложите модель (формулу подсчета тошноты) для любой страницы. А мы сравним предсказания Вашей модели и нашей модели на тех страницах, что еще никто не мерял. :)

Что Вы... у меня нет ни предложений, ни нормальной модели. Я просто не мог проити мимо, чтобы не покритиковать Вашу :)

(L61/L7)^2 = 33/15

Заметьте, мы пока что обсуждаем только правую часть.

К левой части равенства тоже есть претензии.

Напрмер, откуда взялась формула

КОРЕНЬ(LN(B49+0,5))

Я понимаю, что эта формула Вам понравилась, т.к. при ней значения в ячейках L49, L50, ..., L59 не "очень сильно отличаются" :)

Какие-нибудь более осмысленные аргументы в пользу этой формулы у Вас есть?

Если нет, тогда Вам должны понравиться такие формулы как

LN(LN(X))

LN(КОРЕНЬ(X))

X^0,0418

LN(X)^(-0,00032)

0*X - тоже, кстати, не понятно, чем хуже

Экспериментальные данные о "новом" алгоритме Яндекса

4 декабря 2006, 10:55

ХренРедькиНеСлаще:
А откуда Вы взяли коэффициент 0,90588?

Вычислил. А разве это имеет значение?

ХренРедькиНеСлаще:
17/7=2,42857142857143
И это очень сильно отличается и от
33/15=2,20000000000000
33/14=2,35714285714286
и от экспериментально полученных:
2,19999999857488
2,35714287376377

Зачем же Вы удалили мой коэффициент?

Я же не удаляю цифры в Ваших "формулах" как-нибудь так

3/15 != 2,20000000000000

33/4 != 2,35714285714286

К сожалению, Вы не ответили на мой вопрос... Давайте попробуем еще разок?

Почему значение (L61/L7)^2 сравнивается именно со значением 33/15?

Мой вариант ответа (просто согласитесь, если это так):

Потому что в табличке нашлись именно эти числа (33, 15) и при делении именно этих чисел (одно на другое) получается число, которое не "очень сильно отличается" (забавный термин :)) от (L61/L7)^2.

Ну как, угадал? :)

Что касается нашего вопроса. Обратите внимание что Ваша, с позволения сказать, модель имеет такую же структуру, как и моя. Это структура

y = a*(x1/x2)

Для того, чтобы модель можно было использовать на практике, необходимо провести параметрическую идентификацию модели.

Структуру модели можно усложнять и можно добиться того, чтобы модель очень здорово описывала реально измеренные данные (из исходного массива данных). Вся проблема в том, что такая модель будет обладать очень плохими прогностическими свойствами. Другими словами, Ваши три страницы модель может обсчитывать хорошо, а все остальные страницы - очень плохо. Ваша фраза

Для подбора тех страниц, что мы выкладываем (а они как видите не наши и взяты из жизни) и так очень много времени требуется, чтобы они хорошо иллюстрировали обсуждаемый эффект

только подчеркивает мою мысль ;)

И именно поэтому еще на этапе выбора структуры модели исследователь должен позаботиться, чтобы эта структура обладала смыслом. В Вашем выборе структуры смысл какой-нибудь есть? Какой объем массива данных Вы использовали? Какими математическими методами Вы проводили параметрическую идентификацию?

Экспериментальные данные о "новом" алгоритме Яндекса

3 декабря 2006, 14:32

ХренРедькиНеСлаще:
Надо переставить местами заголовки столбцов с id 73 и id 74
Сути поста это не меняет. Так как пост написан именно для правильного именования столбиков.

OK. С этим разобрались. Следующий вопрос.

Почему значение (L61/L49)^2 или (L61/L7)^2, если хотите :), сравнивается _именно_ со значением 33/15?

352
scilab - 1.86% - 17

74
scilab - 1.8% - 7

Почему бы не отфильтровать стоп-слова и не сравнить (L61/L7)^2 с 0,90588*(17/7) ?

Они тоже "удивительным образом" "почти" равны :).

Экспериментальные данные о "новом" алгоритме Яндекса

3 декабря 2006, 05:07

ХренРедькиНеСлаще:
Вы перепутали число 14 с 15, проверьте еще раз.

Вы считаете, что я стал бы писать сообщение не проверив несколько раз? :)

352

и - 3.6% - 33

и - 3.16% - 14

Экспериментальные данные о "новом" алгоритме Яндекса

3 декабря 2006, 04:23

ХренРедькиНеСлаще, тут разговор уже очень далеко зашел. Вы не будете возражать, если я вернусь в самое начало и задам первый вопрос (пока простой :))...

Рассмотрим данные из Вашего файла для страниц 74 и 352.

Правильно ли я понимаю (далее следуют названия ячеек в Excel), что значение (L61/L49)^2 сравнивается с (идем на Лист1) 33/14.

Вы нам пытаетесь показать, что они равны, но они ведь не равны ☝

2.2 != 2.36

chaif, с Днем Рождения!

27 октября 2006, 21:46

С Днем Рождения!

Счастья и здоровья!

1 2 3 4 5 6 7 8 9 10 ...22

Всего: 220

Зачем быть уникальным в мире, где все можно скопировать

В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи

Cage