Я так понимаю, это камень в мой огород :)
Оперировать только понятием "тематика" не очень корректно. Перечитайте вот это, плиз, прежде, чем мы продолжим
А теперь давайте вспомним, с чего начался топик (благо, Вы активно участвовали в начале обсуждения :)). Напомню, топик начался с обсуждения влияния на поисковую систему таким образом, чтобы она (ПС) этому влиянию не смогла сопротивляться (или не захотела). Вы можете сколько угодно и как угодно перенацеливать внимание людей на своих сайтах, но с чего Вы взяли, что поисковая система обязательно должна такое перенацеливание учитывать?
Правильно. Вспоминаем про ассоциативные связи. Мой любимый пример: реклама пива на сайте о футболе. Это удачное размещение рекламы как раз под целевую аудиторию. Тематика совершенно разная, но существует ассоциативная связь. Если не притягивать другие темы "за уши" (человек сидит за компьютером, значит ему очень нужны ссылки на компьютерные магазины; человек иногда ест, значит ему ныжно пихать ссылки на доставку пиццы и т.д.), то получается система, которая может замечательно подавлять накрутки. И Вы поймите, каким бы ни был мудреным и правильным выбор рекламной площадки для размещения рекламы, польза от подавления влияния тысяч искусственных ссылок может быть значительно больше (с точки зрения ПС), чем учет десятка полезных ссылок, которые попадут под фильтр.
Из этих двух условий вытекает простая вещь. Если замеры качества выдачи покажут, что учет только тех ссылок, которые сама ПС посчитала полезными и естественными, дает лучший результат, то ПС будет учитывать только их. И ей будет абсолютно все равно, если Вы ее будете уверять, что пихая какие-попало ссылки где ни попадя, Вы делаете это для людей, а не для оказания на нее влияния.
Нет, что Вы. Никакого бана. Разве кто-то где-то говорил о бане? Просто эти ссылки не будут учитываться, т.к. это не добровольное "голосование" за интересность и качество сайта, а проплаченная реклама. В этом смысле мы немного расходимся во мнении с представителями ПС (я и один небезызвестный представитель :)), т.к. лично я считаю, что факт возможности и желания проплатить рекламу нужно так же записать "в плюс" рекламируемому сайту.
Я вообще не представляю себе "математического определения" :).
А если Вы про строгое определение, то Вам сюда.
Да без проблем ;)
Блоки ссылок - это не ужасно. И я уже объяснил почему.
А с "подвальным интернетом" борьба, скорее всего, начнется (если еще не началась). Только основной вопрос: с чего Вы взяли, что эта борьба ведется методом фильтрации ссылок по количеству и расположению?
Рискну предположить, что Вы несколько отстали от последних веяний SEO :)
Следует уточнить "То, что мы видим" - это то, как размещаются продажные ссылки сейчас, или то, что предлагает pelvis? На мой взгляд этот алгоритм блестяще справится как с одной задачей, так и с другой. У него будут некоторые проблемы, если в соответствии с идеей pelvis'а размещать по одной (!) ссылке на странице. Но Вы также должны понять, что Яндекс в состоянии проводить анализ не на уровне отдельных двух страниц (ссылающейся и целевой), а на уровне всего сайта. Если сайт напичкан "не полезными" ссылками (по одной на страницу) - то это отлично видно.
Может Вы еще наивно полагаете что не существует способа автоматически отфильтровать влияние каталожных или сеточных (имеются в виду сетки каталогов) ссылок. Достаточно иметь один каталог или один сеточный сайт, чтобы нейтрализовать влияние всей сетки каталогов целиком. Есть достаточно простые и эффективные методы...
Это я говорю к тому, что нейтрализовать такое искусственное влияние достаточно просто. И как бы pelvis ни "выступал за чистый Интернет", если такая система будет помогать ранжированию, на нее закроют глаза (я уверен :)). А если не будет, ограничить влияние неугодных факторов не составит труда.
С каких это пор бесполезные для посетителей ссылки в огромных количествах стали основой Интернета? :)
Наверное тем, чтобы не вкладывать силы, время и деньги в заведомо утопическую идею (по моему мнению).
Я считаю, что Ваша основная ошибка заключается в том, что Вы почему-то решили, что санкции накладываются за блоки ссылок. А ведь блоки ссылок - это не плохо (само по себе).
Подборку сайтов на определенную тему можно оформить в виде блока ссылок, и это будет очень полезный и информативный блок.
Ссылки на статьи и книги в списке использованной литературы в конце научной статьи - это тоже блок ссылок.
Вообще любой рейтинг или список сайтов, статей, компаний может оказаться блоком ссылок. И это будет не плохо, это будет хорошо и удобно.
В качестве того, что плохо, обычно называются продажные ссылки, или ссылки, не полезные для пользователя/посетителя сайта.
Я считаю, что такие ссылки программно определяются очень просто. Яндекс умеет определять тематику, у Яндекса есть информация об ассоциативных связях между словами. Имхо, этого достаточно, чтобы оценить полезность ссылки для пользователя. Причем, тут возможны варианты:
- можно определить бесполезность ссылки для пользователя и сразу ее не учитывать;
- а можно не учитывать все ссылки (все бесполезные ссылки, как вариант) на странице при условии, что на ней найдутся 3-5 бесполезных для пользователя ссылок.
Причем, второй вариант достаточно либеральный и, в некотором смысле, дает гарантию отсутствия "ложных срабатываний" алгоритма.
А теперь посмотрите на это с точки зрения Вашей идеи. Вы боретесь с блоками ссылок, а описанному алгоритму абсолютно все равно, как и где размещены ссылки, сколько их.
Вот Вы говорите, что так в СМИ, в энциклопедии... Но Яндекс знает, что это СМИ, а это энциклопедия. Если Ваши СМИ начнут напрягать Яндекс, портить его выдачу, Яндекс "одним движением руки" поправит алгоритм, и ссылки в СМИ учитываться не будут (даже если они сейчас учитываются исходя из того, что СМИ - это общетематический ресурс). И чем раньше Вы это поймете, тем лучше для Вас ;).
Михо передает всем "превeд" :)
Он очень рад, что его блог набирает популярность.
Внизу там не PPC, так что кликать не обязательно. А чтобы у Михи было больше меда, ему нужно больше ссылок на его сайт. Только он сам об этом пока не знает :)
Но в любом случае повышенное внимание к его персоне ему очень приятно ;)
Вы опять не ответили на вопросы :). По пункту 3 можно поподробнее?
Построение модели проводится в два этапа:
- выбор структуры модели
- идентификация параметров модели
Вопросы:
1. Как Вы отобрали значимые факторы?
2. Почему Вы выбрали именно такую структуру модели?
3. Какими методами Вы определяли параметры?
Если Вы не можете ответить на эти вопросы, значит никакого отношения к математике Ваши изыскания не имеют...
Что Вы... у меня нет ни предложений, ни нормальной модели. Я просто не мог проити мимо, чтобы не покритиковать Вашу :)
(L61/L7)^2 = 33/15
Заметьте, мы пока что обсуждаем только правую часть.
К левой части равенства тоже есть претензии.
Напрмер, откуда взялась формула
КОРЕНЬ(LN(B49+0,5))
Я понимаю, что эта формула Вам понравилась, т.к. при ней значения в ячейках L49, L50, ..., L59 не "очень сильно отличаются" :)
Какие-нибудь более осмысленные аргументы в пользу этой формулы у Вас есть?
Если нет, тогда Вам должны понравиться такие формулы как
LN(LN(X))
LN(КОРЕНЬ(X))
X^0,0418
LN(X)^(-0,00032)
0*X - тоже, кстати, не понятно, чем хуже
Вычислил. А разве это имеет значение?
Зачем же Вы удалили мой коэффициент?
Я же не удаляю цифры в Ваших "формулах" как-нибудь так
3/15 != 2,20000000000000
33/4 != 2,35714285714286
К сожалению, Вы не ответили на мой вопрос... Давайте попробуем еще разок?
Мой вариант ответа (просто согласитесь, если это так):
Потому что в табличке нашлись именно эти числа (33, 15) и при делении именно этих чисел (одно на другое) получается число, которое не "очень сильно отличается" (забавный термин :)) от (L61/L7)^2.
Ну как, угадал? :)
Что касается нашего вопроса. Обратите внимание что Ваша, с позволения сказать, модель имеет такую же структуру, как и моя. Это структура
y = a*(x1/x2)
Для того, чтобы модель можно было использовать на практике, необходимо провести параметрическую идентификацию модели.
Структуру модели можно усложнять и можно добиться того, чтобы модель очень здорово описывала реально измеренные данные (из исходного массива данных). Вся проблема в том, что такая модель будет обладать очень плохими прогностическими свойствами. Другими словами, Ваши три страницы модель может обсчитывать хорошо, а все остальные страницы - очень плохо. Ваша фраза
только подчеркивает мою мысль ;)
И именно поэтому еще на этапе выбора структуры модели исследователь должен позаботиться, чтобы эта структура обладала смыслом. В Вашем выборе структуры смысл какой-нибудь есть? Какой объем массива данных Вы использовали? Какими математическими методами Вы проводили параметрическую идентификацию?
OK. С этим разобрались. Следующий вопрос.
Почему значение (L61/L49)^2 или (L61/L7)^2, если хотите :), сравнивается _именно_ со значением 33/15?
Почему бы не отфильтровать стоп-слова и не сравнить (L61/L7)^2 с 0,90588*(17/7) ?
Они тоже "удивительным образом" "почти" равны :).
Вы считаете, что я стал бы писать сообщение не проверив несколько раз? :)
352
74
ХренРедькиНеСлаще, тут разговор уже очень далеко зашел. Вы не будете возражать, если я вернусь в самое начало и задам первый вопрос (пока простой :))...
Рассмотрим данные из Вашего файла для страниц 74 и 352.
Правильно ли я понимаю (далее следуют названия ячеек в Excel), что значение (L61/L49)^2 сравнивается с (идем на Лист1) 33/14.
Вы нам пытаетесь показать, что они равны, но они ведь не равны ☝
2.2 != 2.36
С Днем Рождения!
Счастья и здоровья!