ХренРедькиНеСлаще

ХренРедькиНеСлаще
Рейтинг
57
Регистрация
27.07.2006
Должность
Безработный, если кто даст подработать подкинет, милости прошу к своему шалашу... Девушкам особое почтение! :)
Интересы
Вино и бабы :) Короче, Любовь!
Любитель редьки и огурца
pro-maker:
Хрнс, оптимальность необходимо оценивать не только по максимальной релевантности, но и по практической реализуемости. Поддерживать одинаковую встречаемость нескольких многословных запросов на морде сайта с изменяющимся контентом нереально.

Не понимаю. Мои слова (аналогия): есть портной с сантиметром (оптимизатор со знанием части алгоритма Яндекса) и есть портной без сантиметра (оптимизатор без знания части алгоритма Яндекса).

И что Вы хотите сказать? Что портной без сантиметра идеал портновского искусства?

Миныч рассказал, отец у него умер в 14 лет, мать получала 130 руб в месяц. сестра младшая. Без блата и денег поступил в Ленинградский университет и его закончил, подрабатывая дворником и в стройотрядах. Свадьба была в ресторане Москва на углу Невского и Литейного, хватило денег у нищих студентов, так как была уравниловка и гордиться награбленным было = замазаться говном, а для студентов была контора, которая организовывала это дело по госрасценкам и без очереди.

А я помню, что когда жил в Москве скучал по вкусному Ногинскому мороженому за 9 копеек. Как на открытом суде дали восемь лет за кражу 15 метров ткани. Как говно не плавало по поверхности, а держало рот на замке...

Это не значит, что тогда лучше было. При нынешнем режиме просто всплыло другое дерьмо, слава богу хороших людей всегда хватало, хватало и тогда, хватает и сейчас.

AiK:
На странице не должно быть слова встечающегося чаще, чем "изготовление" или "сайтов"
И это пишет человек, употребляющий термин "тошнота" чуть ли не в каждом втором сообщении? Если в тексте не будет стоп-слов (а ля что, где, как, поэтому и т.д. и т.п.), с большей частотой, чем самое популярное не стоп-слово, то поисковик может не только стошнить, но и чего похуже с ним произойти может

- Список стоп слов наша фирмочка оставит для себя пока... Это не те слова, вес которых яндекс считает равным нулю, а тех, что не влияют на тошноту ни при каких условиях.

- Причем здесь мое отношение к этим вопросам? Я пишу о том как Яндексов алгоритм работает по результатам целенаправленных экспериментов. Насколько я могу судить, Вы ведь не считаете меня разработчиком алгоритма Яндекса? Поэтому претензии по поводу и без повода надо посылать Яндексу.

AiK:
Кроме того, наличие двух слов в тексте с одинаковой частотой скорее всего неоптимальное решение.

Это оптимальное решение для математически поставленной задачи оптимизировать сразу два запроса однословника. А вопросы красоты или русского языка - это к лингвистам либо к схоластам...

AiK:
Если ты пишешь текст про "создание сайтов" не думая об оптимизации, то скорее всего слово сайт в этом тексте будет встречаться куда как чаще, т.к. наряду с фразой "создание сайтов" обязательно вылезет или "разработка сайтов" или "создать сайт" или ещё что.

Я думаю, что Яндекс так и думал, когда обдумывал свой алгоритм. И принял неплохое решение с моей точки зрения. Не так просто соблюсти красоту русского языка со спамом ключевиков...

AiK:
уже не говорю про то, что поисковик в принципе может довольно сносно классифицировать достаточно большие тексты по типам: разговорный, газетный, художественный, научный.

Яндекс до этого пока не дорос, как впрочем и остальные. Дорастет, тогда и эту его особенность исследуем.

lambert:
ХренРедькиНеСлаще, Спасибо настоящему Гуру!

Я не Гуру, я русский.

lambert, у Вас вложенность тегов обычных и ноуиндекс нарушена, поэтому страницы не индексируются правильно.

Пример кода с Вашей морды:

<TR><TD background="linevert.jpg"></noindex><!--таги-->

Так не делают. Тег ТД открывается и до его закрытия Вы закрывете ноуиндекс..

Этого достаточно. чтобы Вас больше не смотреть. Исправьте, или лучше уберите ноуиндекс... Яндекс не видит закрытия ноуиндекса и не индексирует ничего.

garry_chem, спасибо, все, что Вы написали в посте номер 44, укладывается в схему влияния тошноты, один к одному (за исключением крокодилов), видимо крокодилов добавили очень много, только тогда прогнозируется такой вариант, как и у Вас получилось.

Тут не совсем та ситуация про что писал, я писал, что по неосновным Вы подниметесь, если число основных УМЕНЬШИТЕ, а Вы написали про РАЗБАВЛЕНИЕ,т.е. про УВЕЛИЧЕНИЕ некоторых ключевиков.

Тошнота пропорциональна корню квадратному из встречаемости самого частого слова.

Релевантность пропорциональна числу найденных запросов, деленному на тошноту.

Я отбросил оговорки про склейку, стоп слова и т.п. вещи. WWW, RU, например, не есть стоп слова :)

pro-maker:
В переводе на русский, одна страница - один основной ключевик.

Не совсем так. Одна страница - сколько хочешь однословных ключевиков для однословных запросов (но их число должно быть одинаковым.

Для многословных запросов число таких запросов ограничивается максимальной длиной предложения в 63 слова. Так как как правило Яндекс ищет слова в одном предложении.

:)

kod_ssilki_ru:
Но! Число найденных должно совпадать с числом самого частого ключевика.

Большая просьба - поясните, пожалуйста, для тех, кто в танке, скажем на многословном примере "изготовление сайтов"

На странице не должно быть слова встечающегося чаще, чем "изготовление" или "сайтов"

euhenio:
а откуда берутся функции вида sqrt(150/100)?

Это просто Миныч дал формулу.

euhenio:
Про "Самая релевантная страница та, где больше ключевикА." - можно конкретный пример или механизм действий? Увы, но слова "по методике Миныча" - сложно применить на практике

Если бы это было раньше, то можно было бы проверить запросами вида (ключ1::вес1|ключ2::вес2) меняя веса, сейчас яндекс это не позволяет, мы исхитрились по своему. но это уже секрет фирмы. без санкции Миныча раскрыть не могу, а его не будет до 1 ноября.

В общем, что могу написать, то написал...

Вы можете немного по топорному, но проверить так:

сделать много страниц на народе, подобрать из переколдовки некоторый набор слов с определенной плотностью заполняющий некоторый диапазон весов (как можно более широкий).

Затем сгенерить странички содержащие 1,2, 3,4, 5, 6,........1000 уникальных ключевиков для интернета.

Разбавить эти странички одним и тем же набором слов, который подобрали из переколдовки (по одному слову). И залить эту смесь на народ, случайным образом переставляя ключевики (от их положения для однословных запросов ничего не зависит).

Затем анализируете запросы (ключ1|ключ2), где ключи взяты из вашего набора переколдовки и строите диаграммки ступенек как у миныча на

У МИНЫЧА Яндекс Рамблер и другие Алгоритмы поиска и ранжирования документов

euhenio:
с учетом весов слов, не так ли? я имею в виду - с учетом idf

Да,euhenio, конечно.

Уточню, правда, если "репа" это наш запрос и на странице самый частый ключевик. то вес других слов совершенно не важен.

Важен для запросов типа (ключевик1|ключевик2) или (ключевик1 ключевик2)

Всего: 982