ikozlov

Рейтинг
18
Регистрация
27.04.2004
Должность
на распутье
Интересы
сверхтекучесть и сверхпроводимость
физик лирик программист и все в прошлом :-)

Все естественно. Ссылка на стр2 - это уже плюс к стр2.

7-8% - это еще один плюс к стр2, правда % -некорректная величина для плотности ключевых слов для Яндекса, так как вклад в вес страницы пропорционален ((логарифм веса ключевика)/(размер страницы в словах))^0,5*(число ключевиков)

Это если не учитывать обрезания (точнее - округления в большую сторону для коротких страниц) размера страницы в районе 300-400 слов :)

Как писал Balabass
я так понял речь уже зашла о "сквозняках"...
дык вот на сквозняки также как и на хосты тоже есть фильтры...
америку вы не открыли... и такой "выстрел" у вас не получится...
"сквозняки" тоже надо уметь делать с умом... :)

Тоже хороший термин.

Значит все в руках "божьих", т.е. в наших :)

Ссылочку можно о борьбе со сквозняками...

Гринвуд, зачем же меня обижать?

Считать будет Яндекс. Какие страницы брать для сравнения -определит разработчик, набрав в Яндексе фразу и получив результаты. Мое дело как бы сравнить, КАКУЮ СТРАНИЦУ Яндекс поставит выше, разработанную или взятую из результатов поиска Тем более КОЗЫРИ Яндекса открыты: результаты выдачи доступны всем, сиди и думай :)

Это намного проще, чем сидеть в Яндексе и думать, как бы мне со спамерами справиться, чтобы и овцы целы были.

Внешние можно поставить и на склад и на генератор.

Чтобы Гугль ничего не заподозрил, на складе лучше хранить не слишком перекаченные страницы, зато много. А потом можно качнуть и на какую то выбранную.

Потом - это может быть оружие "массового" и "разового" поражения (завалить кандидата в Президенты США, накопили и выстрелили Пэйдж Рэнком на компрометирующую кандидата страничку в обнимку с Моникой Левински).

Как писал Balabass
ваша теория не сработает, тк при отсутствии ссылки на станицу гугл её потеряет... дальше 1 цикла вы не дойдёте...

Гринвуду - большой привет.

Спасибо за ссылочку. Статью эту я правда уже читал на английском. Вроде бы ничего вредного, для "накачки" там нет.

Для меня, правда, остается вопросом, насколько РЕАЛЬНЫЙ алгоритм Гугля отличается от запатентованного и каков статический коэффициент стои в начале формулы для ПР:

ПР=ХХХ? + q*Сумма(вес ссылки* ПР страницы со ссылкой).

В начальной редакции

ХХХ=(1-q)

Потом отцы основатели, вроде изменили на (1-q)/(число страниц сайта)

Потом - сам хочу знать :)

Балабасу. Нет проблем - оставим внешнюю ссылочку на "склад" с малой утечкой...

Как писал greenwood
интересный пример ...
вас смутила пропажа в выдаче странички 82500.html при смене 82720 на 82721 ? это выражение не совсем понял ..

Всем привет, забежал на минутку, проверить одну мысль по Гуглю. Создал там одну тему, надеюсь полезную не только мне.

Нет просто смена числа 82720 увеличило на 1 слово расстояние между числами и Яндекс ПОЧУВСТВОВАЛ.

А вот изменение позиции этой десятки НА МНОГО слов ближе к НАЧАЛУ (к телу <body>) этого сделать не может! (попробуйте сдвинуть сами.

Алгоритмов я пробую несколько сразу. С одной стороны хорошо, что я новичок в этом деле, не наработал связей и НЕ ЗАТУМАНЕН общепринятыми представлениями, с другой - плохо, так как мала подставочка, с которой начинать. Товарищи, которые давно в том деле, могли бы из обрывков своих контактов с Яндексом иметь более определенные представления об алгоритме.

Я иду по шагам. Мне надо выбрать базовые функции, которые будут аппроксимировать алгоритм Яндекса. Пока и линейные и экспоненциальные выглядят подходящими, плюс приходится определяться с соотношением единиц измерения (слово, предложение, абзац) расстояний между словами и их дробями.

Плюс "ошибки" Яндекса при выборе "найденной фразы". Похоже, что он НЕ находит В ЦЕЛОМ Лучшую комбинацию фраз на странице, а находит по "тупому".

Например фраза "а б" в тексте идет:

а 1 б 4 б 40 а 1 б (цифры расстояние в словах)

Так яндекс (мб я ошибаюсь) в расчет берет а 1 б и б 40 а и отдельно считает б. Хотя результат был бы более естественным:

а 1 б, а 1 б

Все таки надо закончить калибровку... Времени мало, так как у меня есть другая работа. И не одной оптимизацией живет человек :)

PS Об институтах. Задачку себе я поставил ограниченную: иметь возможность оценить, на каком месте очутилась бы подготовленная мною страничка, если бы все внешние факторы считать одинаковыми для всех других страницю Это помогло бы путем эксперимента и выявить вариант, близкий к оптимальному.

Кстати, все внешние факторы для ИЗВЕСТНЫХ страниц-конкурентов можно было бы ОЦЕНИТЬ. Но это уже из другой оперы. Почему я так настойчиво и повторяю как попугай - кто умеет ИЗМЕРЯТЬ тиц виц и их аналоги.

Удачи.

Как писал greenwood
в чем именно .. ? если открытием явилась релевантность контента запросу - это одно
если нашлись признаки присутствия вица - это другое ...
не совсем понятны изыскания ... чего ищем-то ?

Здравствуйте, Гринвуд.

К сожалению, времени у меня немного, но для затравки, обратите внимание на порядок выдачи страниц:

http://www.yandex.ru/yandsearch?ras=1&date=&text=%28+82711%2C+82712%2C+82713%2C+82714%2C+82715%2C+82716%2C+82717%2C+82718%2C+82719%2C+82720%29+%7C+%28+36501%2C+36502%2C+36503%2C+36504%2C+36505%2C+36506%2C+36507%2C+36508%2C+36509%2C+36510%29&spcctx=doc&zone=all&linkto=&wordforms=all&lang=all&within=0&from_day=&from_month=&from_year=&to_day=27&to_month=2&to_year=2005&mime=all&Link=&numdoc=50&site=http%3A%2F%2Fgethosting.ru&ds=

Замените 82720 на 82721.

Сдвиньте поисковую десятку ближе к началу.

И миф о важности близости к началу страницы, ВРОДЕ БЫ не выдерживает ИСПЫТАНИЯ.

Меня тут обругали в другой МОЕЙ теме, почему я именно этот сайт на свет вытащил, ну да ладно.

Уважаемый kittenk

Что-то в этом роде я уже, естественно, выложил. И ЖДУ. Но есть еще такая черта, как УСКОРЕНИЕ. Это означает, что эксперименты делаются методом (возьмем аналогию) НАИСКОРЕЙШЕГО спуска, что означает, что мы исследуем Яндекс как "черный ящик" с заведомо неопределенными НАЧАЛЬНЫМИ коэффициентами НЕ МЕТОДОМ МОНТЕ-КАРЛО со случайными массивами исходных данных, а более быстрым "самонаводящимся" способом. В этих условиях любой совет от человека, отвечающего за свои слова, просто бесценен. Особенно, если учесть, что, если предложенный Вами эксперимент покажет "странности" поведения, то необходимо будет делать уточняющий эксперимент. И так далее до бесконечности, при неадекватности модели. Поймите меня. Кому же хочется ждать 2-4 недели, чтобы выяснить, что, как и ожидалось, результат на 100% совпал с ожидаемым....

Либо совсем не совпал :)

Так как ждать мне не хотелось, естественно, я стал искать в интернете УЖЕ ВЫЛОЖЕННЫЕ в ИНТЕРНЕТЕ и ПРОИНДЕКСИРОВАННЫЕ странички того же типа, как и Вы предложили и другие, под проверку ГИПОТЕЗ о ТИЦ ВИЦ.

Так как первые же результаты меня очень удивили в силу огромного количества НЕСТЫКОВОК с ВАЖНОСТЬЮ ТИЦ ВИЦ, то возникло ощущение, что люди Яндекса, долго и упорно воюющие против шума, должны были придумать НЕЧТО, чтобы поставить в тупик спамеров ключевых фраз и "линкаторов".

Первое, что пришло мне в голову (я собираюсь открыть новую тему для обсуждения) - это "усовершенствование" алгоритма основателей Гугля:

В чем он мог бы заключаться? Для каждого СЛОВА на странице вводится PAGE RANK СЛОВА (word page rank - WPR - ПРС). Алгоритм его подсчета мог частично заимствоваться от Гуглья.

Те это комбинация двух-трех составляющих:

1. ПРС1, подсчитанный от ссылок, в которых встречается это слово (база Яндекса позволяет это делать, вспомните найден по ссылке):

Например:

ПРС1=конст+(1-конст)*Сумма(вес ссылки*ПРС)

2. ПРС2 - подсчитывается от контента

3. ПРС3 - подсчитывается от (title? keywords?noindex?<!--?description?......)

ПРС=ПРС1*ПРС2*ПРС3, а кому больше нравятся логарифмы ПРС=ПРС1+ПРС2+ПРС3

Либо формулы более изощренные

Уважаемых академиков я бы спросил, если Вы лично УЖЕ делали такие эксперименты, то зачем ждать 2 недели? Дайте ссылочку на выложенные экспериментальные страницы. Если же Вы хотите, чтобы новички САМИ поколупались и набили шишечки, то Ваша позиция логична и объяснима. А разжевывание мне не нужно, я сам для кого хочешь разжую.

Я прошу прощения, возможно за некоторую агрессивность в словах, но я человек ДЕЛА, а не переливания из пустого в порожнее. Мне 53 года, неизвестно сколько осталось жить, доживете до моего возраста, поймете, как надо ценить время и стоит ли его тратить на бесплодные переписки. Тем более всегда есть достойный выход - НЕ ПИСАТЬ и НЕ ОТВЕЧАТЬ. И свое время сбережете, и мое, и читателей форума. Не стоят мои вопросы выеденного яйца - сами отомрут сами собой. Посмеются надо мной и забудут.

Вспышка моей активности на форуме (проследите историю) объясняется отладкой и калибровкой программы по определению порядка выдачи Яндексом страниц, первые же эксперименты (КОТОРЫЕ ДАЮТ РЕЗУЛЬТАТ не в качественной форме, а В ЦИФРОВОЙ) дали во многих случаях ОБЕСКУРАЖИВАЮЩИЙ результат, если опираться на МИФОЛОГИЮ о тиц виц. Отсюда и мои вопросы, все ли так гладко "в Датском Королевстве"?

Люди долго думали, что Солнце вращается ВОКРУГ Земли. И предсказывали лунные затмения с точностью до минуты.

Как писал greenwood
ВИЦ - это аналог той черной кошки, которую надо искать сами знаете где, хотя ее там и нет ...

Greenwood, мой внутренний голос говорит, что вы попали в самое яблочко! :)

Спасибо за дискуссию.

1. Дизайн и связь с поисковиками - это уже неподъемная и заоблачная тема. Молодость вспоминаю, когда делал программу по восстановлению трехмерной детали по закодированному на планщете чертежу (двумерным проекциям), в те времена (1970-е), когда растровые дисплеи рассматривались как тупиковый вариант и, например, у нас в Ногинске делалось первое в Союзе рабочее место конструктора мащиностроения (АРМ) на основе наших векторных дисплеев ("flash технология сегодня") УПГИ и ГРАФИТ. Однако, дизайн может быть красивым и сейчас, даже при оптимизации. CSS + display:block+display:inline+position:absolute+... и только технические проблемы с дизайном.

2. То, что над текстами будут "колдовать" лингвисты и "писатели" - это хорошо. Богу - богово.

3. Как рулит Яндекс с шаблонами и меню, пока "гипотеза", сам бы хотел знать, потому и тему начал. То, что к этой теме Яндекс приступил - очевидно. Надо набирать экспериментальный материал и анализировать. Я на это наткнулся даже случайно, когда на днях свой анализатор релевантности стал калибровать и сразу наткнулся на сюрпризы. Тем более, что этой темой я занимаюсь урывками и от случая к случаю. Многого "горячего" материала не знаю. Опираюсь на здравый смысл и вечную борьбу противоположностей (оптимизаторы и поисковые люди). Что эти могут предпринять, что другие? Пытаюсь встать на их сторону и помозговать их возможные действия и противодействия.

4. Уважаемому svift. Мне кажется, у ссылочного ранжирования "критические дни". Но, как сказал Черчилль, нет ничего хуже демократии, однако все другие варианты еще хуже. И Вы правы, что поисковики будут еще долго искать выход на этом пути. А мы им в этом "поможем" :)

Удачи всем.

1 2345 6
Всего: 60