ХренРедькиНеСлаще

ХренРедькиНеСлаще
Рейтинг
57
Регистрация
27.07.2006
Должность
Безработный, если кто даст подработать подкинет, милости прошу к своему шалашу... Девушкам особое почтение! :)
Интересы
Вино и бабы :) Короче, Любовь!
Любитель редьки и огурца
Revan:
Причем там SQL запросы и Яндекс?

Вдруг они sql используют? Или у Вас есть данные, что они как то по другому делают, например хешируют? Вроде набрал строку запроса, для нее хешкод и он сразу на 1й сайт показывает?

wolf:
О каком онлайне идет речь? Есть база анкор-текстов. Что мешает при ее составлении заполнить еще всего одно поле - ВИЦ страницы, на которой расположен конкретный анкор-текст?

- А что мешает в этом же поле учесть вес всего текста ссылки (ее встречаемость в интернете)?

- Да он и так существует :) только я думаю вместе с учетом числа ссылок на странице.

Ну а теперь такой пример:

на страницу ссылается 20000 ссылок и все по запросу найдены.

Если "вес ссылок" не огрубить до скажем 10 уровней, то подсчет релевантности будет тормозной (ВИЦ донора ~ вес пассажа в ссылке по всем 20000 ссылок, а если еще кворум в ссылках искать).

Гипотеза об учете только самых сильных ссылок наводит на грустные мысли о хреновом качестве поиска :)

А чем хуже гипотеза ссылочного как наиболее уникального набора текстов ссылок? и просчета только по найденным уникальным текстам ссылок (точнее их количества с учетом или без учета веса каждой уникальной ссылки)?

SQL запросы хорошо считают число записей, но с трудом переваривают групповые операции со сложными и даже не сложными выражениями, а их ведь еще надо и упорядочить по ранжиру.

wolf:
Те, кто сталкивается с ссылочным на практике, прекрасно знают, что ссылки с одинаковым текстом на одну и ту же страницу работают по разному с разных страниц, причем, как правило, чем "визуально" "вицатее" страница, тем сильнее ссылочное с неё. Логично в первом приближении предположить, что ВИЦ в этом случае используется в качестве весового коэффициента.

Логично! Но не опровергает гипотезу о ВЕСЕ ТЕКСТА ССЫЛКИ (против веса СЛОВА, ведь Вы не будете возражать?). А если учесть ВЫРАЖЕНИЯ, которые Яндекс в переколдовке дает, например после ОДНОГО двоеточия ДЛЯ ВЫРАЖЕНИЯ В СКОБКАХ:

(........):0

то у Яндекса есть механизм присвоения и учета ВЕСА выражениям, а чем текст ссылки не выражение?

ВИЦ ссылающейся страницы легко прочувствовать для малого числа ссылок, но как Вы отделите его от ПЕРЕДАЧИ веса(ВИЦ) на акцептор? Толи от передачи ВИЦ запрос поднялся, толи от ВИЦА передающей страницы?

А когда ссылок много и подавно все запутано :)

Если Яндексу онлайн надо учитывать ВИЦы ВСЕХ найденных ссылающихся страниц - он захлебнется. Если только отфильтрованных, то фильтр должен быть очень простым, иначе опять захлебнется, а фильтр еще и ресурсы жрет. Но слишком простой фильтр трудно подстроить так чтобы по всем мыслимым темам поиск был приемлемым, поэтому Яндекс должен был бы принять Гуглеподобную схему: вицы считать отдельно оффлайн, лексику отдельно онлайн.

Вы я думаю неплохой теоретик, но теория без практики мертва - поиграйтесь с жирными ссылками

Вот смотрю на морды Яндекса, Рамблера Лента.Ру и думаю какие еще морды могут быть жирнее для экспериментов? Или Вы думаете, что мы морды только народовских сайтов для экспериментов берем? :)

http://www.yandex.ru/yandsearch?text=Mama.ru:%20клуб%20родителей

http://www.yandex.ru/yandsearch?text=Адвокат%20Сухарев%20и%20Партнеры

Ссылки по маме и адвокату с Рамблера по значению одинаковы?

Перец:
сылки с ключевиком "спецодежда" разве как-то мешают продвигать сайт по "одеялам"?

Если бюджет невысокий, обычно ограничиваются каталогами. И поменяйте тексты ссылок на уже закаталоженный сайт.

И вторая фишка есть для хорошего бюджета, но тут много шума поднимется, потому умолчу :)

pro-maker:
2. Результаты поиска из примеров почти одинаковые, почему Вами выделены ТЕКСТы ссылок?

Ночью по первому запросу (с процентом) Яша выдал 5 текстов ссылок.

pro-maker:
1. Какое отношение вИЦ имеет к запросам с замещением?

Я не уверен, что при ссылочном ВИЦ работает так, как мы думаем :)

А может он вообще не работает? И какой (какие ВИЦы) работают?

Страниц то много (где ссылки и куда ссылки).

И существует ли "ВИЦ" (ССЫЛКОРЭЙНДЖ | ВЕС) ссылки? :) 😂 😂 😂

скажем для ссылки "недвижимость Ногинск" вес 1000

а "недвижимость Москва" вес 20 :D :D :D

K. Ermakov:
Сообщение от BigBrother
Я хочу сказать, что мы посчитали главной страницу с таким же контентом, расположенную на более весомом сайте
Правильно ли я понимаю, что при принятии решения об исключении из выдачи дубля учитывается весомость всего сайта? Что понимается в данном случае под весом? От чего он зависит?

Есть одна гипотеза. Весомее - это БОГАЧЕ НАЙДЕННЫМ КОНТЕНТОМ.

Найденный контент это кусок текста (на найденной странице или в страницах, ссылающихся на найденную) ВНУТРИ которого НАШЛИ пассаж ЗАПРОСА.

Ублюдочный пример:

запрос:недвижимость

На странице сайта 1 (с большим ВИЦ, морда) найдены два куска:

Недвижимость Москвы.

Недвижимость столицы.

На странице сайта 2 (с малым ВИЦ, внутренняя) найдены ТРИ куска:

Недвижимость Москвы.

Недвижимость столицы.

Элитная недвижимость.

Результат: по запросу недвижимость морда (сайт 1) выпадает, так как ее найденный КОНТЕКСТ БЕДНЕЕ, чем у сайта два и не несет ничего нового.

Естественно гипотеза грубая, так как можно скомбинировать ВИЦы и Богатство контента и получить хрен знает что. 🚬

Вообще-то мне странно, что метод блох мало кто использует. При его стопроцентной эффективности в наше правовой системе.

Или просто бабки в нашей правовой системе еще не достигли половой зрелости?

Jackyk, спасибо за хорошее ко мне отношение..

Пока у меня cureit.exe Доктора веба работает, уже часов 10 работает, даже до системного диска добрался. Еже видать часов 10 работать, там и итоги подведу.

Нашел гадов в моих старых архивах 1998-2000 года... и несколько поновее, посмотрим что получится. Тушканчик отработал (tauscan) по всем дискам, но доктор веб больше нашел (видимо и еще найдет). В общем учусь жить в секретности и под видеонаблюдением :(

Когда кончит, доложу результаты.

О Касперском неплохие отзывы, но все клянут быстродействие.

А Нортон у меня и так стоит с ливеапдейте.

Дверь уже стоит. Открывается и закрывается. Яндекс же меня опять удивляет своим ВИЦем.

Запрос

http://www.yandex.ru/yandsearch?text=yandex+%26%2F%2B0+%25+yandex+%26%2F%2B0++%25yandex&stype=www

находит гораздо больше ТЕКСТОВ ссылок на Яндекс, чем

http://www.yandex.ru/yandsearch?text=yandex&stype=www

Я бы с удовольствием приценился бы. Пока Директ не вдохновляет (по срвнению с первыми ЧАСАМИ).... :)

Всего: 982