Вдруг они sql используют? Или у Вас есть данные, что они как то по другому делают, например хешируют? Вроде набрал строку запроса, для нее хешкод и он сразу на 1й сайт показывает?
- А что мешает в этом же поле учесть вес всего текста ссылки (ее встречаемость в интернете)?
- Да он и так существует :) только я думаю вместе с учетом числа ссылок на странице.
Ну а теперь такой пример:
на страницу ссылается 20000 ссылок и все по запросу найдены.
Если "вес ссылок" не огрубить до скажем 10 уровней, то подсчет релевантности будет тормозной (ВИЦ донора ~ вес пассажа в ссылке по всем 20000 ссылок, а если еще кворум в ссылках искать).
Гипотеза об учете только самых сильных ссылок наводит на грустные мысли о хреновом качестве поиска :)
А чем хуже гипотеза ссылочного как наиболее уникального набора текстов ссылок? и просчета только по найденным уникальным текстам ссылок (точнее их количества с учетом или без учета веса каждой уникальной ссылки)?
SQL запросы хорошо считают число записей, но с трудом переваривают групповые операции со сложными и даже не сложными выражениями, а их ведь еще надо и упорядочить по ранжиру.
Логично! Но не опровергает гипотезу о ВЕСЕ ТЕКСТА ССЫЛКИ (против веса СЛОВА, ведь Вы не будете возражать?). А если учесть ВЫРАЖЕНИЯ, которые Яндекс в переколдовке дает, например после ОДНОГО двоеточия ДЛЯ ВЫРАЖЕНИЯ В СКОБКАХ:
(........):0
то у Яндекса есть механизм присвоения и учета ВЕСА выражениям, а чем текст ссылки не выражение?
ВИЦ ссылающейся страницы легко прочувствовать для малого числа ссылок, но как Вы отделите его от ПЕРЕДАЧИ веса(ВИЦ) на акцептор? Толи от передачи ВИЦ запрос поднялся, толи от ВИЦА передающей страницы?
А когда ссылок много и подавно все запутано :)
Если Яндексу онлайн надо учитывать ВИЦы ВСЕХ найденных ссылающихся страниц - он захлебнется. Если только отфильтрованных, то фильтр должен быть очень простым, иначе опять захлебнется, а фильтр еще и ресурсы жрет. Но слишком простой фильтр трудно подстроить так чтобы по всем мыслимым темам поиск был приемлемым, поэтому Яндекс должен был бы принять Гуглеподобную схему: вицы считать отдельно оффлайн, лексику отдельно онлайн.
Вот смотрю на морды Яндекса, Рамблера Лента.Ру и думаю какие еще морды могут быть жирнее для экспериментов? Или Вы думаете, что мы морды только народовских сайтов для экспериментов берем? :)
http://www.yandex.ru/yandsearch?text=Mama.ru:%20клуб%20родителей
http://www.yandex.ru/yandsearch?text=Адвокат%20Сухарев%20и%20Партнеры
Ссылки по маме и адвокату с Рамблера по значению одинаковы?
Если бюджет невысокий, обычно ограничиваются каталогами. И поменяйте тексты ссылок на уже закаталоженный сайт.
И вторая фишка есть для хорошего бюджета, но тут много шума поднимется, потому умолчу :)
Ночью по первому запросу (с процентом) Яша выдал 5 текстов ссылок.
Я не уверен, что при ссылочном ВИЦ работает так, как мы думаем :)
А может он вообще не работает? И какой (какие ВИЦы) работают?
Страниц то много (где ссылки и куда ссылки).
И существует ли "ВИЦ" (ССЫЛКОРЭЙНДЖ | ВЕС) ссылки? :) 😂 😂 😂
скажем для ссылки "недвижимость Ногинск" вес 1000
а "недвижимость Москва" вес 20 :D :D :D
Есть одна гипотеза. Весомее - это БОГАЧЕ НАЙДЕННЫМ КОНТЕНТОМ.
Найденный контент это кусок текста (на найденной странице или в страницах, ссылающихся на найденную) ВНУТРИ которого НАШЛИ пассаж ЗАПРОСА.
Ублюдочный пример:
запрос:недвижимость
На странице сайта 1 (с большим ВИЦ, морда) найдены два куска:
Недвижимость Москвы.
Недвижимость столицы.
На странице сайта 2 (с малым ВИЦ, внутренняя) найдены ТРИ куска:
Элитная недвижимость.
Результат: по запросу недвижимость морда (сайт 1) выпадает, так как ее найденный КОНТЕКСТ БЕДНЕЕ, чем у сайта два и не несет ничего нового.
Естественно гипотеза грубая, так как можно скомбинировать ВИЦы и Богатство контента и получить хрен знает что. 🚬
Вообще-то мне странно, что метод блох мало кто использует. При его стопроцентной эффективности в наше правовой системе.
Или просто бабки в нашей правовой системе еще не достигли половой зрелости?
Jackyk, спасибо за хорошее ко мне отношение..
Пока у меня cureit.exe Доктора веба работает, уже часов 10 работает, даже до системного диска добрался. Еже видать часов 10 работать, там и итоги подведу.
Нашел гадов в моих старых архивах 1998-2000 года... и несколько поновее, посмотрим что получится. Тушканчик отработал (tauscan) по всем дискам, но доктор веб больше нашел (видимо и еще найдет). В общем учусь жить в секретности и под видеонаблюдением :(
Когда кончит, доложу результаты.
О Касперском неплохие отзывы, но все клянут быстродействие.
А Нортон у меня и так стоит с ливеапдейте.
Дверь уже стоит. Открывается и закрывается. Яндекс же меня опять удивляет своим ВИЦем.
Запрос
http://www.yandex.ru/yandsearch?text=yandex+%26%2F%2B0+%25+yandex+%26%2F%2B0++%25yandex&stype=www
находит гораздо больше ТЕКСТОВ ссылок на Яндекс, чем
http://www.yandex.ru/yandsearch?text=yandex&stype=www
Я бы с удовольствием приценился бы. Пока Директ не вдохновляет (по срвнению с первыми ЧАСАМИ).... :)