Мучают глупые вопросы

123
Коля Дубр
На сайте с 02.03.2005
Offline
153
#11

Есть полумысль :)

Запрос url="*" показывает:

Результат поиска: страниц — 28 643 235, сайтов — не менее 24 647

24К - явно меньше, чем есть на самом деле, фиг знает, почему именно эти хосты отбираются и почему именно столько. Видимо, поиск слова "хрень" в приведенном запросе производится в этом фиг-знает-как отобранном наборе хостов, отчего и получается меньше результатов.

В подтверждение моей гипотезы: url="hrenius.ru" << url="*"

Разрабатываю общую шину (http://habrahabr.ru/company/floxim/blog/268467/) помаленьку. ...а еще у меня есть бложек (http://www.blogovo.ru/).
wilelf
На сайте с 27.06.2005
Offline
322
#12

Хм...а может, дело в том, что по этому запросу отбираются только сайты, которые в основной базе находятся? Т.е. по примеру Гугла, который обращается к вторичной базе только когда ничего не находит в основной?

Агентство контекстной рекламы НеВсем ( https://www.nevsem.ru/ ) Пишу платно статьи для Хабра. Мой профиль ( https://habr.com/ru/users/wilelf/ )
pro-maker
На сайте с 08.12.2003
Offline
281
#13
Коля Дубр:
Есть полумысль :)
Запрос url="*" показывает:
Результат поиска: страниц — 28 643 235, сайтов — не менее 24 647

24К - явно меньше, чем есть на самом деле, фиг знает, почему именно эти хосты отбираются и почему именно столько. Видимо, поиск слова "хрень" в приведенном запросе производится в этом фиг-знает-как отобранном наборе хостов, отчего и получается меньше результатов.

В подтверждение моей гипотезы: url="hrenius.ru" << url="*"

Илья, url работает для страниц, для хостов необходимо юзать host :)

url="hrenius.ru" << host="*"

H
На сайте с 24.10.2005
Offline
50
#14
Вы вероятно не оцениваете мощь и глупость школьников, два этих фактора способны свернуть горы, а сегодня мы делаем шаг к тому чтобы выпустить этого джини на свободу (/ru/forum/comment/4436338)
Коля Дубр
На сайте с 02.03.2005
Offline
153
#15

pro-maker, Виталий, а, собственно, чем в данном контексте URL принципиально отличается от хоста, учитывая, что мы используем wildcard и не используем &surl? :) Если заменить слово "хост" на слово "урл" в моем сообщении, смысл изменится?

Коля Дубр
На сайте с 02.03.2005
Offline
153
#16

Немного потупив, решил, что такие запросы ранжируются в каком-то полу-алфавитном порядке. Как ставится ограничение - непонятно, но он есть. Например:

url="www.bij.ru" << host="*" - так находит

url="www.bij.ru" << url="*" - а так нет

В первом случае идет алфавитная сортировка по хосту, и "b" проходит ограничение. Во втором - по урлу, и "w" отрезается. Как-то так :)

wolf
На сайте с 13.03.2001
Offline
1183
#17
_mihey:
1. Почему на запрос хрень и на запрос (хрень << url="*") выдача разная ? И, ведь, не ранжирующее. ?

А что означает запрос url="*" ? По нему выдается слишком мало сайтов и страниц, чтобы считать это запросом, по которому выдаются все документы индекса.

_mihey:
. запрос хрень:500000 - уменьшили влияние текстовой составляющей страниц сайта.

Это еще почему уменьшили? И не путайте операторы : и ::

Это разные операторы. И работают они по-разному.

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
pro-maker
На сайте с 08.12.2003
Offline
281
#18
Коля Дубр:
чем в данном контексте URL принципиально отличается от хоста, учитывая, что мы используем wildcard и не используем &surl? Если заменить слово "хост" на слово "урл" в моем сообщении, смысл изменится?

Рассматривая общее в поиске по URL и хостам, необходимо учитывать частное, выраженное контекстом заложенным поисковыми программерами Яндекса. Не могу дискутировать, поскольку нет времени разбираться со спецификой поиска, но, если под url="*" подразумевается "найти все", лучше использовать что-то типа domain="root". Количество выдаваемых поисковых результатов нельзя использовать в качестве полноты охвата базы, поскольку вполне возможно обрезание из-за представлений о "достаточночти" предлагаемой выборки.

Коля Дубр:
В первом случае идет алфавитная сортировка по хосту, и "b" проходит ограничение. Во втором - по урлу, и "w" отрезается

Очень сомневаюсь, что яндексоиды упадут до сортировки по алфавиту, скорее всего это текстовое ранжирование (вспоминаем ХРНС).

_mihey
На сайте с 15.07.2005
Offline
199
#19
wolf:
Это еще почему уменьшили? И не путайте операторы : и :: Это разные операторы. И работают они по-разному.

Да, уже понял - это в запаре уже больший эффект заметил именно от этого оператора.

Спасибо за подсказки, разобралсо.

Куплю размещение статей с трансляцией в Я.Новости (/ru/forum/833079)
Коля Дубр
На сайте с 02.03.2005
Offline
153
#20
pro-maker:
поскольку вполне возможно обрезание из-за представлений о "достаточночти" предлагаемой выборки.

Так оно не то что возможно - оно вполне имеет место быть :) Сумма найденных сайтов по запросам url="a*", url="b*"... url="d*" - уже превышает число найденных по url="*". С host и rhost ситуация та же. Моя мысль состояла в том, что при поиске (хрень << url="*") из выдачи исчезают сайты, "обрезанные" на запросе url="*" (т.к. неранжирующее И очень похоже на буквальный "поиск в найденном"). И в этом смысле не важно, какой именно оператор используется.

Насчет алфавитной сортировки может и погорячился. Однако по url="*" первые 10 результатов начинаются либо с буквы "a", либо с цифры. Совпадение? Ковыряем дальше, перебирая запросы url="a*" << url="*", url="b*" << url="*" и далее по алфавиту. Кол-во найденных с каждым запросом сокращается, и на букве j равно нулю. С оператором host этот финт не проходит, так что тут я был неправ :)

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий