Используйте алфавитную сортировку по хосту - Общие вопросы оптимизации

153

Коля Дубр

29 октября 2007, 02:56

#11

Есть полумысль :)

Запрос url="*" показывает:

Результат поиска: страниц — 28 643 235, сайтов — не менее 24 647

24К - явно меньше, чем есть на самом деле, фиг знает, почему именно эти хосты отбираются и почему именно столько. Видимо, поиск слова "хрень" в приведенном запросе производится в этом фиг-знает-как отобранном наборе хостов, отчего и получается меньше результатов.

В подтверждение моей гипотезы: url="hrenius.ru" << url="*"

Разрабатываю общую шину (http://habrahabr.ru/company/floxim/blog/268467/) помаленьку. ...а еще у меня есть бложек (http://www.blogovo.ru/).

322

wilelf

29 октября 2007, 09:20

#12

Хм...а может, дело в том, что по этому запросу отбираются только сайты, которые в основной базе находятся? Т.е. по примеру Гугла, который обращается к вторичной базе только когда ничего не находит в основной?

Агентство контекстной рекламы НеВсем ( https://www.nevsem.ru/ ) Пишу платно статьи для Хабра. Мой профиль ( https://habr.com/ru/users/wilelf/ )

281

pro-maker

29 октября 2007, 10:28

#13

Коля Дубр:
Есть полумысль :)
Запрос url="*" показывает:
Результат поиска: страниц — 28 643 235, сайтов — не менее 24 647

24К - явно меньше, чем есть на самом деле, фиг знает, почему именно эти хосты отбираются и почему именно столько. Видимо, поиск слова "хрень" в приведенном запросе производится в этом фиг-знает-как отобранном наборе хостов, отчего и получается меньше результатов.

В подтверждение моей гипотезы: url="hrenius.ru" << url="*"

Илья, url работает для страниц, для хостов необходимо юзать host :)

url="hrenius.ru" << host="*"

H

50

Hazard

29 октября 2007, 13:24

#14

pro-maker, а может быть Вы знаете, почему эти 2 выдачи разные (места с 8ого)?

http://www.yandex.ru/yandsearch?text=%D1%85%D1%80%D0%B5%D0%BD%D1%8C+%3C%3C+host%3D%22*%22&numdoc=10

http://www.yandex.ru/yandsearch?text=%F5%F0%E5%ED%FC+%3C%3C+rhost%3D%22*%22

Да и сайты разные в выдаче:

http://www.yandex.ru/yandsearch?text=%28%D1%85%D1%80%D0%B5%D0%BD%D1%8C+%3C%3C+host%3D%22*%22%29+%7E%7E%28%D1%85%D1%80%D0%B5%D0%BD%D1%8C+%3C%3C+rhost%3D%22*%22%29&numdoc=10

Вы вероятно не оцениваете мощь и глупость школьников, два этих фактора способны свернуть горы, а сегодня мы делаем шаг к тому чтобы выпустить этого джини на свободу (/ru/forum/comment/4436338)

153

Коля Дубр

29 октября 2007, 15:49

#15

pro-maker, Виталий, а, собственно, чем в данном контексте URL принципиально отличается от хоста, учитывая, что мы используем wildcard и не используем &surl? :) Если заменить слово "хост" на слово "урл" в моем сообщении, смысл изменится?

153

Коля Дубр

29 октября 2007, 16:07

#16

Немного потупив, решил, что такие запросы ранжируются в каком-то полу-алфавитном порядке. Как ставится ограничение - непонятно, но он есть. Например:

url="www.bij.ru" << host="*" - так находит

url="www.bij.ru" << url="*" - а так нет

В первом случае идет алфавитная сортировка по хосту, и "b" проходит ограничение. Во втором - по урлу, и "w" отрезается. Как-то так :)

Прямые заходы и 100% CMS для потрала с Яндекс кобласит

1183

wolf

29 октября 2007, 21:17

#17

_mihey:
1. Почему на запрос хрень и на запрос (хрень << url="*") выдача разная ? И, ведь, не ранжирующее. ?

А что означает запрос url="*" ? По нему выдается слишком мало сайтов и страниц, чтобы считать это запросом, по которому выдаются все документы индекса.

_mihey:
. запрос хрень:500000 - уменьшили влияние текстовой составляющей страниц сайта.

Это еще почему уменьшили? И не путайте операторы : и ::

Это разные операторы. И работают они по-разному.

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )

281

pro-maker

29 октября 2007, 21:50

#18

Коля Дубр:
чем в данном контексте URL принципиально отличается от хоста, учитывая, что мы используем wildcard и не используем &surl? Если заменить слово "хост" на слово "урл" в моем сообщении, смысл изменится?

Рассматривая общее в поиске по URL и хостам, необходимо учитывать частное, выраженное контекстом заложенным поисковыми программерами Яндекса. Не могу дискутировать, поскольку нет времени разбираться со спецификой поиска, но, если под url="*" подразумевается "найти все", лучше использовать что-то типа domain="root". Количество выдаваемых поисковых результатов нельзя использовать в качестве полноты охвата базы, поскольку вполне возможно обрезание из-за представлений о "достаточночти" предлагаемой выборки.

Коля Дубр:
В первом случае идет алфавитная сортировка по хосту, и "b" проходит ограничение. Во втором - по урлу, и "w" отрезается

Очень сомневаюсь, что яндексоиды упадут до сортировки по алфавиту, скорее всего это текстовое ранжирование (вспоминаем ХРНС).

199

_mihey

29 октября 2007, 22:07

#19

wolf:
Это еще почему уменьшили? И не путайте операторы : и :: Это разные операторы. И работают они по-разному.

Да, уже понял - это в запаре уже больший эффект заметил именно от этого оператора.

Спасибо за подсказки, разобралсо.

Куплю размещение статей с трансляцией в Я.Новости (/ru/forum/833079)

153

Коля Дубр

29 октября 2007, 22:55

#20

pro-maker:
поскольку вполне возможно обрезание из-за представлений о "достаточночти" предлагаемой выборки.

Так оно не то что возможно - оно вполне имеет место быть :) Сумма найденных сайтов по запросам url="a*", url="b*"... url="d*" - уже превышает число найденных по url="*". С host и rhost ситуация та же. Моя мысль состояла в том, что при поиске (хрень << url="*") из выдачи исчезают сайты, "обрезанные" на запросе url="*" (т.к. неранжирующее И очень похоже на буквальный "поиск в найденном"). И в этом смысле не важно, какой именно оператор используется.

Насчет алфавитной сортировки может и погорячился. Однако по url="*" первые 10 результатов начинаются либо с буквы "a", либо с цифры. Совпадение? Ковыряем дальше, перебирая запросы url="a*" << url="*", url="b*" << url="*" и далее по алфавиту. Кол-во найденных с каждым запросом сокращается, и на букве j равно нулю. С оператором host этот финт не проходит, так что тут я был неправ :)

Поиск поддоменов в Яндексе Еще один альтернативный метод В Яндексе опять изменения?

Open AI тестирует память для ChatGPT

Зачем быть уникальным в мире, где все можно скопировать

Мучают глупые вопросы