iseg

Рейтинг
80
Регистрация
15.12.2000
Должность
Search Engine Department Manager, Yandex
Интересы
Search Engine Development
Как писал slawa

страниц - *****, серверов - не менее AAAA :
страниц - *****, серверов - не менее BBBB :

наша поисковая архитектура не позволяет корректно (дешевым образом) определять число найденных серверов. Также как скажем и архитектура многих других поисковых систем (Google, Апорт и т.д.)

Поэтому мы и печатаем "не менее".

"Не менее" означает "меньше или равно".

Но никак не "равно".

Илья

Чем же она взвешенней и объективней?

При чем тут факторы? ... :)

Тут баг обычный. Налицо. Явно.

Так же как и в аналогичной фиче расширенного поиска гугля.

Как писал CarDriver
А раньше помнится у них был собственный поиск ?

И даже трепыхались они перед смертью (в отличие от infoseek и lycos). Нарастили базу до 250/500 млн. док.

Но, увы, было слишком поздно. Нельзя было три года подряд пренебрегать...

Как писал mnt
Вообще по-моему у Яндекса наступает маразм - ну какая ему разница где я ссылки размещаю? это моё дело.

А какая вам разница что мы их считаем с пониженным весом, с повышенным или вообще не считаем. Глупости это - забудьте вы о нас. Это же все только к пользователям относится, а вовсе не к вам :)

Если у вас есть синтез кроме анализа (в т.ч для несловарных слов!), то подойдут любые версии "многострочного" поиска: хэш, тернарное дерева, DFA(в духе fgrep), Ахо-Горасик, бит-параллельные методы и т.п. Если синтеза нет или он не для всех видов слов, то вариантов два: хранить номера слов в индексе и доставать их при подсветке, или воспользоваться неполным сравнением: по началам слов, по основам и т.п.

Отдельно стоит вопрос все ли вы слова собираетесь подсвечивать. Если, например, как Я-Сайт - только "результативные", то нужно либо хранить позиции, либо делать "микроиндексирование" с "микропоиском"

Илья

Как писал wolf
Прочел в статье Ильи Сегаловича:

Вот-вот. И должен этот тред лежать в обсуждениях статей, а не на форуме.

1. Мы (Яндекс) не обязаны комментировать или называть причины удаления...

2. В статья я не говорил о продажах как причинах бана. Я просто

подчеркнул (случайную или нет - не важно, я как журналист про это ничего не знаю) логическую последовательность, особенно заметную в сопоставлении с Гуглем/Кингом. Кроме того, слово "продавать" я взял в кавычки, чтобы подчеркнуть условный характер этого термина в данном контексте.

3. Это неправда, что в том старом топике не говорилось про запрет на продажу. Например:

Editorial listing не продается. Там не должно быть ничего за деньги

4. Я очень сожалею, что вы вытаскиваете эту тему. В "новостной ленте" я упомянул про этот скандал, только чтобы подчеркнуть универсальный, международный, непосредственно касающийся России характер этой проблемы. А вовсе не для ворошения "грязного белья". Жаль, что был превратно понят.

Илья

Как писал wolf
Люди имеют право знать, за что их конкретно наказывают. А вы в этом праве им оказываете.

Как это отказываю? Я привожу ссылку на ВебПланету, которая в свою очередь ссылается на данный форум, в котором эта тема исчерпывающим образом обсуждается.

Как писал Gray
Что за подписки...

Мне приходит пяток подписок про поиск из разных мест. Я их читаю. Все равно время тратится.

Потом вижу их следы в отечественной прессе в искаженом до неузнаваемости виде. Хочется плакать и т.д. и т.п.

Всего: 442