Я в статье выступаю в роли журналиста :). И оценок никаких не даю. (стараюсь). Просто столько всякой вокруг ерунды и неточностей пишут, что просто сил никаких нет молчать. И потом, все равно сыпятся подписки - можно раз в месяц дайджест сварганить за полчаса :).
Что касается августовской истории - какая, в сущности, разница за что? Мы же не трибунал в самом-то деле.
Вот Гугль, сначала "Кингов" рубанул по полной программе, те сразу в суд, а сейчас журналисты пишут - только непот-фильтр оставил. Причем "Кинги" прямо на "морде" рекламировали - одна долька пейджранка - столько-то килобаксов, две - столько-то. Ну не забавно ли? :)
Да нет, читать я тоже умею :))
Я воспользоваться пытаюсь и никак не могу понять что же все-таки происходит :)
Или по-другому. Тема слишком общая и философская, чтобы в нее влезать походя. А по-серьезному влезать нет времени.
А тон был задан с самого начала прикольный.
И конечно же никто в угоду коммерции качеством не жертвует. Даже мыслей таких нет. Качественный поиск - это же наш основной товар. На него и только на него люди ходят. А без людей мы - ничто.
Илья
Ха! Это я Гугля цитировал. Сам бы я так в жизни не сказал.
Задача: найдите оригинал...
свидетельствую.
однако она опять съехала.
Аня работает в отделе продаж и не обязана вникать в тонкости терминологии отдеа посиковых систем.
Есть лицензия. Ее смело можно называть правилами.
Есть этические правила. (как и в любом бизнесе, например IT профсоюз может запретить откаты и недобросовестное поведение на тенджерах и т.д.).
И вообще почему в правилах должна быть конкретика?
И потом дались вам эти "правила"...
26 слов в тайтле это спам, а 25 - нет? Белый на белом - спам, а белый на сверх-сетло-желтом - нет? Смешно, правда ведь?
Например фраза про "мягкую корректировку", о которой тут говорят я бы в жизни не употребил.
То, что мы сделали по поводу лукашенко и микрософта я подробно описывл где-то на форуме (нашем или этом - не помню). Это не "корректирова результатов", а исправление формулы. Всеобщее, относящееся к ранжированию всех сайтов.
Мы, год назад стали нормировать TF по максимально частотному слову в ссылках:
(TF(маздай) = F(маздай)/F(микрософт))
и, таким образом, слегка придавили эти "маздаи".
Примерно то же самое делал Гугль года два-три назад, когда у них были подобные же проблемы с какими-то подобными словами.
Врезки писал не я. Я их даже не правил, хотя и видел. Это материал от редактора Компьютерры.
"Исполнительный директор интернет-холдинга eHouse Владислав Улендеев усомнился ..."
Какой текст! Супер!
Я бы внес ма-а-ленькую поправку:
"Исполнительный директор известного тайпсквоттерского сайта jandex.ru посетители которого образуют основную аудиторию интернет-холдинга eHouse, Владислав Улендеев усомнился...."
Комментарии убийцы о моральных достоинствах убиенного....
Комментарии вора о материальных благах обворованного....
Комментарии владельцев jandex-а о доходах yandex-а....
Йес!
Не, но какова квалификация журналиста, я просто тащусь.
В целом с Игорем я согласен.
Но для разглядывания могу подкинуть ссылочку на описание неплохо организованного динамического индекса, сделанного из Berkeley DB (транзакции и прочее в ней имеются).
http://www10.org/cdrom/papers/275/index.html
Пункт 4. Managing inverted files in an embedded database system
Поиск там конечно медленней статического в разы, да и как сливаются "постлисты" не описано, но все же рекомендую.
С уважением,