iseg

Рейтинг
80
Регистрация
15.12.2000
Должность
Search Engine Department Manager, Yandex
Интересы
Search Engine Development

Апокалиптические картины...

Требуются пояснения.

1. Ночью выложили новую программу. в ней был баг - не всегда симметрично считался хеш имен файлов в кеше - старые запросы не всегда находились - отсюда вторая страница, все уточнения и т.п.) Невнимательно проверили. Заметили к сожалению поздно, примерно в 13:30. Сразу же конечно же исправили. Приносим свои извинения. Меры по повторному недопущению приняты.

2. На прошлой неделе - во вторник - грохнулся диск с несколькими уникальными сервисами. Второстепенными по смыслу, но тем не менее. (Энциклопедии, addurl, новости и еще чего-то). Восстановили все за 1-2 дня. Еще на прошлой неделе. Я все это уже где-то объяснял.

3. Самоокупаемость - это когда расходы (зарплата, железо, трафик, помещение) полностью покрываются дозодами. Считать по месяцам - глупо. Правильно считать поквартально (трехмесячный срок). Угадать когда компания, долгое время бывшая убыточной, станет приносить прибыль - дело трудное и "спекулятивное". Два года назад мы поставили срок - начало 2003 года. "От балды". В начале этого года, опять же несколько авантюрно, прикинули, что есть шанс стать доходными в последнем квартале года. Нам, на самом деле, несмотря на весьма значительные расходы по желеу (больше плановых) в сентябре, удалось стать прибыльными по итогам трех месяцев подряд.

Если вы прочитаете наш пресс-релиз, а не его изложение, то увидите, что наше "нескрываемую" радость мы пытались сдобрить максимально возможной долей юмора. Может быть это и не получилось - не нам судить...

www.searchtools.com

кстати, если я не ошибаюсь, обязательная ссылка ставится только в бесплатных версиях я-сайта.

долго тестировали. старались к кубку успеть.

Как писал Gray
в его умении "не индексировать будущее", как это называли гугловцы

Роботу можно и помочь...

А где они так говорят?

Как писал Gray
Так что аппетит - вещь спорная :)

все верно. Но ведь есть же и очень большие сайты с бесконечной динамикой.

Как писал Gray
Аппетит робота непредсказуем.

Но не безграничен.

все лето писали о том уйдет ли яху от Гугля. Вариантов по сути было только два - Фаст и Инктоми.

Что касатется того что случилось позавчера - у Дэнни подробнейшим образом все дано написано. Замешивать они стали. Кого-то это мне напоминает.

присоединяюсь от всей души! хоть и с опозданием :)

Как писал msa
Люди , а не подскажете как написать класификатор?

База данных статей по автоматической классификации текста - 385 статей.

http://liinwww.ira.uka.de/bibliography/Ai/automated.text.categorization.html

Результаты поиска "text categorization" по CiteSeer - 431 статья:

http://citeseer.nj.nec.com/cs?q=text+categorization&submit=Search+Documents&cs=1

Успехов,

Илья

Как писал msa
1-й шаг: создаем дерево(говорят инфа в дереве ищется очень быстро!:) )

Смотря в каком. Деревьев поиска с сотню разных будет. Вы о каком дереве говорите?

Нам нужны реальные связи слов.А как енто сделать? Да очень просто всего лишь два дополнительных указателя (предыдущий , последующий)юКазалось бы проблема с вытяжкой полного текста решена !!!

Что такое "реальные" связи слов? Чем они отличаются от "нереальных" (или сюрреальных)? Зачем они они нужны? Кому?

При чем тут "вытяжка полного текста"?

Какое она имеет отношение к классификации?

Вообще, о каком алгоритме, решающем какую задачу, здесь идет речь?

2-й шаг Нет не решена :)))) проблемка . Будет побочный страшный эфект.Будет создано много одинаковых слов и связь будет теряться(не знаю как на вашем диалекте енто явление правильно назвать).

Зачем же для классификации текста создавать много одинаковых слов?

Странная идея...

Вообще создавать слова - весьма загадочное действие, а если они при этом еще и одинаковые ... это производит совсем странное впечатление.

Да, а как "создание одинаковых слов" влияет на "потерю реальной связи"?

Будут образовываться
множества и сотен таких слов.А енто серьезный трабл.Что же делать?

Правильно ли я понял, что предлагается создать контейнер для хранения множеств "одинаковых строк", где каждая строка повторена 100 раз...?

Это действительно несложно. Но зачем????

На просто создать нити, покоторым машина могла ходить (прито четко ходить , а не как попало :) ).Казалось бы выход в использовании дополнительных указателей (а че вполне приемлемо). Но нет перерасход памяти , потеря в быстродействии ..... и тд тп.
Надо нормальные полноценные нити.Енту проблему я думаю решит один из методов матстатистики :)

Что такое "нити", по которым предлагается "ходить машинам"? Это "threads"? У вас мультитредовая программа? Но при чем тут отказ от указателей? Каким образом дисциплиной выполнения (тредами) можно заменить структуру данных?

Здесь явно какая-то "бузина с дядькой"...

3-й шаг (если второй можно было назвать шагом:)) Великая , однако , наука матстатистика не правдали? ... Остального не скажу , секрет енто большой

Если остальное в том же духе, что и первое, то, действительно, лучше не говорите.

Дерзайте ! Удачи

Спасибо, как-нибудь в другой раз.

С уважением,

Илья

Всего: 442