Keva

Рейтинг
80
Регистрация
27.11.2000
Интересы
Software development, linguistics, BMW, dogs, girls ;-)
Alex Tanchik:
Плюс, в интернет проектах основную ценность играют технологии и бренд. Образно говоря, если технологии больше некому подхватить, а с толковыми умами увы в Украине проблема, то остается только надеяться, что проект вытянет сильный бренд.

Алексей, вот насчет проблемы с толковыми умами на Украине я не согласен. Ситуация с ними на Украине ничуть не хуже и не лучше, чем в других местах.

Я это говорю не понаслышке, чай, не первый год разработку на Украине ведем - хороших специалистов найти можно. Только надо хорошенько их искать.

Yukko:
Сайтом Артемия Лебедева обчитался?

Молодой человек, я уже много лет вхожу в число тех, кто может себе позволить как минимум не цитировать сомнительные источники. И высказывать не чужие, а свою точку зрения по тому или другому вопросу.

И если я что-то сказал, то у меня есть достаточные основания для этого.

Yukko:
... Тот тоже пишет, что незаменимые есть...

Ну, значит, и ему периодически приходят в голову толковые мысли. Что тут плохого?

Yukko:
... Даже спорить не буду, неинтересно...

... но, тем не менее, тут спорить уже начали :)

Yukko:
... Если Джед Санден согласился с увольнением целой команды, значит он знает, что делает.

Мне всегда хотелось увидеть работодателя, который бы НЕ согласился с желанием команды покинуть проект :) Прежде всего, конечно, интересно было бы посмотреть на то, какие действия предпримет этот гипотетический работодатель :) Неужели разбойников позовет? :) Или дядю милиционера? :) Не смешите меня, молодой человек :)

Yukko:
С другой стороны я тоже знаю, что бы я делал, если бы мне дали сложную систему без рулевого.
Хотите скажу что?
РАБОТАЛ БЫ!!!

Наверное, из-за вот такой вот Вашей подростковой самоуверенности Вам ее и не дают :) Помните, кстати, анекдот про обезьяну, банан и милиционера? Вот и Вы сейчас - "а что тут думать, трясти надо!" :)

Ничего личного, просто старайтесь, высказывая свою точку зрения, не быть столь безапеляционным :)

Yukko:
Незаменимых не бывает! А тяжелый паровоз не остановить путем подкладывания пальца на рельсы... будет достаточно одной светлой головы с немного меньшими амбициями...

Конечно, это не так. Незаменимые люди не только бывают - они есть. И то, что заменить ключевого разработчика, автора и архитектора большой системы другим, "немножечко менее ключевым", можно без ущерба для проекта - это иллюзия, которую старательно взращивают на курсах MBA.

Что же касается амбиций - как правило, они коррелируют с "мощностью" данного человека. В лучшем случае их можно удовлетворить материально. В худшем - не знаю :)

А паровоз можно остановить даже проще. Не подкладывая палец на рельсы, а просто демонтировав золотник :)

mediatime:
...
Вопрос: может быть это связано с двумя черточками разделения которые отделяют название от продукта? (--)

Именно с ними это и связано. Дело в том, что раньше было много любителей отбить title пробелами, переводом строки или еще чем, и дописать всякого г... туда.

Ну вот и утоптали в свое время.

Ашманов прав. :)

D.O.:
Какой квалификацией должен обладать разработчик поисковой системы?
...

Нанимая разработчиков, в свое время я формализовал эти требования:

- реальное знание C, CXX;

- Кнут, "сортировка и поиск" в активе;

- способность за несколько часов отсортировать несколько гиг строк, естественно, в ограниченном объеме памяти, имея под руками только gcc и усеченный набор библиотек и заголовков: string.h, stdlib.h - попросту, не используя STL :)

Ну, а дальше - "по месту". Кое с кем приходилось расставаться. Например, за такое в коде:

===

char toUpCaseMatrix1251[256] = {

...

};

inline char toUpCase1251( char ch )

{

return toUpCaseMatrix1251[ch];

}

===

Кстати, а чем, как вы думаете, мне не понравился этот код? :)

Во-первых, никаких "сниппетов" не существует :) Оригинальное название этого дела - "цитаты", или "цитаты релевантных фрагментов" :)

Впервые такое дело в промышленном масштабе было реализовано еще в советские годы, в ИнфорЭлектро, группой ныне здравствующего Владимира Пархоменко в рамках системы "Скобки" - так назывался небольшой поисковичок.

Первая "большая" поисковая система, которая это делала - это Апорт, запущенный в 1996 году вашим покорным слугой. И там это тоже называлось "цитатами", а никакими не "сниппетами". Фу, вульгарный жаргон!

alexf2000:
Вопрос - как их правильно делать, может есть готовые алгоритмы или толково описанный принцип их создания?

Теперь по реализации.

Я обычно реализую это через т. н. "плоский индекс" - через образы документов, где каждое слово представлено 4-байтным идентификатором. При вычислении запроса с учетом координат слов запоминаю несколько самых релевантных фрагментов, строю битмапу для цитирования и, адресуя этот образ индексами слов, строю цитату. Вхождения, соответственно, все подсвечиваю.

Кстати, использование такого плоского индекса на небольших объемах - не более пары миллионов урлов - может, как ни странно, при переорганизации алгоритма сократить объем обратного индекса.

InSAn:
Это шутка? ;) Оценил ;)
PS: Пообщаемся по аське - авторизировал.

http://linguist.nm.ru/stemka/stemka.html

InSAn:
Keva, А мне вот интересно было бы поюзать стемку :)
Особенно для укр. языка...

Так, казалось бы, загружай и пользуй :)

greenwood:
нет ..нет .. мы токи только в научных целях

Ну.... С днем рождения! И за "научные цели"! :)

Всего: 238