IBM разрабатывает свою поисковую систему?

130

Vyacheslav Tikhonov

22 сентября 2001, 20:31

1410

Не так давно столкнулся с интересным роботом - компании IBM. В User-Agent у него выставлена страница:

http://www.almaden.ibm.com/cs/crawler

Здесь они кратко описывают свои цели:

The information we collect from the web is currently being used in IBM's
Research Division for several search/indexing projects.

Похоже, они тоже хотят попасть на этот рынок. Кто-нибудь об этом что-то знает?

VT

130

Vyacheslav Tikhonov

22 сентября 2001, 20:46

#1

<font face="Verdana" size="2">Originally posted by Vyacheslav Tikhonov:
Не так давно столкнулся с интересным роботом - компании IBM. В User-Agent у него выставлена страница:
http://www.almaden.ibm.com/cs/crawler
Здесь они кратко описывают свои цели:
The information we collect from the web is currently being used in IBM's
Research Division for several search/indexing projects.
Похоже, они тоже хотят попасть на этот рынок. Кто-нибудь об этом что-то знает?</font>

Ну вот уже нашел, чем они занимаются: "Умная поисковая машина"(CLEVER search engine):

Enhancements to HITS algorithm. A number of algorithmic methods to improve the precision and functionality of the basic HITS algorithm. There are several such related efforts, in Almaden and elsewhere (see for instance our SIGIR98 Workshop paper).

Hypertext Classification. Classifying hypertext into a hierarchical topic taxonomy: using a hyperlink induced feature set to significantly improve classification accuracy (see the VLDB Journal paper).

Focused Crawling. Using Hypertext classification and topic distillation tools to focus a crawler to work within a specific topic domain, ignoring unrelated and irrelevant material. (see the WWW8 paper.)

Mining Communities. The web is home to more than 100,000 communities: groups of people and web pages created and maintained by them based on a shared interest on a particular topic. Finding and organizing them within an organized informational framework presents significant technical challenges. (See the WWW8 paper.)

Modeling the web as a graph. What is a good stochastic model for the web as a graph? An answer to this question would give us ways of predicting the growth and interconnection structure of the web, and allow us to tune efficient algorithms for the web. (See the VLDB 99 paper.)

Звучит совсем неплохо. Если это удастся воплотить в жизнь.

http://www.almaden.ibm.com/cs/k53/clever.html

We're focused on building Роман Мандрик Вирусный маркетинг: ТИЦ: интересные изменения 13-01-07

190

kit

22 сентября 2001, 20:55

#2

Все-таки не свовсем понятно, что они задумали.

А в логах их полно в последнее время, это точно. И еще AskJeeves активизировался.

Master-X.com (http://www.master-x.com) - крупнейшее сообщество русскоязычных эдалт вебмастеров.

NW

69

NightWing

23 сентября 2001, 16:45

#3

Вот у меня статистика за послений месяц по "импортному" сайту:

IBM/Almaden 6475

Google 505

OpenFind 8

Yandex (RUSSIA) 7

Inktomi 5

Lycos 4

Altavista 1

Просканировала, похоже, весь сайт - да некоторые страницы ещё и по 2 раза. Приходит почти ежедневно. Если она так шустро будет и в будующем работать - то флаг ей в руки.

Однако думается мне, ibm вряд ли будет делать "собственеый" se, скорее просто лицензировать технологий и индексы для 3rd parties. Но новой поисковке с хорошим и шустрым роботом я был бы рад

p.s. Подбор литературы вроде бы неплохой. Притом, судя потому что много .ps - литература научного характера. У нас ряд товарищей думаю займутся reverse engeneering

Maxim A. Ralnikovhttp://ralnikov.com

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

168

Avatar

7 августа 2003, 08:49

#4

Вот и ко мне это чудо наконец то заглянуло, но взяло только индекс (пока ?)

60

InSAn

7 августа 2003, 09:37

#5

Ко мне "это чудо" еще год назад заглядывало...

ADPRO - Мы знаем, что Вам нужно! (http://adpro.ua)

C

120

Cherny

7 августа 2003, 09:47

#6

Ко мне "это чудо" еще год назад заглядывало...

А тему подняли двухлетнюю...

С уважением, Владимир Чернышов. (не)?путевые заметки (http://chernyshov.kiev.ua/)

60

InSAn

7 августа 2003, 11:33

#7

А тему подняли двухлетнюю

Блин! На дату не посмотрел :)

Avatar, зачем поднял-то?

168

Avatar

7 августа 2003, 15:44

#8

Да я собственно на дату тоже не смотрел, нашел поиском по форуму...

Видать какую нибудь ссылку на меня нашел этот бот.

VK приобрела 70% в структуре компании-разработчика red_mad_robot

Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта