IBM разрабатывает свою поисковую систему?

VT
На сайте с 27.01.2001
Offline
130
1394

Не так давно столкнулся с интересным роботом - компании IBM. В User-Agent у него выставлена страница:

http://www.almaden.ibm.com/cs/crawler

Здесь они кратко описывают свои цели:

The information we collect from the web is currently being used in IBM's
Research Division for several search/indexing projects.

Похоже, они тоже хотят попасть на этот рынок. Кто-нибудь об этом что-то знает?

VT
На сайте с 27.01.2001
Offline
130
#1

<font face="Verdana" size="2">Originally posted by Vyacheslav Tikhonov:
Не так давно столкнулся с интересным роботом - компании IBM. В User-Agent у него выставлена страница:
http://www.almaden.ibm.com/cs/crawler
Здесь они кратко описывают свои цели:
The information we collect from the web is currently being used in IBM's
Research Division for several search/indexing projects.

Похоже, они тоже хотят попасть на этот рынок. Кто-нибудь об этом что-то знает?
</font>

Ну вот уже нашел, чем они занимаются: "Умная поисковая машина"(CLEVER search engine):


Enhancements to HITS algorithm. A number of algorithmic methods to improve the precision and functionality of the basic HITS algorithm. There are several such related efforts, in Almaden and elsewhere (see for instance our SIGIR98 Workshop paper).

Hypertext Classification. Classifying hypertext into a hierarchical topic taxonomy: using a hyperlink induced feature set to significantly improve classification accuracy (see the VLDB Journal paper).

Focused Crawling. Using Hypertext classification and topic distillation tools to focus a crawler to work within a specific topic domain, ignoring unrelated and irrelevant material. (see the WWW8 paper.)

Mining Communities. The web is home to more than 100,000 communities: groups of people and web pages created and maintained by them based on a shared interest on a particular topic. Finding and organizing them within an organized informational framework presents significant technical challenges. (See the WWW8 paper.)

Modeling the web as a graph. What is a good stochastic model for the web as a graph? An answer to this question would give us ways of predicting the growth and interconnection structure of the web, and allow us to tune efficient algorithms for the web. (See the VLDB 99 paper.)

Звучит совсем неплохо. Если это удастся воплотить в жизнь.

http://www.almaden.ibm.com/cs/k53/clever.html

kit
На сайте с 01.05.2001
Offline
190
kit
#2

Все-таки не свовсем понятно, что они задумали.

А в логах их полно в последнее время, это точно. И еще AskJeeves активизировался.

Master-X.com (http://www.master-x.com) - крупнейшее сообщество русскоязычных эдалт вебмастеров.
NW
На сайте с 10.07.2001
Offline
69
#3

Вот у меня статистика за послений месяц по "импортному" сайту:

IBM/Almaden 6475

Google 505

OpenFind 8

Yandex (RUSSIA) 7

Inktomi 5

Lycos 4

Altavista 1

Просканировала, похоже, весь сайт - да некоторые страницы ещё и по 2 раза. Приходит почти ежедневно. Если она так шустро будет и в будующем работать - то флаг ей в руки.

Однако думается мне, ibm вряд ли будет делать "собственеый" se, скорее просто лицензировать технологий и индексы для 3rd parties. Но новой поисковке с хорошим и шустрым роботом я был бы рад

p.s. Подбор литературы вроде бы неплохой. Притом, судя потому что много .ps - литература научного характера. У нас ряд товарищей думаю займутся reverse engeneering

Maxim A. Ralnikovhttp://ralnikov.com
Avatar
На сайте с 18.05.2003
Offline
168
#4

Вот и ко мне это чудо наконец то заглянуло, но взяло только индекс (пока ?)

InSAn
На сайте с 13.01.2003
Offline
60
#5

Ко мне "это чудо" еще год назад заглядывало...

ADPRO - Мы знаем, что Вам нужно! (http://adpro.ua)
C
На сайте с 19.09.2001
Offline
120
#6
Ко мне "это чудо" еще год назад заглядывало...

А тему подняли двухлетнюю...

С уважением, Владимир Чернышов. (не)?путевые заметки (http://chernyshov.kiev.ua/)
InSAn
На сайте с 13.01.2003
Offline
60
#7
А тему подняли двухлетнюю

Блин! На дату не посмотрел :)

Avatar, зачем поднял-то?

Avatar
На сайте с 18.05.2003
Offline
168
#8

Да я собственно на дату тоже не смотрел, нашел поиском по форуму...

Видать какую нибудь ссылку на меня нашел этот бот.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий