Разработка поисковой машины.

12
Z
На сайте с 12.03.2007
Offline
16
4415
Добрый день.

На дипломный проект получил разработку поисковой машины.

Хотелось бы услышать какие то советы с Вашей стороны.

Интересно следующие моменты:

- индексация ( алгоритм индексации желательно выполнить по какой нить инновационной модели, например не брать реляционную БД) а приложить усилия, и описать какой нить более подходящий формат для индексации текстовой информации.

- ранжирование, помимо уже "стандартных" PR и (...)ИЦ, хотелось бы найти какое то инновационное решение, возможно теоритическое(научное, нереаллизованное)

- релевантность ( самое интересное ), алгоритмов сам еще не видел, было бы интересно узнать хотя бы в какую сторону смотреть.

ПО: Linux, gcc

За любые советы от разработчиков, ссылки, статьи буду очень признателен.

Заранее спасибо, Сергей.

Девизз... двигацца..!
P
На сайте с 12.03.2007
Offline
0
#1

Желаю не изобретать велосипед. Нужна иновационная фича!

Идеи навскидку:

1. Интерфейс: я не видел ни одной идеальной системы, в которой бы можно было переходить между попаданиями в оригинальном 100-мбайтном (после распознавания) PDF-файле, непосредственно в Acrobat на локальной машине. Через браузер можно, но загружая весь файл в кэш - это долго.

Вообщем производители ИПС обычно плохо интегрируют их с оригинальными форматами файлов.

2. Поиск в сообществе, т.е. давать знать людям о том кто ищет ту же самую информацию и предлагать новые результаты и контакты.

3. Защищённый поиск в распределённых системах.

4. Развитие алгоритмов, которые эффективнее работают в какой-то конкретной предметной области.

pelvis
На сайте с 01.09.2005
Offline
345
#2
zverywka:
За любые советы от разработчиков, ссылки, статьи буду очень признателен.

чтобы написать поисковик нужно обязательно иметь представление о клиентской части.... это я к тому, что поищите на форуме, этот вопрос в год раза 4 поднимается.

Продаю вывески. Задарма и задорого (https://www.ledsvetzavod.ru/)
M
На сайте с 15.03.2007
Offline
0
#3

zverywka! Как с тобой связаться???...

Я пишу курсовую на тему "Поисково-справочные системы", т. е. наши темы совподают! Если тебе не будет сложно помоги мне в её создании, я тоже буду тебе писать то, что узнал нового...

Мне не нужны инновационные модели, результатом моей работы должен стать самый обычный поисковик по сайту, список использованной литературы, преимущества одних языков программирования перед другими при создании подобного рода поисковых систем, исходные коды и парочка плакатов или презентация на компьютере для комиссии... Я думаю мы сможем быть друг другу полезны, мне интересна эта тема...

Я собираюсь писать поисковик на Perl, правильный я зделал выбор, как считаешь??!

iexpert
На сайте с 01.09.2005
Offline
184
#4

Так и познакомились Садовский с Сегаловичем.... :)

Сори за оффтоп.

Бойтесь ваших желаний, ибо они могут исполниться
Yaroslav_Adv
На сайте с 27.09.2005
Offline
199
#5

iexpert, 😂

С уважением, Ярослав Деревягин Веб-агентство "Found (http://found-it.ru)"
K
На сайте с 31.01.2001
Offline
737
#6
iexpert:
Так и познакомились Садовский с Сегаловичем

А также Брин и Пейдж ... :)

Правда потом они пошли к какому-то мужику, который им дал 100 штук баксов на раскрутку.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
MiRaj
На сайте с 03.07.2006
Offline
509
#7

zverywka, для начала прочитайте эти материалы

http://www.miralab.ru/tools/service/#theory

особенно последнюю ссылку.

Муркетолог. 100 пресс-релизов с прямыми ссылками за 150 баксов? Легко! (http://b2blogger.com) Статейный маркетинг - лучшее лекарство от Минусинска! (http://miralinks.ru)
Y
На сайте с 05.04.2007
Offline
0
#8
Kost:
А также Брин и Пейдж ... :)
Правда потом они пошли к какому-то мужику, который им дал 100 штук баксов на раскрутку.

А не маловато? ;)

Ma-)cTpo
На сайте с 27.02.2007
Offline
49
#9

Ребята! Мы на пороге новых инновационных идей в поисковых технологиях. zverywka, я бы на твоем месте разработал алгоритмы работы идеального поисковика, а не программу. Одному реально сделать или хороший алгоритм без программы, или плохую программу. Для диплома первое даже интереснее будет. Будешь на слайдах блок-схемы показывать ботанам с кафедры ;)

You have to do what you have to do
L
На сайте с 02.05.2004
Offline
35
#10

zverywka и остальные кто этим занимается -- пишите мне -- с большим интересом посмотрю на то что вы сделали и с большой вероятностью трудоустрою про профилю :)

leo собака softinform точка com

Работа с хорошей продвинутой команде думаю в перспективе для вас может оказаться интерсным предложением.

Leo www.searchinform.ru (www.searchinform.ru)
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий