Может ли на Украине появиться свой Яндекс?

12
VT
На сайте с 27.01.2001
Offline
130
1029

Здравствуйте!

Меня заинтересовал этот форум и вот почему. Я являюсь автором украинской поисковой системы "Highway". В настоящий момент она находится в стадии разработки, но уже умеет многое. Например, неплохо искать по фразам с учетом морфологии русского и английского языков. Запросы здесь максимально сведены к естественному языку. Вы так и ищите: "поисковые системы на Украине", например. Я был бы очень рад получить отзывы о моей системе, тестовую версию котором можно найти на http://www.ukrtel.com/~christie

F
На сайте с 15.11.2000
Offline
116
#1

<font face="Verdana" size="2">Originally posted by Vyacheslav Tikhonov:
Вы так и ищите: "поисковые системы на Украине", например. Я был бы очень рад получить отзывы о моей системе</font>

...ищите "поисковые системы" и находите "Спутниковые системы" (см. нижнюю ссылку). Ищем "биография Кучмы", а находим "Александр Градский", "David Coulthard" (вторая и третья ссылки) и т.д. Лишние ссылки -- это также плохо, как и малое количество ссылок.

В описании системы сказано: "На сегодняшний день система имеет относительно ограниченное количество ресурсов и пока доступен лишь поиск по каталогам".

Нетрудно заметить, что индексация реальных страниц и поиск по такой базе значительно отличается от поиска по каталогу. И принципами определения релевантности, и методами противодействия спаму и пр. Так что систему нельзя оценить, пока не будет реализована индексация ресурсов.

Еще цитата: "были учтены особенности поиска по целым фразам а также по релевантности, что, по моему мнению, отсутствует у многих известных поисковых машин".

Интересно, как, по-вашему, можно реализовать мало-мальски полезный поиск без учета релевантности страниц?

Что касается поиска по фразам, Яндекс выполняет его отлично, да и Апорт с Рамблером справляются неплохо. Чем больше уточнений, тем легче системе понять пользователя. Если вы под словом "фразы" имели в виду цитаты, то в Яндексе можно даже задать цитату "в точности", с учетом предлогов, порядка слов и используемых словоформ.

С уважением,

Александр Садовский.

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#2

Хм, с третьей попытки добрался до системы.

Малый объем базы - смерть для поисковика.

Кроме того, я не понял, что индексируется. И индексируется ли вообще, т.к. это больше похоже на поиск по каталогу, с заданным описанием.

Как добавлять ссылки в каталог?

Тебе реально необходимо сделать спайдер, который набьет тебе базу информацией. Только делается это все, все-таки, не на таком хостинге и не с такими средствами. Нужен хороший канал, большой сервер и т.д.

VT
На сайте с 27.01.2001
Offline
130
#3

Система, которую я попросил Вас потестировать, всего лишь тестовая версия поисковика, который я сделал за полтора месяц, используя вечернее и ночное время после занятий в Институте. Вся система обошлась на сегодняшний день в стоимость услуг провайдера (а это примерно 10 долларов в месяц ). Отсюда и размещение на домашней страничке, очень ограниченный объем (5 Мбайт) и медленный поиск. А оценить я просил в основном работу поискового механизма. Естественно, я понимаю, что без нормального домена и хостинга ни о какой поисковой системе быть и речи не может. Что касается роботов, то есть спайдеров, то они у меня есть (уж не думаете ли Вы, что я вручную собирал 6 тысяч ссылок ). Да и самих ссылок у меня во много раз больше, но ограниченный хостинг просто не позволяет поместить их в базу. Насчет индексации: я индексировал тэги meta content, притом немного, так как если бы я пустил такого робота, как у Яндекса, то пользователи моего провайдера надолго лишились бы интернета. Ссылки же добавлять нельзя из-за отсутствия лишнего места на хостинге.

Тем не менее, спасибо за Ваши замечания.

С уважением, Вячеслав

D
На сайте с 14.01.2001
Offline
28
#4

Нормально все, наверно заработает ) Может и не как яндекс, даже наверняка, но что-то будет.. По крайней мере для студента тут немалая работа. И чего я в школе плохо учился!!??

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#5

Слава, настоящая учеба требует денег. Вложите порядка 50-60 долларов в свой хостинг и домен, и Вам будет, что показать людям. На эту сумму Вы сможете купить порядка 200-300 метров места со всеми возможностями и домен. Я думаю, что, если Ваша система действительно хороша, то через несколько месяцев ее реально сделать одной из ведущих в Укрнете.

Рискните.

VT
На сайте с 27.01.2001
Offline
130
#6

Вот и кончилась моя эпопея В конце концов моя поисковая система оказалась у Пинга (www.topping.com.ua). Так что милости просим потестировать!

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#7

Это Crawler? Ну, что ж, посмотрим, что из этого выйдет. Подскажите только, Вячеслав, он по ссылкам проходит? И какая у вас база?

VT
На сайте с 27.01.2001
Offline
130
#8

<font face="Verdana" size="2">Originally posted by Gray:
Это Crawler? Ну, что ж, посмотрим, что из этого выйдет. Подскажите только, Вячеслав, он по ссылкам проходит? И какая у вас база?</font>

Давно не заходил на форум, потому что работы невпроворот - поиск Пинга пока хромает на обе ноги.

По ссылкам САМ у меня он еще не ходит, хотя я к этому уже близок. База пока совершенно небольшая (около 25 тысяч ссылок). При ее индексации получилось что-то около 60 тысяч уникальных слов, из которых я с помощью флективного анализа выделил основы. Плохо то, что сервер нормально не справляется даже с такой ничтожно малой нагрузкой, поэтому сейчас изучаю подобные алгоритмы в нэковской научной библиотеке:

http://citeseer.nj.nec.com/directory.html

Релевантность пока определяю исключительно по количеству ключевых слов в описаниях, что дает в результах поиска много спама.

В mysql, который я сейчас использую, плохо реализована локализация, поэтому некоторые запросы иногда дают совершенно неожиданные результаты даже для меня

В общем, в настоящий момент пытаюсь героически бороться с невесть откуда возникающими проблемами

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#9

Вячеслав, без индексации самого текста страницы у вас ничего не выйдет, я думаю, вы это понимаете.

Неужто ПИНГ не может обеспечить устойчивость сервера с такой малой базой? Как я понимаю, это означает, что у них все висит на одной машине, и только невостребованность остальных сервисов обеспечивает "нормальную" работу рейтинга. Или и обе баннерные сети висят на той же машине? Тогда хана дело, поисковик не получится. Как я понимаю, для него одного минимум машина нужна отдельная.

VT
На сайте с 27.01.2001
Offline
130
#10

<font face="Verdana" size="2">Originally posted by Gray:
Вячеслав, без индексации самого текста страницы у вас ничего не выйдет, я думаю, вы это понимаете.
Неужто ПИНГ не может обеспечить устойчивость сервера с такой малой базой? Как я понимаю, это означает, что у них все висит на одной машине, и только невостребованность остальных сервисов обеспечивает "нормальную" работу рейтинга. Или и обе баннерные сети висят на той же машине? Тогда хана дело, поисковик не получится. Как я понимаю, для него одного минимум машина нужна отдельная.
</font>

Действительно, все пока находится на одной машине, что создает дополнительные трудности. Хотя я думаю, что сервер полнотекстовый индекс на 25 тысяч ссылок вполне может потянуть. Индексацию страниц я фактически уже закончил и скоро пущу. Все-таки, есть надежда, что на 1000 хостов в день хватит. Посмотрим, что получится

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий