Cоздание городского поисковика

12
S
На сайте с 29.01.2006
Offline
404
#11

Scheglov,

А что, на Ваш взгляд, могло бы быть полезно для обычных людей?

С полезностью всё нормально. Выдача выглядит так, что у любой тёти Маши крыша съедет.

Кстати, у меня в момент написания ответа сайт вообще не искал.

Вы пишите, что индексируете 2000 сайтов, но у меня создалось впечатление (в прошлый раз), что он ищет только по объявлениям.

Может, у него какие-то функции периодически отваливаются?

tk1308
На сайте с 27.11.2010
Offline
37
#12
S
На сайте с 13.01.2012
Offline
0
#13

По поводу выдачи результатов, кривизны поиска и т.п. Уважаемые! Весь этот поисковик в основном делается двумя системными программистами, с каким-то там, более, чем 15-летним опытом, но мы никогда раньше не делали веб-проектов. Потому и веб-морда - кривая. Кроме того, http://sevpoisk.com мы постоянно ковыряем "на живую", что-то исправляем, что-то ломаем. От бедности ;-), конечно: нет возможности соорудить адекватный отладочный сервер.

Не судите строго то, что Вы видите по реальному поиску на http://sevpoisk.com, Уважаемые.

Мы делаем этот проект уже полтора года, этого времени уже жалко, потому до ума мы его доведём - ну точно.

И, вот поверьте, нам хотелось бы не пиариться здесь, а обсуждать, просить совета, быть может - кому-то чем-то и помочь...

А поиск по инету (по сайтам) сейчас не работает (и ещё день-два не будет работать), так как мы полностью перестраиваем индексы.

---------- Добавлено в 15:43 ---------- Предыдущее сообщение было в 15:35 ----------

Sterh:
И вот рекомендую: Введение в информационный поиск - оч много полезного можете для себя найти.

Большое спасибо. Изучаю.

Нямкин
На сайте с 02.12.2010
Offline
65
#14

Молодцы, чо. Как показала практика, распарсить всякие ГСы с объявами и выдать адекватно человеку - это есть хороший, интересный путь. Примером на равнение можно взять jooble. Главное, не бросить на полпути.

cscope
На сайте с 13.02.2005
Offline
525
#15

Scheglov, вы считаете, что такой проект в дальнейшем может приносить прибыль?

P.S. поменяйте местами копирайт и ссылки на страницы выдачи.

Sterh
На сайте с 15.06.2006
Offline
226
#16

Судя по "таксы" вместо "такси" стемминг используете? А морфологию прикрутить не пробовали?

Вот тут есть демки и скачать кое-что можно: http://www.aot.ru/onlinedemo.html

Программа для настройки внутренней перелинковки сайта: купить (http://www.page-weight.ru/) Проверка внешних ссылок на сайт (https://backlink.page-weight.ru) (когда Ахрефс дорого) Возьму на продвижение пару магазинов, & SEO консультации (/ru/forum/987866) для сложных случаев.
S
На сайте с 29.01.2006
Offline
404
#17

Scheglov, Вы не обижайтесь. Просто я регулярно сталкиваюсь с плодами трудов программистов, которые всё сделали, наверное, хорошо, но не подумали о том, что их продуктом будут пользоваться 60-летние тётки, боящиеся компьютера; люди с плохим зрением и персонажи второго сорта, которые с первого раза не могут догадаться, как пользоваться теми функциями, которые программист вылизывал несколько лет и знает их, как облупленных.

Appassionato
На сайте с 22.06.2010
Offline
289
#18

Пользовательский поиск Гугла религия не позволяет использовать?

ЗЫ: здесь за клоноводство банят всерьез и надолго.

Хостинг Работает, как Часы ( http://tinyurl.com/nze85xw ). Проверено за 11+ лет.
S
На сайте с 13.01.2012
Offline
0
#19
cscope:
Scheglov, вы считаете, что такой проект в дальнейшем может приносить прибыль?
P.S. поменяйте местами копирайт и ссылки на страницы выдачи.

Мы плохо, ой, плохо разбираемся в интернет-бизнесе. Но считаем, что в дальнейшем такой проект действительно сможет приносить прибыль.

Про копирайт и ссылки выдачи - это шутка? ;-)

---------- Добавлено в 12:14 ---------- Предыдущее сообщение было в 12:03 ----------

Sterh:
Судя по "таксы" вместо "такси" стемминг используете? А морфологию прикрутить не пробовали?
Вот тут есть демки и скачать кое-что можно: http://www.aot.ru/onlinedemo.html

Про "таксы" и "такси" - это у нас с ранжированием результатов имеются некоторые проблемы. Порешаем. Да, используем стемминг и морфологию, и нормализацию, и fuzzy. Всё сделали сами. AOT смотрели, показалось, что сможем сделать лучше. Просто посмотрели на словари, оценили производительность - не понравилось. На сегодня, к примеру, мы нормализуем килобайт текста за сотые доли секунды. А "таксы" получилось из-за функции fuzzy - исправления опечаток и орфографических ошибок.

---------- Добавлено в 12:24 ---------- Предыдущее сообщение было в 12:14 ----------

Appassionato:
Пользовательский поиск Гугла религия не позволяет использовать?
ЗЫ: здесь за клоноводство банят всерьез и надолго.

Пользовательский поиск Гугла не даёт желаемых результатов. К примеру, мы индексируем активные форумы и доски объявлений несколько раз в сутки (да хоть бы и раз в час, и чаще) - Гугл этого не делает. Мы парсим доски объявлений - Гугл этого не делает. Мы имеем возможность управлять выдачей результатов - Гугл нам этого не даёт.

Наконец, мы имеем возможность проделывать всякие аналитические штуки с накопленными данными - иначе вместо нас это делает Гугл.

Да и просто интересно было написать поисковую машину. Уж, уверяю, полученный опыт точно пригодится в будущем. Да хоть бы и та же морфология...

По поводу клоноводства: этот топик создавал наш коллега. Ввиду того, что обсуждаемые здесь вопросы по ряду причин оказались более интересны мне, чем ему, далее вместо него с Вами общаюсь я.

Спасибо.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий