Персональный поиск от Ашмановых

1 2345 6
Ashmanov
На сайте с 21.11.2000
Offline
66
#21
Zute:
Эти проценты от общего числа сайтов.

Значит, я тут отстал от жизни. А дайте ссылку, откуда статистика?

С уважением, Игорь Ашманов Все для оптимизации (рассылка, сервисы): www.optimization.ru (www.optimization.ru) Сервис по созданию собственных поисковиков: www.flexum.ru (www.flexum.ru)
Z
На сайте с 03.01.2004
Offline
32
#22
Ashmanov:
А дайте ссылку, откуда статистика?

Это выборка из моей базы, никакой другой ссылки нет...

B
На сайте с 02.09.2002
Offline
42
bvd
#23
Ashmanov:
А вот зачем:
в) создание тематических поисковиков для всех. По области, которую вы лично хорошо знаете. Скажем, по медицине или фитнесу.
Сейчас вы не можете этого сделать легко и без усилий - у вас нет технологии, и даже если взять открытый поиск типа многопоиска, то нужно нанимать программистов для наладки и поддержки и т.п. А тут вы просто подписываетесь на услугу, а поисковик хостится у нас, и следит за ним наша служба подержки.

это сказки какие-то - так, конечно, можно порубать вершки,

но ничего качественного "для всех" сделать пока нельзя...

главное будет успеть через полгода запустить еще более глобальный проект

Ashmanov
На сайте с 21.11.2000
Offline
66
#24
bvd:
это сказки какие-то - так, конечно, можно порубать вершки, но ничего качественного "для всех" сделать пока нельзя...
главное будет успеть через полгода запустить еще более глобальный проект

Борис, а почему сказки-то?

К нам постоянно обращаются, чтобы сделать специальный поисковик по теме, в которой партнёр хорошо разбирается. Например, медицина. При этом мы сами не разбираемся в медицине, и не можем заняться этим профессионально. Но у нас есть поисковик. А партнёр, наоборот, знает, какие категории информации есть, какие сайты нужно индексировать, что показывать и какую рекламу продавать, но у него нет своего поисковика и нет программистов/денег/времени на разработку поисковика.

Вот мы и сделали поисковую платформу, теперь можем дать ему инструмент.

Чем не нравится, почему сказки?

Да, и насчёт "качественного". А что это такое? Вот поиск по новостям Новотеки - чем не устраивает, что в нём такого уж некачественного?

Мне кажется, в специализированных поисковиках сам поисковик может быть обычным, а фишка в отборе и структурировании данных.

B
На сайте с 02.09.2002
Offline
42
bvd
#25
Ashmanov:
Борис, а почему сказки-то?
К нам постоянно обращаются, чтобы сделать специальный поисковик по теме, в которой партнёр хорошо разбирается. Например, медицина. При этом мы сами не разбираемся в медицине, и не можем заняться этим профессионально. Но у нас есть поисковик. А партнёр, наоборот, знает, какие категории информации есть, какие сайты нужно индексировать, что показывать и какую рекламу продавать, но у него нет своего поисковика и нет программистов/денег/времени на разработку поисковика.
Вот мы и сделали поисковую платформу, теперь можем дать ему инструмент.
...
Да, и насчёт "качественного". А что это такое? Вот поиск по новостям Новотеки - чем не устраивает, что в нём такого уж некачественного?
Мне кажется, в специализированных поисковиках сам поисковик может быть обычным, а фишка в отборе и структурировании данных.

почти со всем согласен - потребность есть, люди приходят и просят специализированный поиск (даже не поиск но нечто большее, но удобно поставлять решение на поисковике) - это так

Я прицепился к словам "ДЛЯ ВСЕХ"

"качественный" по моему разумению, это когда люди готовы вкладывать деньги не за "развлекаловку-игрушку", но за то, что они будут использовать в своей работе/бизнесе

Давайте рассмотрим гипотетическое применение движка "Новотеки" к упомянутой задаче:

1) не сомневаюсь, что ВСЕМ ИЗВЕСТНЫЕ сведения будут выбираться на раз - и этого-то как раз хватит на полгода промоушена

2) но заказчик ТЕМАТИЧЕСКОГО поиска и так ЗНАЕТ все эти известные сведения

3) заказчику нужны подробности - только за это будет платить - это, по крайней мере, необходимость лезть шире - не только по определенному заранее списку сайтов, необходимость залазить в смежные тематики - уходить в историю и т.п.

наверное, я чего не знаю - может открыты некие чудодейственные методы в Thematic/Topical Crawling - такого рода задачи решаются для конкретных (в том числе и достаточно широких) предметных областей - НО! не менее чем полгода на одну (в качестве примера такой области - Антиспам)...

IMHO - может как-то поаккуратнее с позиционированием...

Z
На сайте с 03.01.2004
Offline
32
#26
Ashmanov:

Чем не нравится, почему сказки?

Пример с медициной явно неудачный, - там отдельный язык для каждого языка :) В TREC даже отдельная дорожка для био-медицинской тематики проводится, т.к. юзаются отдельные антологии, нежели для обычного английского... Не говоря уже, что в медицине главное не сайты, а базы, в первую голову рефератов публикаций, уже аннотированых, и для которых уже существуют специализированные поисковики, над улучшением которых корпеет не один универ. Вам их не перплюнуть :)

yourich
На сайте с 21.06.2003
Offline
38
#27

Можно ли конретные вопросы по тестированию задавать в этом топике ? Чтобы не дублировать часто спрашиваемые.

Какое имя, применительно к robots.txt, у поискового робота проекта personal.novoteka.ru ?

Точки входа - URL страницы должен начинаться с префикса http:// ?

Маски - в каком формате их давать ( как для robots.txt или полное имя домена + начало пути маски) ?

Пожелание: сделайте подсказку при заполнении полей.

Есть ли форум, или что-то еще, где можно задать вопросы и посмотреть ответы на вопросы других пользователей, чтобы не спрашивать одно и тоже ?

PS: продублировал эти вопросы на странице "обратная связь" но при нажатии на "Отправить" - страница перегрузилась и снова был показан текст моего вопроса. Неясно - отправилось ли письмо в службу поддержки.

С
На сайте с 31.10.2005
Offline
10
#28
Ashmanov:
Сергей, Вы совершенно правы. Хочу только заметить, что Вы пишете это на форуме, который посвящён исключительно выкачиванию чужих сайтов для показа посторонним людям. Здесь вообще ни о чём другом не разговаривают.
Конечно, выкачка сайтов с целью показывать их всем, кому угодно, возмутительна и бесчестна. Я советую Вам для начала забанить на своём сайте следющие адреса:
66.249.65.***
213.180.206.***
81.176.76.***
Подлые хозяева этих IP выкачивают сайты не по-детски - десятками тысяч страниц и показывают их потом кому угодно, в том числе Вашим конкурентам.

Я вот всё сижу и думаю: может мне в суд подать на владельцев этих адресов? Я же не давал им письменное разрешение на копирование моей информации. Заметьте, закон требует не запрет (robots.txt), а разрешение ;) Что Вы мне посоветуете?

[Удален]
#29

Я, конечно, не Ашманов, но посоветовал бы убить себя с разбегу :)

С
На сайте с 31.10.2005
Offline
10
#30
Miha Kuzmin (KMY):
Я, конечно, не Ашманов, но посоветовал бы убить себя с разбегу :)

Думаете, что боты-ядексоиды начнут охоту на закатывание в асфальт?

1 2345 6

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий