Хочу свой маааленький "яндекс"! :)

1 234
A
На сайте с 25.10.2005
Offline
58
#21
alex_s:
Яндекс, как я понял, не позволяет проводить поиск в рамках определенных мной сайтов.

Позволяет, активно юзаем.

alex_s:

Да и за запросы надо платить. Да и на выдачу не повлиять. Короче, такой мне не нужен. Или я там что-то не понял?

http://help.yandex.ru/xml/price.xml

Вы можете получить доступ к сервису Яндекс.XML совершенно бесплатно и даже заработать, разместив в результатах поиска рекламные блоки Яндекс.Директ и Яндекс.Маркет. Для этого необходимо, чтобы ваш сайт стал членом Рекламной сети Яндекса (при условии заключения договора с Яндексом).
Segey
На сайте с 23.08.2005
Offline
404
#22
alex_s:
Да.. Честно говоря, не думал, что для организации поиска на нескольких сотнях сайтов, нужны такие затраты

Для этого нужно поставить готовые сервисы, а влиять на выдачу... зачем?

Brexit - уже совсем рядом. (https://about-this-model.blogspot.com/2019/03/brexit.html)
alex_s
На сайте с 01.10.2003
Offline
132
#23

Буду изучать ааопрос дальше. Спасибо.

Если у кого-то есть конкретные предложения - буду рад выслушать.

ЗЫ Естественно, за поиск на 200-500 сайтах, 5000 зелени выложить не готов.

Y
На сайте с 02.01.2006
Offline
138
#24
alex_s:
ЗЫ Естественно, за поиск на 200-500 сайтах, 5000 зелени выложить не готов.

а зря! :) хороший поиск дает много интересных преимуществ, ну и денег в конце-то концов тоже дает :).

Свою ситуацию расскажу:

1. Сам поиск (ядро) мне написали за ~1К, но я изначально дал базовые библиотеки, в принципе ничего особо сложного там нет, на сравнительно небольшом количестве страниц в индексе с поиском справляется движок на РНР, который работает с БД на MySQL. Учет морфологии достигается за счет словарей и библиотеки по работе с ними, а также за счет реализации запросной части, которая расчитана на поиск, когда в словаре нет нужных слов.

Паук написать несложно (+300 у.е.).

Очень неплохо будет снабдить сайты своим счетчиком для корректировки результатов поиска запросами во внешних поисковиках по такому же принципу, по которому работает ЛИ.ру (+300 у.е. за счетчик, +200 за докручивание базового фукицонала поиска с учетом этого фактора).

Под существующий специализированный поиск у меня написан несложный препроцессор, т.е. аналог колдунщика. Когда он видит знакомые слова, он их выдирает из поискового запроса и превращает в условия внутри запроса к базе. (+150 у.е.) Говорю сразу, препроцессор -- ОЧЕНЬ нужная штука, проектировать препроцессор надо в самом начале и внедрять его в поиск тоже в самой первой версии движка. Про то, как работает препроцессор ЖЕЛАТЕЛЬНО рассказывать в ясной непринужденной форме своим пользователям ;) это очень поможет им находить то, что им на самом деле надо.

2. Т.е. в принципе достаточно дешевое решение вроде бы есть, но дальше возникают проблемы:

- отстрел дубликатов. На большой базе количество повторов информации будет заметным на результатах поиска, особенно, если где-то в индекс попадаются доски объявлений;

- фильтрация навигационного текста и шаблонного текста (меню, хидеры, футеры). С учетом того, что шаблонов на сайте может быть несколько, то получаем дополнительные проблемы;

- периодическое обновление индекса (полное или частичное), все это с учетом появления новых страниц, старения существующего материала и т.д. Фактор новизны контента должен влиять на выдачу;

- добавление сложных факторов релевантности усложнит поиск, причем процесс усложения, как я догадываюсь, будет нелинейным;

- поиск внешних точек входа на сайт (не у всех навигация устроена таким образом, чтобы с морды все страницы найти);

Другие возможные проблемы:

- зеркала (часть задачи решится при реализации отстрела дублей);

- реализация обработки robots.txt (это не проблема, но просто не самый нужный и не самый дешевый для самого поиска кусок кода, который все равно придется написать).

3. Дальше еще интересней получается... на больших объемах неплохо было бы иметь кеш частотных запросов, а значит нужно периодически делать апдейты этого кеша ;)

Я сейчас нахожусь на этапе №2, разрабатываю принципы отстрела дублей. Сколько денег потянет реализация я даже не догадываюсь, но, думаю, что весь второй этап потянет еще на 1-1.5К.

Напоследок оговорюсь:

ни сайты, ни библиотеки показывать (предоставлять/продавать) не буду, извините.

fireone
На сайте с 07.07.2006
Offline
127
#25
alex_s:
ЗЫ Естественно, за поиск на 200-500 сайтах, 5000 зелени выложить не готов.

Очень абстрактно сформулирована задача и непонятно сколько выложить готовы ;)

Повторюсь в подобных вопросах, чтобы не переплачивать нужно начинать с написания детального ТЗ.

Нужны люди: пом-ик оптимизатора () и оптимизатор () Вливайтесь в сильнейшую команду страны ;) 89057335033, Александр Шокуров;
BB
На сайте с 15.03.2007
Offline
19
#26

BackLinkBot Links Exchange - есть встроенный поиск фраз по всем поисковикам. Например, на запрос "каталог ссылок" находит до 1500 ссылок с процентом совпадения по теме (т.е. действительно каталогов ссылок а не что-либо еще) порядка 75%. Базовая версия $20.

Вроде пью, а мне все хуже и хуже.
Segey
На сайте с 23.08.2005
Offline
404
#27
Yukko:
Паук написать несложно (+300 у.е.).

А за какие уе, потом заниматься его отладкой и развитием, как кстати и остальных моментов? Тут на выдачу хотят влиять, не за дорого :)

fleyg
На сайте с 21.09.2005
Offline
143
#28

Yukko, Просветите пожалуйста про количество чепловке в команде разработчиков.

SamCram
На сайте с 16.08.2006
Offline
163
#29

Может поможет:

http://nigma.ru/index_menu.php?action=click_menu&menu_element=description - тут литература

ну и вообще nigma.ru

R
На сайте с 26.03.2007
Offline
20
#30

Это поиск, тот который Вам нужен, сейчас висит демо версия, но при подключении морфологии и небольшой доработки под Ваши требования, будет полностью рабочая система именно та которая вам требуется.

Данный движек используется, как отраслевая поисковая система + отраслевой каталог ссылок.

В том виде, что сейчас 600 долларов.

Используется PHP, MySQL

кеширование страниц, дубликаты не индексируются

Статистика по запросам.

Сайт включенный в каталог ссылок, не обязательно индексируется и наоборот, проиндексированный сайт, можно не включать в каталог ссылок

Возможность индексации каждого сайта по заданным параметрам. Полная индексация, индексация только обновлений, индексация только заданных страниц и разделов по каждому сайту. Период индексации задает админ для каждого сайта.

Возможность настройки выдачи, результатов поиска, по заданному алгоритму.

подключение морфологии и необходимые дополнения 500 долларов, модуль типа яндекс маркет или яндекс директ + 300 долларов, дизайн от 250 долларов.

Итого 1400 долларов - под ключ без дизайна, 1650 долларов под ключ с дизайном.

http://www.d06.ru

система управления контентом CMS БКcms http://www.bkcms.ru (http://www.bkcms.ru) (495) 796-80-66
1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий