Будущее поиска или фантазии (продолжение)

_wind_
На сайте с 24.07.2006
Offline
110
650

Продолжение вот этой темы.

Провожу эксперименты по выделению осмысленной информации о товарах и услугах из чистого HTML.

Хотелось бы узнать мнение сообщества (удобно/неудобно, полезно/бесполезно и т.п.) относительно получающихся результатов.

Изначально планировалось создание поисковика, одна из версий которого уже сейчас работает в Интернете.

Однако, существенно более интересным может оказаться создание мета поисковика по товарам и услугам.

Одним из наиболее важных преимуществ является актуальность выдаваемой информации.

Предполагаемая архитектура:

1. Пользователь вводит два запроса.

a) Обобщенное название (что он хочет найти, например "пицца")

б) Какая именно это пицца (например "Маргарита")

2. По запросу из п. a) мы делаем запрос к поисковой системе и получаем, например, 100 сайтов - результатов поиска. Запрос делается через браузер клиента и список сайтов отсылается на наш сервер (например, через ajax). Мы же не хотим получить бан от поисковой системы. :)

3. На получившийся список сайтов пускаем бота, который анализирует сайт и выдергивает предложения с товарами/услугами. Среди всех найденных объявлений отбираем те, которые релевантны запросу б) из п. 1. и показываем пользователю. На каждый запрос придется анализировать примерно 1000-10000 страниц. Это можно сделать менее чем за 5-10 сек.

Дабы не быть голословным, показываю пример работы для запроса пицца

Вход: пицца

Выход: пицца , пицца Маргарита

В заключение, три вопроса:

1) Стоит ли создавать такого рода сервис и будет ли от него польза?

2) Готов ли кто-нибудь вложить свои средства/знания/умения за долю в проекте.

3) Может уже существуют аналоги?

Сдать/снять квартиру без посредников (http://to-rent.ru), Доход для вебмастера (http://www.sape.ru/r.1cc08e9f90.php), Продам WMZ/WMR за телебанк с доплатой 1%
Навигатор
На сайте с 15.07.2006
Offline
156
#1

Можно я вам список всех своих сайтов сразу скину, чтоб вы их исключили из своего поисковика.

Ибо не хочу чтоб ваш бот шарился по моему сайту со скоростью 100 страниц в секунду.

По делу - кажется Вы озабочены товарами и услугами. У Яндекса с коммерческой выдачей все ОК. У него проблемы со справочной выдачей.

Шерегеш (http://gesh.info/) - зимний горнолыжный курорт
Сам пришел
На сайте с 05.05.2007
Offline
174
#2

Будущее поиска должно выглядеть так:

Сидишь ты, стал быть, за компом... Тут в голову приходит мысль: "Пива бы!"

Хрясь! На мониторе видеоряд бутылок, рядом с каждой - цена с доставкой.

Тока моск подумал "О! Это хочу, пару бутылок.", а в дверь уже звонок "Заказ примите." Вот это поиск! Вот это я понимаю! ;)

Навигатор
На сайте с 15.07.2006
Offline
156
#3
Сам пришел:
Будущее поиска должно выглядеть так:
Сидишь ты, стал быть, за компом... Тут в голову приходит мысль: "Пива бы!"
Хрясь! На мониторе видеоряд бутылок, рядом с каждой - цена с доставкой.
Тока моск подумал "О! Это хочу, пару бутелок.", а в дверь уже звонок "Заказ примите." Вот это поиск! Вот это я понимаю! ;)

Блондинок будет жалко.

[Удален]
#4
Сам пришел:
Будущее поиска должно выглядеть так:
Сидишь ты, стал быть, за компом... Тут в голову приходит мысль: "Пива бы!"
Хрясь! На мониторе видеоряд бутылок, рядом с каждой - цена с доставкой.
Тока моск подумал "О! Это хочу, пару бутылок.", а в дверь уже звонок "Заказ примите." Вот это поиск! Вот это я понимаю! ;)

для проектировщиков и разботчиков давно стало золотой фраза - добавления просле прочтения ТЗ

- "Ага, и чтоб за пивом сама бегала"

2Навигатор

оценил - с пустым запросом:) интересно какова статистика сейс по нему бы была в вордстате или другом поисковике, если бы велась? а может ведется? щас проверю:)

Фома
На сайте с 10.11.2006
Offline
600
#5

набрал "ремонт телевизора" выдача у вас релевантней некуда..

Аренда апартаментов на Тенерифе (http://las-americas.ru/).
_wind_
На сайте с 24.07.2006
Offline
110
#6
Фома:
набрал "ремонт телевизора" выдача у вас релевантней некуда..

И чем не устроила выдача? Нашли товары (книги) по "ремонту телевизоров".

База не полна и услуг по ремонту телевизоров Вы не нашли.

Хотя сейчас речь не о нем.

Стоит ли делать мета поисковик, вот в чем вопрос.

_wind_
На сайте с 24.07.2006
Offline
110
#7

UPD: на тестовом сервере теперь другие данные.

Вход: холодильник

Выход: холодильник

Робот взял выдачу гугла и прошелся по всем страницам (главная + второго уровня) и собрал товары.

Человек или xml для получения выдачи не применялись.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий