Как работает нигма, пунто и пр.

R
На сайте с 06.07.2006
Offline
62
2545

Интересует вопрос, как работают такие поисковики, которые используют поисковую выдачу с других поисковиков? Ведь у них собственной базы

Как забирают результаты и выводят их на страницу?

Очень интересно, хочу попробовать поэксперементировать с созданием подобного поисковика, если его так можно назвать.

А точнее хочу, чтобы поисковик использовал результаты не из поисковых систем,а с результатов поиска по определенных сайтов, поэтому очень интересует этот вопрос.

Update: Долго думал, где создать тему, создал тут, но нашел раздел "поисковые технологии". Модераторы, если не сложно перенесите его туда... если тема будет там, то наверное это правильнее будет.

Stimmi
На сайте с 09.12.2007
Offline
164
#1

XML

А поисковик, который рыщет по определенным сайтам (пользователь сам набивает базу), предоставляется Google.

Пример - http://codavr.ru/

R
На сайте с 06.07.2006
Offline
62
#2

Но XML есть только у яндекса.

Данные с яндекса, еще можно вывести, но как быть с другими поисковиками?

Даже если данные представляются Google и Яндексом, то как быть с другими поисковиками?

Вон нигма ищет по этим поисковикам:

Google Yahoo Msn Yandex Rambler Altavista Aport Nigma

F
На сайте с 27.03.2007
Offline
85
#3
Rinat:
Но XML есть только у яндекса.
Данные с яндекса, еще можно вывести, но как быть с другими поисковиками?
Даже если данные представляются Google и Яндексом, то как быть с другими поисковиками?
Вон нигма ищет по этим поисковикам:
Google Yahoo Msn Yandex Rambler Altavista Aport Nigma

А что, обычную выдачу того же рамблера распарсить - никак? С XML, безусловно, удобнее и эффективнее, но если некоторые ПС такого сервиса не предоставляют... (это, кстати, еще нужно проверить)

dex
На сайте с 14.04.2006
Offline
181
dex
#4
fervent:
А что, обычную выдачу того же рамблера распарсить - никак? С XML, безусловно, удобнее и эффективнее, но если некоторые ПС такого сервиса не предоставляют... (это, кстати, еще нужно проверить)

не предоставляют (открыто, покрайней мере) - сам давно разбираюсь

парсить - не очень хорошо, думаю нигма как-то официально получает, но как?

губит людей вода (подпись не продаю, в долг не даю)
T
На сайте с 15.04.2003
Offline
36
#5

У меня похожий вопрос, но он касается количетва разрешенных запросов например к гуглу с одного Ай Пи. Оно вроде ограничено 1000-ю запросов в сутки.. Как быть?

JackDAripper
На сайте с 24.02.2007
Offline
43
#6

У нигмы есть своя база, но очень не большая

А вообще она в основном юзают базу гугль, а все остальные пс там в основном выполняют функцию ранжирования

Слава Шевцов
На сайте с 23.07.2005
Offline
370
#7
trink:
У меня похожий вопрос, но он касается количетва разрешенных запросов например к гуглу с одного Ай Пи. Оно вроде ограничено 1000-ю запросов в сутки.. Как быть?

Написать в Гугл? Дело в том, что там есть и возможность коммерческого использования, но на поток оно не поставлено.

Неизменность точки зрения неизменно порождает иллюзию понимания.
П
На сайте с 30.06.2007
Offline
17
#8

у Яндекса, Яху и Гугла есть XML (у Гугла раньше было, даже ключи выдавали, щас там XML закрыт, вместо него на AJAX выдают, но с ним не удобно работать так как практически не возможно менять внешний вид выдачи по результатам запросов)

Вероятно затарились поисковики эти ключиками у Гугла, с Яндексом и Яху тут проблем вообще нет, ну а Раму на худой конец и попарсить можно.

Да пребудет с Вами Сила!
[Удален]
#9
писатель:
у Яндекса, Яху и Гугла есть XML (у Гугла раньше было, даже ключи выдавали, щас там XML закрыт, вместо него на AJAX выдают, но с ним не удобно работать так как практически не возможно менять внешний вид выдачи по результатам запросов)

Вероятно затарились поисковики эти ключиками у Гугла, с Яндексом и Яху тут проблем вообще нет, ну а Раму на худой конец и попарсить можно.

вероятно нигма успела подключиться к xml и теперь пользуется только для ВЧ?

по теме gogo дал xml без ограничений почти

что за неуважение к раме?:) вернее обоснованное неуважение☝

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий