Поиск от Google и Yandex - помогите разобраться.... плиз)

Umbert0
На сайте с 22.01.2009
Offline
81
831

Здравствуйте, помогите пожалуйста разобраться господа

Дело в том что скоро защита диплома, и надо уже начинать его))

Объяснь вкрадце сто должно быть:

Нужно научиться получать данные от Яндекс XML и от Google (XML - если есть, вроде должен быть)

убирать дубли и выводить это в одном документике, подскадите кто работал с Яндекс XML или Google XML литературу в помошь, или может примеры работ, если кто готов помочь реально готов оплатить (пусть не очень много но все же)

Может у кого то есть готовые наработки по этому поводу

поддержите студента, в результате все равно все выложу для форумчан! естественно в удобной форме с учетом специфики работы seo

Помогите пожалуйста...:)

zzeus
На сайте с 04.01.2008
Offline
74
#1

официальный хелп ИМХО очень доступен

Вообще такое пилить - пару часов на коленке (это с отладкой, ага)

[Удален]
#2

Umbert0, php.net/file_get_contents php.net/curl php.net/preg_match_all php.net/array_unique

остальное отладка :D

Umbert0
На сайте с 22.01.2009
Offline
81
#3

маленькие уточнения...

я к сожалению в английском не очень (не сочтите уж за наглость) но если есть возможность то на русском материалы нужны, но можно конечно попытаться и в это вникнуть

И сие чудо будет устанавливаться локально, так что php не очень подходит...

Пока склоняюсь к связке XML + XSLT + маленькое подобия сервера (который слушает локалхост)

Umbert0 добавил 20.04.2009 в 15:38

Расскажу в чем основная идея:

Имеется поле (что то вроде Google Desctop)

имеется легонький обработчик http запросов

юзер вбивает в поле строку, поле отправляет запрос на localhost:5050 к примеру

обработчик берет этот запрос, и отправляет в Ya XML и G XML/

соответственно получает ответы в виде XML файлов

обрабатывает из (удаляет дубли и сортирует ответы чтобы выводились ответы из обеиз ПС)

и выводит все в одном документе при помощи XSLT

(желательно еще как то оценивать чьи ответы устраивают пользователя больше, например считать переходы или возвраты к поиску)

LL
На сайте с 19.12.2008
Offline
39
#4
Umbert0:
маленькие уточнения...

я к сожалению в английском не очень (не сочтите уж за наглость) но если есть возможность то на русском материалы нужны, но можно конечно попытаться и в это вникнуть

И сие чудо будет устанавливаться локально, так что php не очень подходит...

Пока склоняюсь к связке XML + XSLT + маленькое подобия сервера (который слушает локалхост)

Что-то мне не понятно. Все равно ж сервер надо писать, ставить, зачем мудрить то. Ставите апач локально, то же самое все и получится, только гораздо проще.

Maxouni
На сайте с 18.11.2008
Offline
119
#5

http://code.google.com/p/yandex/downloads/list

Здесь лежит скрипт по работе с ЯндексXML, я несколько раз пользовался посмотри как сделан.

Создание, продвижение, поддержка сайтов и приложений.
Umbert0
На сайте с 22.01.2009
Offline
81
#6
lip lippov:
Что-то мне не понятно. Все равно ж сервер надо писать, ставить, зачем мудрить то. Ставите апач локально, то же самое все и получится, только гораздо проще.

нет не тоже, сервер который есть по сути банально слушает порт и ничего лишнего, к нему доработать отправку и прием xml и все будет готово

[Удален]
#7

php.net

Смотреть:

curl_multi, curl (только если стоит соответствующее расширение для кюрл'а) / file_get_contents (внимание! только с PHP5), если PHP 4, то fopen

читаете целиком файлы, отдаваемые Яндексом и Гуглом и парсите при помощи

SimpleXML или DOMDocument

А вообще, ппц, товарищи, я вот читаю какие дипломы у народа - пару дней с пивом посидеть. У одного взять 2 субд и устроить между ними гонки (тупо забить значениями и посмотреть какая быстрее выборку делает), еще у одного - написать простейший форум на PHP и т.д. Чувствую просто что меня ЗАСТАВИЛИ работать за семерых - я сделал систему основанную на знаниях для автоматизации процесса доказательства математической теоремы (точную формулировку не помню, но что то вроде того)... Правда потом она заняла 10е место на всероссийском конкурсе дипломных работ, но денег мне за это не дали, так что мне сугубо ****, что она вообще участвовала в этом конкурсе :)

ЛАКЕРЫ! :-D Так что лучше радуйтесь, что Вам за такую работу дадут полноценный диплом :)

malls
На сайте с 08.08.2005
Offline
255
#8
Umbert0:
Дело в том что скоро защита диплома, и надо уже начинать его))
...
Нужно научиться получать данные от Яндекс XML и от Google

Чем пять лет занимался??? 😂😂😂

Umbert0
На сайте с 22.01.2009
Offline
81
#9

Ну с яндексом я разобрался, не сложно...

А вот с гуглом проблемы. он как я понял такого сервиса не предоставляет(((

Может кто поделиться тем как можно получить выжачу гугла в XML (там есть конечно но платно, а это не так уж интересно)

Umbert0
На сайте с 22.01.2009
Offline
81
#10
So1:
php.net

Смотреть:
curl_multi, curl (только если стоит соответствующее расширение для кюрл'а) / file_get_contents (внимание! только с PHP5), если PHP 4, то fopen

читаете целиком файлы, отдаваемые Яндексом и Гуглом и парсите при помощи
SimpleXML или DOMDocument

А вообще, ппц, товарищи, я вот читаю какие дипломы у народа - пару дней с пивом посидеть. У одного взять 2 субд и устроить между ними гонки (тупо забить значениями и посмотреть какая быстрее выборку делает), еще у одного - написать простейший форум на PHP и т.д. Чувствую просто что меня ЗАСТАВИЛИ работать за семерых - я сделал систему основанную на знаниях для автоматизации процесса доказательства математической теоремы (точную формулировку не помню, но что то вроде того)... Правда потом она заняла 10е место на всероссийском конкурсе дипломных работ, но денег мне за это не дали, так что мне сугубо ****, что она вообще участвовала в этом конкурсе :)
ЛАКЕРЫ! :-D Так что лучше радуйтесь, что Вам за такую работу дадут полноценный диплом :)

Господа ну что вы обижаете....

Не все так просто, реализовать выдачу из нескольких ПС это только часть задания

Далее предстоит математически просчитывать какая ПС наиболее адекватно удовлетворяет запросам пользователя и в зависимости от этого перетасовывать результаты, оценивать то на каких позициях встрезается документ в ПС и т.п....

А парсить результаты через хтмл это как то не очень правильно на мой взгляд, ибо какой нить препод тут же спросит

"А что будет если дизайн поменяется?"

и как то не хочется искать ответы на подобные вопросы

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий