Поиск от Google и Yandex - помогите разобраться.... плиз) - Веб-строительство - Сайтостроение

81

Umbert0

20 апреля 2009, 11:11

849

Здравствуйте, помогите пожалуйста разобраться господа

Дело в том что скоро защита диплома, и надо уже начинать его))

Объяснь вкрадце сто должно быть:

Нужно научиться получать данные от Яндекс XML и от Google (XML - если есть, вроде должен быть)

убирать дубли и выводить это в одном документике, подскадите кто работал с Яндекс XML или Google XML литературу в помошь, или может примеры работ, если кто готов помочь реально готов оплатить (пусть не очень много но все же)

Может у кого то есть готовые наработки по этому поводу

поддержите студента, в результате все равно все выложу для форумчан! естественно в удобной форме с учетом специфики работы seo

Помогите пожалуйста...:)

74

zzeus

20 апреля 2009, 11:15

#1

официальный хелп ИМХО очень доступен

Вообще такое пилить - пару часов на коленке (это с отладкой, ага)

[Удален]

20 апреля 2009, 11:21

#2

Umbert0, php.net/file_get_contents php.net/curl php.net/preg_match_all php.net/array_unique

остальное отладка :D

81

Umbert0

20 апреля 2009, 11:27

#3

маленькие уточнения...

я к сожалению в английском не очень (не сочтите уж за наглость) но если есть возможность то на русском материалы нужны, но можно конечно попытаться и в это вникнуть

И сие чудо будет устанавливаться локально, так что php не очень подходит...

Пока склоняюсь к связке XML + XSLT + маленькое подобия сервера (который слушает локалхост)

Umbert0 добавил 20.04.2009 в 15:38

Расскажу в чем основная идея:

Имеется поле (что то вроде Google Desctop)

имеется легонький обработчик http запросов

юзер вбивает в поле строку, поле отправляет запрос на localhost:5050 к примеру

обработчик берет этот запрос, и отправляет в Ya XML и G XML/

соответственно получает ответы в виде XML файлов

обрабатывает из (удаляет дубли и сортирует ответы чтобы выводились ответы из обеиз ПС)

и выводит все в одном документе при помощи XSLT

(желательно еще как то оценивать чьи ответы устраивают пользователя больше, например считать переходы или возвраты к поиску)

LL

39

lip lippov

20 апреля 2009, 14:42

#4

Umbert0:
маленькие уточнения...

я к сожалению в английском не очень (не сочтите уж за наглость) но если есть возможность то на русском материалы нужны, но можно конечно попытаться и в это вникнуть

И сие чудо будет устанавливаться локально, так что php не очень подходит...

Пока склоняюсь к связке XML + XSLT + маленькое подобия сервера (который слушает локалхост)

Что-то мне не понятно. Все равно ж сервер надо писать, ставить, зачем мудрить то. Ставите апач локально, то же самое все и получится, только гораздо проще.

119

Maxouni

20 апреля 2009, 14:52

#5

http://code.google.com/p/yandex/downloads/list

Здесь лежит скрипт по работе с ЯндексXML, я несколько раз пользовался посмотри как сделан.

Создание, продвижение, поддержка сайтов и приложений.

81

Umbert0

28 апреля 2009, 17:44

#6

lip lippov:
Что-то мне не понятно. Все равно ж сервер надо писать, ставить, зачем мудрить то. Ставите апач локально, то же самое все и получится, только гораздо проще.

нет не тоже, сервер который есть по сути банально слушает порт и ничего лишнего, к нему доработать отправку и прием xml и все будет готово

[Удален]

29 апреля 2009, 10:01

#7

php.net

Смотреть:

curl_multi, curl (только если стоит соответствующее расширение для кюрл'а) / file_get_contents (внимание! только с PHP5), если PHP 4, то fopen

читаете целиком файлы, отдаваемые Яндексом и Гуглом и парсите при помощи

SimpleXML или DOMDocument

А вообще, ппц, товарищи, я вот читаю какие дипломы у народа - пару дней с пивом посидеть. У одного взять 2 субд и устроить между ними гонки (тупо забить значениями и посмотреть какая быстрее выборку делает), еще у одного - написать простейший форум на PHP и т.д. Чувствую просто что меня ЗАСТАВИЛИ работать за семерых - я сделал систему основанную на знаниях для автоматизации процесса доказательства математической теоремы (точную формулировку не помню, но что то вроде того)... Правда потом она заняла 10е место на всероссийском конкурсе дипломных работ, но денег мне за это не дали, так что мне сугубо ****, что она вообще участвовала в этом конкурсе :)

ЛАКЕРЫ! :-D Так что лучше радуйтесь, что Вам за такую работу дадут полноценный диплом :)

255

malls

29 апреля 2009, 12:29

#8

Umbert0:
Дело в том что скоро защита диплома, и надо уже начинать его))
...
Нужно научиться получать данные от Яндекс XML и от Google

Чем пять лет занимался??? 😂😂😂

81

Umbert0

30 апреля 2009, 17:47

#9

Ну с яндексом я разобрался, не сложно...

А вот с гуглом проблемы. он как я понял такого сервиса не предоставляет(((

Может кто поделиться тем как можно получить выжачу гугла в XML (там есть конечно но платно, а это не так уж интересно)

81

Umbert0

3 мая 2009, 07:51

#10

So1:
php.net

Смотреть:
curl_multi, curl (только если стоит соответствующее расширение для кюрл'а) / file_get_contents (внимание! только с PHP5), если PHP 4, то fopen

читаете целиком файлы, отдаваемые Яндексом и Гуглом и парсите при помощи
SimpleXML или DOMDocument

А вообще, ппц, товарищи, я вот читаю какие дипломы у народа - пару дней с пивом посидеть. У одного взять 2 субд и устроить между ними гонки (тупо забить значениями и посмотреть какая быстрее выборку делает), еще у одного - написать простейший форум на PHP и т.д. Чувствую просто что меня ЗАСТАВИЛИ работать за семерых - я сделал систему основанную на знаниях для автоматизации процесса доказательства математической теоремы (точную формулировку не помню, но что то вроде того)... Правда потом она заняла 10е место на всероссийском конкурсе дипломных работ, но денег мне за это не дали, так что мне сугубо ****, что она вообще участвовала в этом конкурсе :)
ЛАКЕРЫ! :-D Так что лучше радуйтесь, что Вам за такую работу дадут полноценный диплом :)

Господа ну что вы обижаете....

Не все так просто, реализовать выдачу из нескольких ПС это только часть задания

Далее предстоит математически просчитывать какая ПС наиболее адекватно удовлетворяет запросам пользователя и в зависимости от этого перетасовывать результаты, оценивать то на каких позициях встрезается документ в ПС и т.п....

А парсить результаты через хтмл это как то не очень правильно на мой взгляд, ибо какой нить препод тут же спросит

"А что будет если дизайн поменяется?"

и как то не хочется искать ответы на подобные вопросы

Все что нужно знать о DDоS-атаках грамотному менеджеру

Google: E-E-A-T не является фактором ранжирования

Поиск от Google и Yandex - помогите разобраться.... плиз)