Анализатор позиций Яндекса.

2

Михаил Б.

20 августа 2007, 06:36

2797

Сразу оговорюсь - уверен, что данная тема не раз поднималась на форуме, но хотелось бы узнать как сейчас наиболее удобно решить данный вопрос.

Перед фирмой стоит задача - написать сервис, который выдавал бы результаты по позициям сайтов клиентов. Значит надо парсить Яшу (бесплатный xml - не вариант, слишком мало запросов дозволено).

Хочется определиться со способом.

Читали, что кто-то делает ретранслятор Яндекса на каком-то левом хостинге (скажем, запрос через curl, рандомный user-agent). И его уже парсит со своего сервера через рандомные промежутки времени (скажем, в пределах 30 секунд). Если банят - то просто переносят ретранслятор на др. хостинг (задача минут 30), но банить должны по логике не сразу.

Другой вариант (и думаю более широко используемый) - прокси. Но тут свои вопросы - надо постоянно где-то выуживать работающие (конечно, как вариант можно купить какой-нить скрипт, что будет сам выдавать списки, но всё же это лишние хлопоты и затраты).

Так же наверно возможны какие финты, если поместить подобный сервис на сайт в рекламной сети Яндекса и соответственно пользоваться радостями бесконечного кол-ва запросов к xml. Но ведь сервис закрытый и накликивать толком из него ничего не будут (только с сайта) и думаю есть большая опасность, что быстро выгонять из рекламной сети, что не есть хорошо.

Хотелось бы услышать комментарии по этим способам или может быть что-то упущено?

67

andyzzz

20 августа 2007, 06:38

#1

Михаил Б.:
Сразу оговорюсь - уверен, что данная тема не раз поднималась на форуме, но хотелось бы узнать как сейчас наиболее удобно решить данный вопрос.

Перед фирмой стоит задача - написать сервис, который выдавал бы результаты по позициям сайтов клиентов. Значит надо парсить Яшу (бесплатный xml - не вариант, слишком мало запросов дозволено).

Хочется определиться со способом.
Читали, что кто-то делает ретранслятор Яндекса на каком-то левом хостинге (скажем, запрос через curl, рандомный user-agent). И его уже парсит со своего сервера через рандомные промежутки времени (скажем, в пределах 30 секунд). Если банят - то просто переносят ретранслятор на др. хостинг (задача минут 30), но банить должны по логике не сразу.

Другой вариант (и думаю более широко используемый) - прокси. Но тут свои вопросы - надо постоянно где-то выуживать работающие (конечно, как вариант можно купить какой-нить скрипт, что будет сам выдавать списки, но всё же это лишние хлопоты и затраты).

Так же наверно возможны какие финты, если поместить подобный сервис на сайт в рекламной сети Яндекса и соответственно пользоваться радостями бесконечного кол-ва запросов к xml. Но ведь сервис закрытый и накликивать толком из него ничего не будут (только с сайта) и думаю есть большая опасность, что быстро выгонять из рекламной сети, что не есть хорошо.

Хотелось бы услышать комментарии по этим способам или может быть что-то упущено?

mail.ru парсить нужно

314

T.R.O.N

20 августа 2007, 06:51

#2

Михаил Б.:
(скажем, запрос через curl, рандомный user-agent)

Быстрый бан.

Михаил Б.:
(и думаю более широко используемый) - прокси.

Анонимные - яша не пускает, закрытые, замучаетесь создавать, ибо читайте выше.

Михаил Б.:
бесплатный xml - не вариант, слишком мало запросов дозволено)

Единственный разумный вариант.

1000 в сутки - это уйма.., если подходить с головой (ведь апы не ежедневно) и , не забывайте, что это для одного IP. А получить 64-128-256 IP - это как 2 пальца об асфальт (если конечно фирма - это не я + мой однокласник). И еще - читайте внимательней правило пользования XML.... О 1000 в суки уже давно речь не идет.

andyzzz:
mail.ru парсить нужно

банят так-же

От воздержания пока никто не умер. Хотя никто и не родился! Prototype.js был написан теми, кто не знает JavaScript, для тех, кто не знает JavaScript (Richard Cornford)

Все вопросы по бирже Proxy-SEO - персональные прокси Key Collector - автоматизированная

101

Ilya_1982

20 августа 2007, 06:56

#3

А вот, кстати, сразу вопрос. Если Яндексу платить какую-то сумму рублей в месяц за то, что бы он предоставил неограниченной количество запросов по XML? Это реально?

204

deepslam

20 августа 2007, 06:59

#4

Есть еще вариант - делать запрос с помощью ajax , получается , что запрос будет идти с клиента, с реальными данными. Тогда можно и с помощью Yandex.XML, т.к. 30 000 на клиента нормально.

Удаление вирусов на сайте (http://www.virusonsite.ru) | Scripto CMS - бесплатная система управления сайтом (http://www.scripto-cms.ru) |Профессиональный скрипт каталога ссылок , статей, фирм и объявлений! (http://www.scripto.ru) | Уникальный скрипт для публикации контента (http://publisher.scripto.ru)

50

Sayros

20 августа 2007, 06:59

#5

Ilya_1982:
А вот, кстати, сразу вопрос. Если Яндексу платить какую-то сумму рублей в месяц за то, что бы он предоставил неограниченной количество запросов по XML? Это реально?

Как договоритесь.

505 44 38

314

T.R.O.N

20 августа 2007, 07:11

#6

deepslam,

Ощущение такое, что Вы слышали тольок красивые слова - ajax, xml, но очень туго понимаете как это работает.

Запрос всеравно придется формировать с сервера, в т.к. для xml нужно регить IP.

Ilya_1982:
Это реально?

Да

Сколько будет стоить? EXCEL. Отображение Яндекс CY Количество запросов

204

deepslam

20 августа 2007, 07:40

#7

T.R.O.N, почему формировать с сервера? Если сделать запрос с клиента, получить код html и уже на свой сервер отправить? Это реально, поверьте.

204

deepslam

20 августа 2007, 07:47

#8

Получить либо html код, если к обычному яндексу запрос, либо xml, если к Яндекс.XML

М

73

Мишган

20 августа 2007, 08:01

#9

deepslam:
T.R.O.N, почему формировать с сервера? Если сделать запрос с клиента, получить код html и уже на свой сервер отправить? Это реально, поверьте.

Про политики безопасности браузера слышали? В частности same origin...

Cервис для оптимизаторов Optimizer Desktop (http://jdev.ru/od/?utm_source=forum.se.ru&utm_medium=signature): мониторинг позиций, учет ссылок. Программа для оптимизаторов и вебмастеров OptiSuit (http://optisuit.ru/?utm_source=forum.se.ru&utm_medium=signature): Optimizer Desktop на Вашем компьютере

T

36

trappa

20 августа 2007, 08:02

#10

Идея с ajax - интересная. Но есть ограничение технологии под названием "сервер-источник". Код ajax клиента не может работать как с локальной файловой системой, так и не может устаналивать сетевое соединение ни с одним сервером за исключением того, откуда был скопирован. Выход ставить на свой сервер некую "прокси", которая общается с веб-сервисами, но тогда вы не получаете разные IP ( что и было основной целью )

Proxys.io - Индивидуальные прокси Роскомнадзор-устойчивый хостинг Задача по раздаче мыла

Все что нужно знать о DDоS-атаках грамотному менеджеру

Яндекс Вебмастер вынес товарные фиды в отдельный раздел