Сервис для сбора позиций в Яндексе

12 3
Z
На сайте с 16.01.2014
Offline
3
2858

Написал свой сервис для сбора позиций.

Используется xml.yandex.ru, лимитов около 17к в сутки.

Собирает 50 запросов примерно за 10 секунд.

Важно! Сервис пока не совсем дописан, а именно нет проверки на предел лимитов в час и сутки, вместо этого будет отдавать прочерки. Так же, никаких проверок на вводимые данные.

---------- Добавлено 16.01.2014 в 23:19 ----------

ссылку забыл =) http://kashkovskiy.ru/sbor-pozicij-yandex/

Z
На сайте с 16.01.2014
Offline
3
#1

изменил ограничение по количеству проверяемых запросов до 100 штук за раз.

Z
На сайте с 16.01.2014
Offline
3
#2

переписал сервис на javascript + node js

увеличил лимит до 200 запросов за раз

теперь 200 запросов собирается где то за 40 секунд

Злобный Гыук
На сайте с 30.08.2007
Offline
83
#3
Zverushko:
переписал сервис на javascript + node js
увеличил лимит до 200 запросов за раз
теперь 200 запросов собирается где то за 40 секунд

Можно сделать многопоточный слив, тогда качать будет секунд за 5-10.

И капчу хоть сделайте, сейчас халявщики наваяют скриптов и будут сливать ваши лимиты в ноль.

SEO-api для программистов (/ru/forum/869285)
Z
На сайте с 16.01.2014
Offline
3
#4

Да этого код был на питоне, собирался в 50 потоков. Работало быстрее конечно, но требовало больше памяти. Примерно 100 запросов собиралось за 8-10 секунд.

Данная реализация чуть медленнее, но и почти не жрет ресурсов.

Капча сейчас не нужна, так как в обычный день в среднем потребляют 500 лимитов/день, в день апдейта - 1500.

Предел сейчас - 23100. Как увижу сливы, сделаю капчу=)

Злобный Гыук
На сайте с 30.08.2007
Offline
83
#5
Zverushko:
Да этого код был на питоне, собирался в 50 потоков. Работало быстрее конечно, но требовало больше памяти. Примерно 100 запросов собиралось за 8-10 секунд.

Данная реализация чуть медленнее, но и почти не жрет ресурсов.

Капча сейчас не нужна, так как в обычный день в среднем потребляют 500 лимитов/день, в день апдейта - 1500.
Предел сейчас - 23100. Как увижу сливы, сделаю капчу=)

Могу сказать, что это 100% будет! :)

Баги, кстати, нашел... Искал запрос "php программирование", ввел домен "php.ru", так скрипт выдал: php программирование 97 http://js-php.ru/

Т.е. ищется не полное вхождение строки, а нужно регуляркой, с учетом www.

И класика парсинга :) - ищем запрос "одноклассники рф" и сайт "мои-одноклассники.рф", выдает, что ничего не найдено, хотя сайт на 2 месте... Т.е. присутствует проблема с русскими доменами.

PP
На сайте с 20.11.2007
Offline
154
#6

Zverushko, а в разделе "регион" для Москвы указывать 77?

Канаим есть!
war357159
На сайте с 03.11.2009
Offline
257
#7

У меня при нажатии на Список регионов открывается страница со сбитой кодировкой. Но браузер у меня редкий. В Экспловере впорядке все.

Подпись ➤
Z
На сайте с 16.01.2014
Offline
3
#8
Злобный Гыук:
Могу сказать, что это 100% будет! :)

Баги, кстати, нашел... Искал запрос "php программирование", ввел домен "php.ru", так скрипт выдал: php программирование 97 http://js-php.ru/
Т.е. ищется не полное вхождение строки, а нужно регуляркой, с учетом www.
И класика парсинга :) - ищем запрос "одноклассники рф" и сайт "мои-одноклассники.рф", выдает, что ничего не найдено, хотя сайт на 2 месте... Т.е. присутствует проблема с русскими доменами.

поправил, тестим дальше=)

---------- Добавлено 14.03.2014 в 18:48 ----------

promo-p:
Zverushko, а в разделе "регион" для Москвы указывать 77?

Москва - 213

Питер - 2

---------- Добавлено 14.03.2014 в 18:52 ----------

теперь, кстати, ищется раза в 1,5 дольше

на днях попробую оптимизировать

CB9TOIIIA
На сайте с 22.06.2010
Offline
76
#9

Пользуюсь! Спасибо :) идеально, чтобы проверить быстро небольшое кол-во запросов! Благодарю! Если будет еще скрипт на гитхабе, было бы просто замечательно!

Z
На сайте с 16.01.2014
Offline
3
#10

дык мой говнокод там и лежит=)

https://github.com/Zverushko/seotools/blob/master/routes/yandex.js - javascript

https://github.com/Zverushko/kashkovskiy/blob/master/seotools/yasearch.py - python

отдельного скрипта нет, я думал сделать модуля для node js, но пока руки не дошли.

думаю разобраться будет не сложно

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий