Нужны ли кому кейворды из Яндекс "Прямой эфир" ?

12
Collapse
На сайте с 30.08.2009
Offline
68
#11
5p1tFiRe:
Дубли - да, их фильтрация нужна обязательно. Что касается прокси и многопоточности, тут по своему опыту могу сказать, что они не нужны. За несколько месяцев парсинга(таймаут 5сек) IP моего сервера до сих пор не забанили, а потоки просто не имеют смысла, так как xml фид, парсинг которого идет, обновляется не при каждом запросе. Запросто может 5-10 секунд не меняться, выяснено опытным путем.

Сколько раз проверял, при каждом запросе разные кеи. Что я не так делаю?

P
На сайте с 04.08.2007
Offline
60
#12
Collapse:
Сколько раз проверял, при каждом запросе разные кеи. Что я не так делаю?

Получаю данные в 2 потока, каждый поток делает подряд около 15 запросов. Парсер не обнаружил ни одной одинаковой пары ключей в каждой 20-ке. Судя по статистике http://stat.yandex.ru/stats.xml?ReportID=-225&ProjectID=1 сервис поиска посещает 15 миллионов человек в день, если хотя бы один вводит поисковый запрос, то это около 173 запросов в секунду, соответственно чтобы получить совпадения в ответах last20, необходимо в одну секунду сделать около 10 запросов с грубой поправкой на время пинга.

BW
На сайте с 02.06.2012
Offline
34
#13
оранжевый:
Бесплатных программ/скриптов предостаточно, но по моему все однопоточные.

А не подскажешь конкретных названий?

big boy
На сайте с 18.11.2006
Offline
356
#14
оранжевый:
Сваял парсер кейвордов из прямого эфира Яндекса.

Часов за 7 парсинга получилось 637.803 уникальных кейвордов (или 846.184 уникальных по кейворду плюс стата)

Нужны ли будут кому-нибудь такие кейворды? Нужны ли базы за сутки, или за неделю?
Если спрос будет то собираться будет большее количество.

Выслушаю предложения.

Для теста то что собралось за примерно 7 часов. http://www.mediafire.com/?w8zccl8vh71w902 - yandex_efir.rar - 10 MB

У меня есть парсер, где-то успел халяву давно урвать, но до сих пор пашет. В основном идет сплошной мусор, запросы совершенно разношерстные, потом еще сортировать весь этот бардак... в общем не оценил пользы совсем.

Кстати прога если кому нужна - стучитесь в личку.

✔ Как я генерирую статьи через ИИ, которые приносят трафик - https://webmasta.ru/blog/16-vkalyvayut-roboty-ne-chelovek-stati-s-pomoschyu-ii-kotorye-prinosyat-trafik
ChekMan
На сайте с 30.10.2011
Offline
22
#15
big boy:
У меня есть парсер, где-то успел халяву давно урвать, но до сих пор пашет. В основном идет сплошной мусор, запросы совершенно разношерстные, потом еще сортировать весь этот бардак... в общем не оценил пользы совсем.

Кстати прога если кому нужна - стучитесь в личку.

А зачем сортировать? Собирай базу и делай себе выборки:)

База ключевых слов UP-base v.8 (http://seomart.ru/baza-klyuchevyh-slov-up-base/)
Никанет
На сайте с 26.07.2010
Offline
131
#16

Все упирается в прокси. Где взять хорошие прокси? Юзал одну декстопную прогу, там даже с интервалом 10 секунд бан через пару часов. Также интересуют рабочие скрипты.

О
На сайте с 25.04.2010
Offline
67
#17
Никанет:
Все упирается в прокси. Где взять хорошие прокси? Юзал одну декстопную прогу, там даже с интервалом 10 секунд бан через пару часов. Также интересуют рабочие скрипты.

с правильным подходом и на паблик проксях отлично парсит

51
На сайте с 18.06.2009
Offline
124
#18
оранжевый:
с правильным подходом и на паблик проксях отлично парсит

C правильным подходом за несколько месяцев айпи не банится.

---------- Добавлено 04.11.2012 в 10:17 ----------

Collapse:
Сколько раз проверял, при каждом запросе разные кеи. Что я не так делаю?

Вручную смотрели?

Я автоматизированно проверял повторы, специально написал скрипт для аналитики. Даже при таймауте в 5 сек они иногда бывают. А при таймауте в 1 секунду они очень часто.

Bitex.Cash (https://bitex.cash) - моментальный обмен крипты анонимно, в один клик ЧОЧ.РФ (http://чоч.рф) - кириллический сокращатель ссылок TOPQA (http://topqa.ru) - сервис вопросов и ответов
юни
На сайте с 01.11.2005
Offline
933
#19

А что там за цифры в скобках передаются?

https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит
Collapse
На сайте с 30.08.2009
Offline
68
#20
юни:
А что там за цифры в скобках передаются?

Количество найденных результатов по данному запросу.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий