- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы
Для интернет-магазина инженерных систем
Мария Лосева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
- удаление дублей;
- парсинг похожих ключей
- убирать знак "+" автоматом
- указание какой разделитель ставить ; , : , пробел, табуляция
- прикрутить ********у для разгадывания капч
- прикрутить функцию конвертации в windows1251
- прикрутить ********у для разгадывания капч
Вы уверены, что это надо? Я запускаю парсер вообще без задержек и никаких зависаний и капч не получал (отслеживаю в снифере, что скрипт получает в ответ).
- парсинг похожих ключей
Как вы это видите: в отдельный файл все похожие кеи (как в магадане) или иначе как-то?
то что надо. когда обнова ? заряжу на хостинге на пару месяцев и будет БАЗА )
ТС красавчег, еще нужно только не писать в вывод дубли и убирать +
ТС красавчег, еще нужно только не писать в вывод дубли и убирать +
это уже писали. в каждую щель со своим глючным софтом в подписи лезешь.
[offtopic]кто голодного троля выпустил? почему без намордника? :)[/offtopic]
У меня в папке /out текстовый файл не зодраётся в результате парсинга :(
права на папки /task и /out точно выставлны 777
что может быть?
хостинг дорогой и нормальный
- указание какой разделитель ставить ; , : , пробел, табуляция
Думаю, выбор разделителя будет самый оптимальный вариант
Как вы это видите: в отдельный файл все похожие кеи (как в магадане) или иначе как-то?
Видимо имелось в виду как в магадане, считаю не нужной функцией, лучше самому составить основные кей, буде меньше мусора.
На счет формата вывода: планировал сделать возможность создания csv файла для работы в excel, но как вариант оставлю предложенный формат.
Если будет выбор разделителей, то надобность в этом отпадёт, например, если сохранить txt с табуляцией, то достаточно будет переименовать fail.txt в fail.xlc и он будет корректно отображаться в Excel
На счет "не парсит" не понял, у меня ни разу капча не вылезла, возможно, это перегрузка wordstat, в новой версии я предусмотрю это.
Остановка может быть по двум причинам:
- действительно перегрузка, днём вордстат часто в дауне.
- капча. По личному опыту, капча появляется при большом количестве запросов и при смене куки. Если зайти на вордстат и пообновлять куки, то при новых запросах можно увидить капчу. От ip не зависит.
У меня в папке /out текстовый файл не зодраётся в результате парсинга
Всё заработало :)
когда обнова ?
сегодня вечером сяду делать, а там как пойдет (:
лучше самому составить основные кей, буде меньше мусора
эти кеи будут в отдельный файл класться
например, если сохранить txt с табуляцией, то достаточно будет переименовать fail.txt в fail.xlc и он будет корректно отображаться в Excel
спасибо за наводку, я этого не знал, так и сделаю.
Остановка может быть по двум причинам
хоть убейте, второй причины ни разу не встречал, я погоняю парсер, но если не выскочит ни разу, то не буду писать подгрузку капчи.
Всё заработало
наверное, сервер wordstat был в дауне.