- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Прошу объяснить как работать с Yandex.XML через прокси в несколько потоков.
в данный момент многопоточность парсинга XML не поддерживается
В планах есть, реализовано будет позже.
в данный момент многопоточность парсинга XML не поддерживается
Это уже понятно, ну а прокси то из списка, указанные в настройках Yandex.XML в формате с диезом (#), по очереди перебирает? Или долбает до упора в первую/случайно взятую итп?
Это уже понятно, ну а прокси то из списка, указанные в настройках Yandex.XML в формате с диезом (#), по очереди перебирает? Или долбает до упора в первую/случайно взятую итп?
На данный момент должен долбить до тех пор, пока в лимит не упрется. Затем берет следующий акк. Каши из форматов не допускается.
А вот еще загадочка.
Запустил сбор данных для вычисления KEI с яндекса, одновременно с этим работает съем позиций, все это работает через YXML, сборщик KEI снял пару тысяч значений и издох:
И не запускается больше.
Съем позиций перезапускается и работает нормально.
Anton, скоро пересмотрим систему. Спасибо за сообщение
Косяк с синтаксической ошибкой отдебажил. Оказалось, что он вылезает, когда в ключевом слове встречается двоеточие ":".
Оказалось, что он вылезает, когда в ключевом слове встречается двоеточие ":".
Там вроде можно настроить, чтобы вырезались определённые символы.
Там вроде можно настроить, чтобы вырезались определённые символы.
Можно, но это допустимо при генерации семядра. У меня же идет анализ того, что есть на сайте и лежит в БД, поэтому приходится анализировать то, что есть и именно в том виде, в каком оно есть, тк потом результаты этого анализа заносятся обратно в базу и тут вольности с вырезанием спецсимволов итп недопустимы.
Статистика ПС эти символы вырезает или ключи с ними игнорирует. Найдите дубли в базе данных различающиеся только знаками препинания. И анализируйте их отдельно.
Так мне потом из csv экспорта все это в базу обратно записывать нужно, а чтобы записать, нужно запись найти по точному совпадению кея, поэтому ничего резать нельзя. Как ПС реагирует на эти спецсимволы меня не особо волнует.