в данный момент многопоточность парсинга XML не поддерживается
В планах есть, реализовано будет позже.
Arc_us, разные программы, Коллектор ориентирован на рунет и не поддерживает адвордс, ANF - как раз наоборот, поддерживает адвордс и ориентирована на буржунет, по-моему.
Разные сегменты - разные подходы. Поэтому тут сравнивать не стоит.
Всем спасибо за письма с теми или иными комментариями, в которых масса полезных сведений.
Продолжаем работать над модернизацией, никаких "полумер", детальная проработка программы с целью улучшения!
на емайл отправляйте config.xml
ждем RunError.txt который в папке с коллектором создается, посмотрим что там рухнуло
видимо потому, что рухнуло до автосохранения и эти данные не успели сохраниться, если вообще были отпаршены
логично, если завершение работы программы внештатное, то конфиг файл не сохранился
вобщем вопросы 1-3 пока не в тему, до выяснения причин обружения программы на Вашей системе, любые несохранения и прочие проблемы будут отсутствовать после выяснения причин, по которым она упала. Фреймворк или еще что-то, ждем файл RunError.txt
ответ будет таков, при наличии точных данных что тырят у Вас, т.е. например там тырят и стоит ссылка через редирект или без него на сайт:
"Благодарю Вас за примеры, демонстрирующие проблему ранжирования плагиата в поиске. Я направил их необходимым специалистам, работающим над проблемами алгоритмов ранжирования сайтов с оригинальным контентом и сайтов с плагиатом."
Если такого нет, то ограничатся простым "мы зеркало рунета".
Вообще, первым делом нужно просто позвонить владельцу сайта, без угроз и прочей ерунды и объяснить ситуацию.
В большинстве случаев уберут ее, т.к. все-равно где воровать, а тут уже есть проблема.
В случаях не согласия есть и другие методы.
формирование выгрузки под сапу и майнлинк есть -
http://seom.info/2011/02/23/key-collector-2-1/
http://seom.info/2011/02/25/yandex-metrika-2/
И данная тема завершена, продолжение в части 4 /ru/forum/631141
ближе к истине последние данные, с учетом сезонности в том числе, причину таких разночтений я в скрине показал, это обновление базы вордстата.
то что обвел, может это и есть причина такого расхождения?
из яндекса :)
по региону москва по "точному вхождению" :) с абсолютной динамикой по месяцам
P.S. так и не понял глюка... Можно сказать что там должно быть вместо этой цифры?
а можно подробней в чем глюк?
Ну есть картинка, есть подчеркивание, в чем глюк?