MyOST

MyOST
Рейтинг
559
Регистрация
22.01.2006
Anton:
Прошу объяснить как работать с Yandex.XML через прокси в несколько потоков.

в данный момент многопоточность парсинга XML не поддерживается

В планах есть, реализовано будет позже.

Arc_us, разные программы, Коллектор ориентирован на рунет и не поддерживает адвордс, ANF - как раз наоборот, поддерживает адвордс и ориентирована на буржунет, по-моему.

Разные сегменты - разные подходы. Поэтому тут сравнивать не стоит.

Всем спасибо за письма с теми или иными комментариями, в которых масса полезных сведений.

Продолжаем работать над модернизацией, никаких "полумер", детальная проработка программы с целью улучшения!

Эртэд:
Вручную под этими же данными авторизация на сеопульте с моего ипа осуществляется без проблем.

Как решить эту проблему?

на емайл отправляйте config.xml

Эртэд:
2) По каким то причинам вырубило софтину в 3:16, в 5:20 я это заметил и отправил об этом сведения в Microsoft (стандартная операция когда приложение под Windows 7 "рухнуло").

ждем RunError.txt который в папке с коллектором создается, посмотрим что там рухнуло

Эртэд:
1) Однако, вся информация по тому сколько слов напарсено с бирж ссылок - исчезла. То есть я запустил парсинг каждой биржи и он пошел ЗАНОВО. Почему так?.

видимо потому, что рухнуло до автосохранения и эти данные не успели сохраниться, если вообще были отпаршены

Эртэд:
2) Более того, у каждой биржи не сохранились вбитые мною значения (логин/пароль к бирже и урл проекта для парсинга). Пришлось снова вбивать. Это конечно не критично, но этого явно не должно быть. Или я что-то не так сделал?

логично, если завершение работы программы внештатное, то конфиг файл не сохранился

вобщем вопросы 1-3 пока не в тему, до выяснения причин обружения программы на Вашей системе, любые несохранения и прочие проблемы будут отсутствовать после выяснения причин, по которым она упала. Фреймворк или еще что-то, ждем файл RunError.txt

alexpnet:
Подскажите сайт периодически ворует уникальный контент с моего сайта, есть ли смысл написать в яндекс? может ли он применить санкции к сайту который ворует?

ответ будет таков, при наличии точных данных что тырят у Вас, т.е. например там тырят и стоит ссылка через редирект или без него на сайт:

"Благодарю Вас за примеры, демонстрирующие проблему ранжирования плагиата в поиске. Я направил их необходимым специалистам, работающим над проблемами алгоритмов ранжирования сайтов с оригинальным контентом и сайтов с плагиатом."

Если такого нет, то ограничатся простым "мы зеркало рунета".

Вообще, первым делом нужно просто позвонить владельцу сайта, без угроз и прочей ерунды и объяснить ситуацию.

В большинстве случаев уберут ее, т.к. все-равно где воровать, а тут уже есть проблема.

В случаях не согласия есть и другие методы.

mypaxa:
было бы неплохо что бы этот "чудо софт" передавал данные как в сапу ещё и в сетлинкс...

формирование выгрузки под сапу и майнлинк есть -

http://seom.info/2011/02/23/key-collector-2-1/

http://seom.info/2011/02/25/yandex-metrika-2/

И данная тема завершена, продолжение в части 4 /ru/forum/631141

medea:
от пытаюсь понять, почему так произошло и какие данные ближе к истине.

ближе к истине последние данные, с учетом сезонности в том числе, причину таких разночтений я в скрине показал, это обновление базы вордстата.

medea:
парсили неделю назад где-то запросы, у "центральне кондиционирование" частотность "!" была около 50. теперь - 1000. Подозрительно?

то что обвел, может это и есть причина такого расхождения?

medea:
откуда цифра 1142?

из яндекса :)

по региону москва по "точному вхождению" :) с абсолютной динамикой по месяцам

P.S. так и не понял глюка... Можно сказать что там должно быть вместо этой цифры?

medea:
Правильно понимаю, что это глюк? Как такие глюки отлавливать на этапе парсинга?

а можно подробней в чем глюк?

Ну есть картинка, есть подчеркивание, в чем глюк?

Всего: 9978