Нужно опять править регулярки, в сборке которая лежит на нашем сайте уже исправлено (что именно править вручную не скажу, а то опять куча вопросов появится). Либо дождитесь апдейта, он скоро будет :) Одной из из новых функций как раз будет проверка и автообновление конфигурационных файлов.
1)Поскольку манибек мы не осуществляем, советую попробовать следующий вариант - проведите анализ на нашем он-лайн сервисе SEOBudget!, файл отчёта, который Вы получите, открывается демо-версией Yazzle, там Вы сможете оценить точность определения ссылочного бюджета (проанализируйте какой-нибудь свой сайт, бюджет которого Вы знаете точно). Анализ 1 сайта в системе стоит 10р. http://seobudget.ru
2) Столько ссылок, сколько показывают поисковые системы, с учётом Ваших настроек. На предыдущей странице ветки форума я привёл пример /ru/forum/comment/3733493 так же есть ответ на этот вопрос на форуме SEOBudget!.
В "Сервис"-"Параметры...". Только это "плохое" решение, рано или поздно отклик будет достаточно долгим и переключение на "денежку" произойдёт. Если, конечно, вообще эта галка выставлена.
Да, стоп-слова учитываются. В некоторых источниках приведено описание экспериментов, которые показали, что
После апдейта тИЦ была перерисована "денежка" (http://yandex.ru/cycounter?site.com), изменилась функция её обработки. Поправить можно только с апдейтом программы, он скоро будет готов. По умолчанию, тИЦ определяется по бару, если отклик от него достаточно большой, то происходит переключение на "денежку". Вот тут то и возникает проблема - новая "денежка" в текущей версии неправильно обрабатывается.
Пока что можно попробовать следующее:
1. Снимите флажок "получать верный тИЦ поддоменов" в настройках программы.
2. Разгрузите канал интернета.
Нет, это не бан ПС, просто вчера был апдейт тИЦ и глючил источник. Сегодня с утра проверил - всё ОК.
Upd... похоже что "денежку" немного перерисовали, правим.
На SAPE профработы, загляните в раздел "Биржи ссылок".
1. Связано с тем, что ни один поисковик "не показывает" более 1000 результатов, хоть и пишет, что найдено больше.
Ещё один момент - например проанализировав "yahoo.com" только по ПС Yahoo показывается чуть больше 700 ссылок, естественно возникает вопрос - "Почему цифра не дотянула до заявленной 1000?". Дело в том, что в настройках Yazzle отмечен флажок "не показывать более 1 ссылки с сайта", соответственно ссылки с повторяющимся хостом - не показываются. Если этот флажок снять - показывается заявленная 1000 ссылок. Советую провести этот эксперимент лично, чтобы лучше разобраться в работе программы, по времени займёт порядка 2-3 минут, траффик ~300кб, сбор параметров ссылок нужно отключить.
2. Принимая во внимание написанное выше - есть смысл смотреть, сколько же на самом деле ссылок находит Yahoo, рассчитывать какую часть из этой ссылочной массы обработал Yazzle и домножать на получившийся коэффициент. В связи с тем, что беклинков сайтов, особенно в конкурентных тематиках, достаточно много, стоит проводить комплексную оценку сайта и смотреть сколько же на самом деле существует беков (кстати, суммировать по всем поисковикам не нужно - многие беки повторяются, советую принимать во внимание только число по Yahoo). В настройках программы можно задать коэффициент, на который будет умножатся рассчитываемый бюджет - к примеру анализируя ТОП по определённому запросу, можно предположить, что коэффициент для этих сайтов будет примерно одинаковым и задать его в настройках.
Семёныч добавил 02.10.2008 в 09:29
отпишитесь мне в личку на форуме.
Спасибо за подробный отчёт :)
По ошибкам:
1. Возраст сайта определяется по дате создания некоторых файлов, например таблицы стилей. если эти файлы меняются, то сайт воспринимается как "новый".
2-5. "-1" означает "нет возможности определить", то есть неопределённость в результатах. У Вас, скорее всего, остались старые конфигурационные файлы для Turtle и Webalta, сейчас эти поисковики не используются в качестве источников, папки с файлами для этих поисковиков можно смело удалять.
По пожеланиям:
1. Подразумевается, что старые данные устарели и более не нужны, соответственно старый файл заменяется на более новый. Если старые отчёты нужны, то можно вручную их переименовывать или создавать новую папку для ведения истории (нужно указывать реально существующую папку, пока что Yazzle сам папки не создаёт).
2. Уже не первый раз подобное предложение, подумаем.
Здраствуйте, посмотрите пост, должно помочь
в следующем апдейте Yazzle будет автообновление файлов настроек для ПС, чтобы не приходилось обновлять программу или править их вручную при изменении HTML кода выдачи поисковиков.
Расскажите, пожалуйста, подробнее, каким бы Вы хотели видеть вывод результатов работы данного инструмента? Лучше всего, оформите своё пожелание на нашем багтракере http://bugs.controlstyle.ru/view_all_bug_page.php?page_number=1
Дабы не возникало недопонимания:
Использование прокси-серверов при работе с Yazzle не является необходимостью, однако позволяет увеличивать скорость работы и уменьшать вероятность бана со стороны ПС. Необходимо понимать, что любой автоматический парсинг с 1 IP адреса, при желании, можно отследить, какими бы ухищрениями не прикрывался клиент. Использование нескольких прокси-серверов значительно уменьшает вероятность опознавания "робота", да и Ваш собственный IP останется чистым, даже в случае бана прокси (сменить которые - не проблема). Мало того, использование прокси будет полезным так же и для других десктопных программ для автоматического сбора данных.
К чему я всё это - Яззл справляется со своими обязанностями и без использования прокси (мне даже стараться приходится, чтобы капчу поймать :)), однако прокси помогут сделать жизнь в интернете более свободной и безопасной.
Тот список прокси, который поставлялся с Yazzle устарел, многие прокси из него уже не работают. Для хорошей защиты от банов нужно использовать приватные прокси-сервера, обсуждение было где-то здесь /ru/forum/109191
Неплохая статья по поводу прокси здесь http://nickspring.ru/archives/34
должно помочь
/ru/forum/comment/3667039
довольно большое количество анализов на сбор ссылок проводится без проверки индексации в Яндексе, логично использовать много потоков для ускорения. Однако, когда начинается проверка индексации ссылок, настройки, как правило, не меняются. Отсюда капчи и неверные результаты.
Сделаем тогда по условию "не больше 3х", чтобы всех устраивало.
на самом деле всё гораздо сложнее.
Если речь идёт об инструменте "Проверка обратных ссылок", то там принудительно выставляется 3 потока на проверку индексации и иногда может возникнуть ситуация, что капчи "перекроются".
Повторюсь, уже наверное в тысячный раз - юзайте прокси и не будет никаких капч, банов и тп. Над капчей, конечно, работа идёт, но прокси гораздо эффективнее.