sapien

Рейтинг
143
Регистрация
25.11.2007
Str256:
А разве в посте не понятно написано?

хм, ну ладна, ошибка то хоть не вылетает?)

Str256:
А с чем он сверяет? Дело в том, что он похоже учитывает в том числе анкоры ссылок, а это не совсем то, что надо. Типа я ввёл в шаблон пластиковые|окна, а он нашёл на пустой странице анкор пластиковые окна и посчитал, что страница тематическая)))

делается match шаблона на весь html

есть вам надо другое, то объясните, что именно

выложил обновление

[ADD] Проверка тематики сайта

[ADD] Счетчик строк в результате, всех и выделенных

[FIX] Изменен алгоритм проверки ошибки загрузки рекламы

[FIX] Удаление html-сущностей типа & lt ; из заголовков сайта (title, h1)

web_net:
Как-то ни одной зеленой галки..

yandex.ru у меня

Частичное совпадение (без www)

20211

зеленой галки нет, потому что перечисленные адреса найдены яндексом с префиксом www, который вы не указали

Str256:
ТС, прога периодически выдаёт одну и ту же ошибку "Ошибка загрузки рекламы" - сайты на которых её стопорит нормальные, после проверки - зелёный. Думаю что-то с тизерной сетью связано или может вы нарочно так сделали, чтобы больше покупали?

ну нарочно я так точно не делал.

наверно, действительно с тизерной сетью проблемы.

явно баг, так что что-нить сделаю с этим


Не шибко удобно, максимум 750 ссылок и вылет, а бывает и 150 хватает. И так не быстро и ещё это. Нескольких потоков бы не помешало, иначе тысячи ссылок слишком долго проверять.

интервал между запросами 0 ?

сейчас потестил, 100 сайтов за 8 минут. не фонтан, но тож ничего.

многопоточность явно ускорит процесс, но это серьезная доработка софта, которая потребует много времени, а его пока нет.

и такая доработка не будет работать с яндексом изза его капчи

Кротов:
Это не удобно.

ну а как тогда удобно? :)

а то я уже много вариантов от вас слышал


Нужна - "пауза"
т.к. при нажатии на стоп и потом снова на пуск, если стоит галочка чистить предыдущее - мы все теряем, если галочка чистить предыдущее не стоит - мы проверяем всеравно список сначала..

пауза есть в todo, даже пытался ее сделать, но были какие-то трудности и забил

Кротов:
Str256, нет, если нажимать на заголовки то они упорядочатся один за другим,
а я имею ввиду, что при нажатии на кнопку определенной категории выводятся только данные этой категории

есть такая функция, называется "выделить строки с таким же результатом"

потом делаете "копировать выделенные"

sapien добавил 10.09.2009 в 11:57

Mr.k:
И так выдает каждый сайт.. Я что-то не так делаю или просто не могу вкурить где тут результаты и совпадения??

вероятно баг

примеры таких сайтов

sapien добавил 10.09.2009 в 11:58

lamusi:
Я проверила форум серч
Вот результат

Полное совпадение адресов
Маска шаблонов 1-4

Это хорошо или плохо?

зеленая галка - хорошо

Кротов:
Тоже задался этим вопросом, но нашел в топике альтернативу,
хотя экспорт по отдельным категориям был-бы конечно удобнее

экспорт именно в файлы?

sapien добавил 10.09.2009 в 00:19

Str256:
Ещё такое дело. Указал список урлов - проверил. Вернулся на пред страницу - добавил ещё один - так она начала проверять весь список снова целиком и дописовать в результатах всё повторно, получилось 2-е копии результатов. Зачем? Можно конечно очищать предыдущую форму вручную, но ведь проще проверенные урлы из начальной формы больше не считывать.

поставьте галочку на "удалять проверенные адреса"

Str256:

Как насчёт экспорта по категориям? Т.е. несколько текстовых файлов, в каждую определённый балл.

может в будущем сделаю, если еще кому-нить понадобиться, а пока можно отсортировать по результату, выделить одинаковые и скопировать их.

Str256:

И ещё тут выдало на одной странице, 404 - проверил повторно нормально. Можете сделать, чтобы если такие страницы находились - по окончание общей проверки они автоматом проверялись снова.

опять же сейчас это можно сделать вручную, выделить все ошибочные и нажать "повторить"

в планах фича - брать контент таких страниц их кэша яндекса, чтоб ничего повторять не приходилось

sapien добавил 10.09.2009 в 00:07

SeoNizator:
Ну я написал об этом в предыдущем посте. "Имеющий глаз, да увидит" ;)

А то, что программа небезопасна - факт. Сегодня она одно отправляет, завтра пароли на ФТП, послезавтра - кипер..

парраноить можно по поводу любой проги, лазящей в интернет, браузера например

sapien добавил 10.09.2009 в 00:10

и кстати ничего она не отправляет, на visitweb идет обычный запрос GET

SeoNizator:
Спалю-ка и я тему. Жир просто (для понимающих ;) ).

Софтина при запуске накручивает показатели в тизерной партнёрке (visitweb.com).

Вот мне интересно другое. Неужели никто не пользуется защитой своих данных на компе? Ведь она отправляет данные (хоть с данном случае и не критичные, но сам факт).

интересно какие это данные

sapien добавил 09.09.2009 в 22:53

MMX3000:
злая статья ))

sapien, софт слабоват, ожидал, что он будет высчитывать ссылочный вес донора, а здесь... я не понял, что он считает и какая польза от результата 😕

например, результат "Полное совпадение адреса" совпадения с чем?

ЗЫы проверил 5 сайтов, все совпало 😎

прога позволяет отлавливать говно-сайты, когда их не 5 штук, а сотни-тысячи

sapien добавил 09.09.2009 в 22:55

Str256:
Чес слово сомневаюсь в этом. Траст - уровень доверия. А какое доверие может быть, если сайт никто не рекомендует и не посещает? Даже если сейчас появится 2-я вики, то пока её не отсмотрят ассессоры и не скажут гуд - хороший сайт, особых привелегий к ней со стороны ПС не будет. Если принять траст за ось координат, то есть нулевой, положительный и отрицательный. Вначале у созданного сайта он нулевой. Далее его карму можно как улучшить так и ухудшить.

ну тогда вернее будет сказать, что програ отлавливает сайты с отрицательной кармой

Всего: 847