cheboor

cheboor
Рейтинг
123
Регистрация
13.12.2005
Mr.Smit:
cheboor, вы разберетесь с проблемой регистрации в каталогах с капчей или нет?

Молодой человек, я надеюсь Вы разобрались, что проблема была не в программе, а в неправильно распознанной базе? Автоматическая регистрация корректно работает с captcha. Во всяком случае, мне не известен ни один случай, когда бы программа ошибалась.

Mr.Smit:
P.S.: Проблему подробно я вам расписал в аси и часть базы на которой обнаружил ошибки выслал вам на мыло..А в ответ только тишина...Мда...Сервис зашибись...

Для форсирования процесса решения своих проблем, впредь советую высказывать больше уважения собеседнику и использовать какой-либо один способ связи.

slavy:
Запускаю "Автоматический анализ форм", в папке более 4 тыс. каталогов, каталоги, где не найдено, должны переноситься в другую папку - работает какое-то время, потом программа схлопывается не сказав худого слова, разумеется при следующем запуске все каталоги на месте...
Обновил Firebird до версии 2.0 - ничего не меняется.

Сегодня мы смогли найти еще один тип ошибок в html коде (спасибо proffoto), который вызывает безапеляционное закрытие программы, в ближайшем обновлении научим программу корректно работать с подобными страничками.

Димитрий:
я гружу ASD XML файл каталогов, всего 6500, и то виснет сильно.. минут пять думает. и это на атлоне 64, где 2 гб оперативки. жестоко.

Вы считаете это время критичным?

Lorenco:
Плюс наблюдаю такой глюк. И вчера и сегодня при запуске программа проводит абсолютно идентичные операции по обновлению (список обновляемых файлов один и тот же.)

Действительно в последние дни обновились те же самые файлы.

Mr.Smit:
HELP!!!
У меня такая проблема....
Импортировал базу из txt(где-то 70 каталогов)....
Прогнал по ней сайт ручками(естественно распознание форм сделал)...
Заполнил поля успешной регистрации, поставил галочку "распознование картинки"и "автоматическая регистрация"(пробывал и по отдельности каждую ставить без раздницы)...
Захожу в свойство каталогов-> В которых возможна авторегистрация...
и в ней отображаеться всего 18 каталогв из 70...Почему? Я галочку ставил на всех и прогонял их сначало ручками...
Ставлю авторегистрацию и там тоже всего 18 каталогов...

P.S.: Читал всю тему нашел похожую ситуацию но там небыло ответа что именно надо делать...

К автоматической регистрации допускаются каталоги, для которых выполняются

следующие условия:

Установлена галочка "Автоматическая регистрация" (можно посмотреть, открыв окно редактирования каталога - последняя галочка, в нижней части формы); Судя по всему, в данном случае, все в порядке

Каталог распознан (установлена галочка "Распознан", при открытии каталога в браузере на закладках "каталог", "распознавание", "заполнение" установлена галочка "каталог распознан"; Если каталоги дейстивтельно распознавались, то и с этим пукнтом все должно быть ОК.

В схеме распознавания нет полей со свойством "Незаполняемое поле" (откройте каталог в браузере и на закладке "Распознавание" или "Заполнение" проверьте, нет ли для какого либо поля формы каталога соответствия со свойством "Незаполняемое поле") Скорее всего проблема именно в этом пункте. Проверьте, не установлены ли для полей каталогов это свойство.

Патриот:
Проблема в работе с Яндексом:
1. не находит обратные ссылки
2. не находит проиндексированные страницы
3. на работает импорт из SERP

В чем может быть проблема?

Сегодня обязательно разберемся, в чем может быть проблема

Небольшое, совсем маленькое обновление.

Теперь программа способна отыскать картинки, даже если они отображаются посредством modrewrite, например, такой урл site.ru/captcha/file1234.jpg будет корректно обработан. Описанная Mr.Smit проблема решена. Проблема с 16000 каталогами в одной папке теперь тоже не проблема - программа корректно перенесет все каталоги, которые она должна перенести.

Обновите свои копии программы.

Большой апдейт пока готовится...

slavy:
16 тыс. каталогов... не удаляет и не переносит в другую папку

Пока программа не способна "переварить" 16 тыс. каталогов за один подход, к следующему обновлению эту проблему устраним. На данный момент, могу посоветовать лишь разнести каталоги на несколько папок, для того, чтобы хватало оперативной памяти на просмотр такой огромной папки, установите какой-либо фильтр на какое-либо поле.

*Arc*:
Не плохо бы было добавить функцию анализа позиций в Гугле и Раме.

Это будет, над этим сейчас работаем

a-little-seo:
А кто-то недавно говорил, багов нету ))))))))))))))

Подобного я не говорил никогда, ибо прекрасно понимаю, что это практически не возможно. Сейчас нет или очень мало багов, которые мешают работе "в нормальном режиме", согласитесь 16 тысяч каталогов в одной папке - это не стандартная ситуация

Адвокат:
Папки с большим кол-вом каталогов обрабатываются со второго с третьего раза. Раздели 16 тыс. на 3-4 части и будет тебе счастье. Дело не в программе, похоже просто БД не может такой объем инфы переварить..

БД, естественно, способна перварить и в тысячи раз больше, пока программа не может одновременно совершать операции над подобными объемами данных, исправим к следующемму обновлению.

Wonder:
И снова по поводу моих любимых обратных ссылочек.
По яндексу на сайт 307 ссылок.
Смотрю через SST: заставил его искать раз 20, результаты были совершенно разные, от 97 до 300 ссылок. Хотелось бы разъяснения ситуации.
ЗЫ: напомню, нам еще бэки по Яху обещали, ждем-с.

Программа лишь ретранслирует результаты выдачи Яндекса, предлагаю задать N раз запрос на просмотр обратных ссылок и методично пройти по каждой странице выдачи - количество результатов будет разнится.

Google и Rambler будут. Скоро.

slavy:
Я бы давно уже разделил. Проблема в том, что я даже зайти в эту папку не могу, говорит недостаточно памяти, тоесть я НИЧЕГО с ней сделать не могу :(

Выберите любую другую папку, установите фильтрацию на какое-либо поле, например, на поле URL фильтр вида %.ru% перейдите в большую папку, в результате программа отобразит лишь каталоги в зоне .ru, видимо их будет не очень много и оперативной памяти хватит на выполнение этой операции. Выберите эти каталоги и перенесите их в другую папку, повторите процедуру, задав какой-либо другой фильтр.

slavy:
Кстати может кто пробовал, есть ли смысл обновить Firebird?

Лучше обновить, от релиза к релизу повышается как стабильность (хотя и так грех жаловаться) так и скорость работы БД.

slavy:
Я так понимаю с программой оно не обновляется...

Да, это довольно важный компонент системы, естественно SST автоматически его не обновляет (вдруг у Вас установлены другие приложения, использующие Firebird и не способные работать с новыми версиями)

vano:
не появилось еще такое мож пропустил - куда можно вписать списком якоря успешных регистраций, как в AllSubmitter, а то это как то не удобно реализованно

Пока такой возможности нет, скоро появится.

Mr.Smit:
У меня не работает распознание CAPTCHA каталогов при авто регистрации...
Проблемма в том что постоянно пишеться что картинка не найдена...
Может у кого такое было? Подскажите что делать.

Программа никогда подобного не пишет. Объясните подробнее, что именно происходит.

a-little-seo:
Вот у нас тут столько вопросов скопилось а разработчик наверное нам готовит сюрприз в виде апдейта раз непоявляеться в топике.

Естественно апдейт готовится :)

Доступно небольшое обновление.

Ничего революционного - пополнился набор ошибок в html коде, которые программа может игнорировать, повышена стабильность работы функций автоматической обработки каталогов (авто анализформ, авторегистрация, поиск битых ссылок, проверка на бан).

Надеюсь, абсолютное большинство проблем, о которых писали выше больше не повторится.

Anton:
Читаю внизу SEO броузера: "перетащите луппу на картинку". 🙅
Лупа (увеличительное стекло) пишется с одной буквой "п".

Обязательно поправим в следующем обновлении, досадная оплошность...

Адвокат:
у меня предложение к разработчикам, может быть пока возникают, хотя и редко, некоторые ошибки в программе, сделать так чтобы программа все данные об ошибках писала в файл?

К сожалению это не всегда возможно, но мы попробуем что-нить придумать.

-kost-:
Risht, у меня похожая проблема со "Страница Недоступна". отпишитесь плз о пути ее решения
cheboor:
Обе эти проблемы решаются путем запуска функции "Исправление URL".

чуть выше.

10 Греев.

Risht:
но я думаю дело не в базе

Зря.

Во-первых, url вида а(а кирилица)rsе(е кирилица)nа(а кирилица)lа(а кирилица)rt.ru не является корректным http адресом.

Во-вторых, http адрес должен начинаться с указания протокола, в данном случае http://arsenalart.ru

Обе эти проблемы решаются путем запуска функции "Исправление URL". После работы этой функции большинство присланных Вами каталогов корректно проходят проверку на битые ссылки. Те, что не проходят - битые ссылки, преимущественно код 404 (страница не доступна)

Risht:
а мне что делать непроверяет он у меня битые ссылки

Вы можете прислать те каталоги (в txt, xml или весь файл base.gdb) на support@smile-group.ru? Я обязательно разберусь с проблемой, если я смогу ее воспроизвести.

solarcoast:
cheboor, может быть вы выложите эту самую прекрасно работающую версию, которая действительно! работает с автоматическим распознованием сохранением распознанного и автоматической регистрацией и с пакетной обработкой чего-либо .. = будем признательны

Та самая версия сейчас лежит на сервере.

Поймите, интернет большой. Соединения у пользователей программы разные. У меня ни разу не возникло ситуации с зависшим потоком. Я почти уверен, что проблема целиком и полностью обусловлена скоростью и качетсвом канала. Более того, я уверен, что поток не зависает, а очень медленно, но все таки скачивает запрашиваемую страницу. У программы есть два таймаута соединений. Один - на установление соединения, он срабатывает как только пройдет X милисекунд, а поток не сможет подключиться к Web серверу. Второй таймаут - таймаут на чтение. Заметьте, не на получение всей страницы, а именно на чтение. Этот таймаут заставит программу прекратить дальнейшие попытки загрузки страницы если за Y милискенд не будет получена ОЧЕРЕДНАЯ порция данных. Проблема с "зависшим" потоком, судя по всему, была обусловлена или плохим качеством канала пользователя, или плохим хостером того каталога, на котором "висла" программа.

Далее, Вы наверно замечали, что в последнее время вебмастера игнорируют очень и очень многие постулаты HTML? При работе с "нормальными" каталогами, т.е. HTML код которых или удовлетворяет спецификации, или содержит лишь те ошибки, которые программа уже умеет игнорировать, программа не ошибается. Попробуйте хотя бы на той базе данных, которая идет в комплекте с демонстрационной версией программы. Если у Вас программа не работает, зависает, вылетает, etc, то, пожалуйста, стукните мне в асю, попробуем вместе найти тот самый каталог, HTML код которого не способен переварить наш парсер. Мы научим наш парсер обрабатывать еще и эту ошибку, и программа перестанет не работать, зависать, вылетать, etc.

Risht:
у меня и таки стоит 5 потоков, а вот значение таймаута изменять и при чтении и при соеденении?

Да, даже можно таймаут на чтение поставить более низким, например, 5 000.

Risht:
и такой вопрос: автоматическое распознование форм работает?

Я не смог заставить его не работать :) Будем разбираться, где еще могла возникнуть ошибка.

Всего: 407