Молодой человек, я надеюсь Вы разобрались, что проблема была не в программе, а в неправильно распознанной базе? Автоматическая регистрация корректно работает с captcha. Во всяком случае, мне не известен ни один случай, когда бы программа ошибалась.
Для форсирования процесса решения своих проблем, впредь советую высказывать больше уважения собеседнику и использовать какой-либо один способ связи.
Сегодня мы смогли найти еще один тип ошибок в html коде (спасибо proffoto), который вызывает безапеляционное закрытие программы, в ближайшем обновлении научим программу корректно работать с подобными страничками.
Вы считаете это время критичным?
Действительно в последние дни обновились те же самые файлы.
К автоматической регистрации допускаются каталоги, для которых выполняются
следующие условия:
Установлена галочка "Автоматическая регистрация" (можно посмотреть, открыв окно редактирования каталога - последняя галочка, в нижней части формы); Судя по всему, в данном случае, все в порядке
Каталог распознан (установлена галочка "Распознан", при открытии каталога в браузере на закладках "каталог", "распознавание", "заполнение" установлена галочка "каталог распознан"; Если каталоги дейстивтельно распознавались, то и с этим пукнтом все должно быть ОК.
В схеме распознавания нет полей со свойством "Незаполняемое поле" (откройте каталог в браузере и на закладке "Распознавание" или "Заполнение" проверьте, нет ли для какого либо поля формы каталога соответствия со свойством "Незаполняемое поле") Скорее всего проблема именно в этом пункте. Проверьте, не установлены ли для полей каталогов это свойство.
Сегодня обязательно разберемся, в чем может быть проблема
Небольшое, совсем маленькое обновление.
Теперь программа способна отыскать картинки, даже если они отображаются посредством modrewrite, например, такой урл site.ru/captcha/file1234.jpg будет корректно обработан. Описанная Mr.Smit проблема решена. Проблема с 16000 каталогами в одной папке теперь тоже не проблема - программа корректно перенесет все каталоги, которые она должна перенести.
Обновите свои копии программы.
Большой апдейт пока готовится...
Пока программа не способна "переварить" 16 тыс. каталогов за один подход, к следующему обновлению эту проблему устраним. На данный момент, могу посоветовать лишь разнести каталоги на несколько папок, для того, чтобы хватало оперативной памяти на просмотр такой огромной папки, установите какой-либо фильтр на какое-либо поле.
Это будет, над этим сейчас работаем
Подобного я не говорил никогда, ибо прекрасно понимаю, что это практически не возможно. Сейчас нет или очень мало багов, которые мешают работе "в нормальном режиме", согласитесь 16 тысяч каталогов в одной папке - это не стандартная ситуация
БД, естественно, способна перварить и в тысячи раз больше, пока программа не может одновременно совершать операции над подобными объемами данных, исправим к следующемму обновлению.
Программа лишь ретранслирует результаты выдачи Яндекса, предлагаю задать N раз запрос на просмотр обратных ссылок и методично пройти по каждой странице выдачи - количество результатов будет разнится.
Google и Rambler будут. Скоро.
Выберите любую другую папку, установите фильтрацию на какое-либо поле, например, на поле URL фильтр вида %.ru% перейдите в большую папку, в результате программа отобразит лишь каталоги в зоне .ru, видимо их будет не очень много и оперативной памяти хватит на выполнение этой операции. Выберите эти каталоги и перенесите их в другую папку, повторите процедуру, задав какой-либо другой фильтр.
Лучше обновить, от релиза к релизу повышается как стабильность (хотя и так грех жаловаться) так и скорость работы БД.
Да, это довольно важный компонент системы, естественно SST автоматически его не обновляет (вдруг у Вас установлены другие приложения, использующие Firebird и не способные работать с новыми версиями)
Пока такой возможности нет, скоро появится.
Программа никогда подобного не пишет. Объясните подробнее, что именно происходит.
Естественно апдейт готовится :)
Доступно небольшое обновление.
Ничего революционного - пополнился набор ошибок в html коде, которые программа может игнорировать, повышена стабильность работы функций автоматической обработки каталогов (авто анализформ, авторегистрация, поиск битых ссылок, проверка на бан).
Надеюсь, абсолютное большинство проблем, о которых писали выше больше не повторится.
Обязательно поправим в следующем обновлении, досадная оплошность...
К сожалению это не всегда возможно, но мы попробуем что-нить придумать.
чуть выше.
10 Греев.
Зря.
Во-первых, url вида а(а кирилица)rsе(е кирилица)nа(а кирилица)lа(а кирилица)rt.ru не является корректным http адресом.
Во-вторых, http адрес должен начинаться с указания протокола, в данном случае http://arsenalart.ru
Обе эти проблемы решаются путем запуска функции "Исправление URL". После работы этой функции большинство присланных Вами каталогов корректно проходят проверку на битые ссылки. Те, что не проходят - битые ссылки, преимущественно код 404 (страница не доступна)
Вы можете прислать те каталоги (в txt, xml или весь файл base.gdb) на support@smile-group.ru? Я обязательно разберусь с проблемой, если я смогу ее воспроизвести.
Та самая версия сейчас лежит на сервере.
Поймите, интернет большой. Соединения у пользователей программы разные. У меня ни разу не возникло ситуации с зависшим потоком. Я почти уверен, что проблема целиком и полностью обусловлена скоростью и качетсвом канала. Более того, я уверен, что поток не зависает, а очень медленно, но все таки скачивает запрашиваемую страницу. У программы есть два таймаута соединений. Один - на установление соединения, он срабатывает как только пройдет X милисекунд, а поток не сможет подключиться к Web серверу. Второй таймаут - таймаут на чтение. Заметьте, не на получение всей страницы, а именно на чтение. Этот таймаут заставит программу прекратить дальнейшие попытки загрузки страницы если за Y милискенд не будет получена ОЧЕРЕДНАЯ порция данных. Проблема с "зависшим" потоком, судя по всему, была обусловлена или плохим качеством канала пользователя, или плохим хостером того каталога, на котором "висла" программа.
Далее, Вы наверно замечали, что в последнее время вебмастера игнорируют очень и очень многие постулаты HTML? При работе с "нормальными" каталогами, т.е. HTML код которых или удовлетворяет спецификации, или содержит лишь те ошибки, которые программа уже умеет игнорировать, программа не ошибается. Попробуйте хотя бы на той базе данных, которая идет в комплекте с демонстрационной версией программы. Если у Вас программа не работает, зависает, вылетает, etc, то, пожалуйста, стукните мне в асю, попробуем вместе найти тот самый каталог, HTML код которого не способен переварить наш парсер. Мы научим наш парсер обрабатывать еще и эту ошибку, и программа перестанет не работать, зависать, вылетать, etc.
Да, даже можно таймаут на чтение поставить более низким, например, 5 000.
Я не смог заставить его не работать :) Будем разбираться, где еще могла возникнуть ошибка.