zuziken

Рейтинг
182
Регистрация
01.06.2008

В начале сентября постараюсь выпустить новую версию базы, учтя все комментарии и отзывы по этой версии. Будет добавлены и удалены ненужные каталоги.

Так же работаю над созданием базы каталогов статей :)

Удалил из базы 29 каталогов провереные по своему свежему серому списку из 1200 каталогов.

Тема про серый список здесь /ru/forum/261770

Уважаемый!

Это база белых каталогов, если бы была база досок обьявлений, то так бы и указал.

Как я уже говорил базу обновляю путем парсинга.

Но, дело в том, что при парсинге в запросе указывается часть адреса или слова для поиска, похожие как у досок обьявлений и каталогов.

Например:

  • inurl:"add.php" intext:Добавить сайт site:.ru
  • inurl:/?act=s_add

После просмотра можно заметить, что в выдаче присутствует некоторое количество досок обьявлений.

Существует ещё много признаков по которым можно вести парсинг. И всё таки иногда и попадаются. В следующем обновлении базы все доски обьявлений перенесу в отдельную категорию и будут поставляться с базой в придачу. Всего насчитал 80 досок обьявлений.

По идее база раньше насчитывала около 10к каталогов, но после многочисленных прогонов вручную проходилась категория позже и плохо и удалялись в чёрный список каталоги требующие обратки!

Обратите винмание, что удалялись только те каталоги, которые требуют обратку, но оставлялись те которые только просят её, в итоге 95% таких каталогов установят ссылку.

Почему не 100%? Потому, что есть вероятность, что такие каталоги под просьбой подразумевают обязательное требование установки. В итоге такие могут и не поставить ссылку.

База проверялась по различным чёрным спискам, но всё же я не могу полностью подстроиться под всё в интернете блэк-листы!!! Каталоги постоянно умирают и оживают и появляются новые. Кто-то прогонял сайт и каталог попал в плохо с ошибкой 404 или было выставлено много потоков и каталог не успел загрузиться, на следующий день другой прогонял - каталог ожил, просто были допустим неполадки на сервере. В итоге у одного каталог будет в чёрном списке, а другого нет.

Думаю я популярно и подробно обьяснил свою точку зрения?! :)

База постоянно обновляется и чистится. Нумерации нет. Но, идёт подсчёт по дате выпуска базы.

Приятная в работе программа. Пользуюсь только ей. Желаю дальнейших успехов в развитии программы :)

Благодарю за отзыв, буду дальше работать над базой. Учту при подготовке следующей версии :)

Rishpik:
выкинуть я её не могу, как убрать проблемные каты? в них ведь трабла?

Какая версия? Возможно у тебя каталоги от разных версий AS

Попробуй ковертером сделать их под одну версию.

Вот ссылка на конвертер баз 4.9 и 4.8 - в 4.7 http://zuziken.ru/soft/ASD4_konverter.rar

Бекап не забудь сделать и посмотри как будет работать. После этого возможно каталоги которые были проблемные будут уходит в категорию плохо с сообщением "нет распознанной формы" или т.п.

Их можно отдельно ручками.

То, что у тебя вылетает ошибка памяти, у меня было такое из-за того, что стояли две разные планки памяти и они конфликтовали между собой. Поменял на новые одной фирмы и всё нормально стало :)

+ 23 и то, которые под полуавто. Но, всё равно спасибо

Интересно в какую сумму обошёлся подъём на вершину?

Эххх не зря говорять: "Реклама - двигатель торговли" :)

xeleron благодарю за подробный отзыв :)

В позже ушло столько т.к твой сайт уже зарегистрирован в них или неправильно каптча - посмотри их.

То, что в плохо ушло - прогони ещё раз и поставь количество потоков меньше. Бывает не успевают загрузиться и уходят с сообщением 404

Сегодня прогонял свой сайт - позже было около 100 и даже меньше.

Писем мне на ящик в почтовом сервере yandex.ru по крайней мере пришло почти 500. Возможно позже придёт ещё некоторое количество писем.

Да и письма ещё не показатель, смысл если придёт 1000, а из них половина будут просить обратку?!

Со всеми кто просил за отзыв, связался по ICQ

Отзывы и ответы на вопросы там же :)

Всего: 3484