BaseFix - приемы работы с базами каталогов

12
[Удален]
#11

Опции выдачи

1) Выдавать в новом формате xml

База по умолчанию выдается в наиболее совместимом и простом в использовании формате 2.5, которую понимают все сабмитеры (любой версии). Если у вас новая база и нужно сохранить в ней особые поля, например, поля авторегистрации и пр., включите выдачу в новом формате. В остальных случаях удобнее получать базу в формате 2.5., т.к. он гораздо меньше весит.

2) Очистить описания

После всех манипуляций будут очищены поля описаний для всех каталогов в базе. Именно после, а не перед началом, поэтому если хотите использоваться какие-то сканирования, лучше сперва одним проходом очистить поля, а потом сканировать, иначе затрется результат.

3) Очистить заголовки

Аналогично предыдущему - очищает заголовки для всех каталогов в базе. Удобно, чтобы убрать мусор из чужой базы.

4) При очистке не трогать тИЦ и OK.RUS

При очистке комментариев или заголовков не будут стираться просканированные тИЦ и пометки на "русскость" каталога (что он русский). Все остальное сотрется.

5) Копировать данные в заголовок

В некоторых версиях сабмитера было сделано так, что неудобно видеть комментарии их просто не было видно в таблице, нужно было кликать чтобы посмотреть. Для удобства можно включить эту опцию и перенести все, что в комментариях (тИЦ, OK.RUS и пр.) в заголовок.

6) Показывать удаленные каталоги

Очнь важная опция, позволяет после чистки базы (удаления из нее части каталогов по некоторым фильтрам) видеть в отделном окне всех удаленных. Выше было описано как это используется при логике множеств.

7) Показывать подробную статистику

Сама по себе полезная опция - подсчитает статистику по базе, очень показательно для оценки, особенно если до этого для базы просканировали тИЦ и PR. Пример как выглядит статистика:

PR/количество: 0/591 1/39 2/66 3/93 4/56 5/26 6/1 7/0 8/0 9/0
PR1-3: 198, PR3-6: 176, PR6-9: 1, среднее PR=0.9
Неизвестных тИЦ: 0, min тИЦ=300, max тИЦ=185000, средний тИЦ=1253.2
тИЦ0: 0, тИЦ1-100: 0, тИЦ100-500: 333, тИЦ500-1000: 347, тИЦ>1000: 192
При PR>=3 -- тИЦ>=100: 176, тИЦ>=300: 176 тИЦ>=500: 132
При PR>=4 -- тИЦ>=300: 83
(PR/ср.тИЦ) : 0/1392.9 1/1051.9 2/656.4 3/757.2 4/1071.4 5/1965.3 6/3700 7/0 8/0 9/0
Доменов 3 и более уровня: 191, отличных от RU: 206, из них точно русских: 206
Каталогов, подготовленных под автозаполнение: 0

8) Добавлять в комментарии причину удаления

В комментариях к удаленным каталогам будет прописана причина удаления. Удобно если сразу работают несколько фильтров и надо узнать какой каталог почему выбыл.

9) Удалять каталоги с неопределенным тИЦ

Сущий пустяк, просто из базы удалятся все каталоги для которых тИЦ не определены. Так можно быстро взять их базы чт оготово, а остатки потом обработать.

10) Выдавать базы в текстовом формате (ulr only)

Полезная опция для импорта базы в другие программы-анализаторы и пр. Выдает построчно все URL из базы в чистом виде, получаестя текстовыф файл с базой. Только последнии версии сабмитера позволяют делать аналогичное, можно только догадываться почему раньше они об этом не подумали :-)

11) Выдавать шифр базы для сравнения с другими

Будет выдача шифрованная база, которую можно смело давать другим людям для проверки сколько для них там новых каталогов, и не бояться, что они ей воспользуются.

Подробнее об этой большой теме тут - http://web-gid.ru/tools/basecript.phtml

.

W
На сайте с 05.09.2006
Offline
87
#12

Забанили алдика за что-то, передать сообщения можно через меня.

... тут могла быть ваша реклама ... ))
W
На сайте с 05.09.2006
Offline
87
#13

Завтра стоимость утилиты будет увеличена. Старая цена действует еще сутки.

Z
На сайте с 03.07.2003
Offline
108
#14

Просто хотела сказать спасибо разработчику за невероятно быстрый ответ - увидела, что есть обновленная версия, послала письмо, пока читала этот форум - уже пришел ответ и с обновлениями и еще с кучей полезных вещей.

W
На сайте с 05.09.2006
Offline
87
#15

Всегда пожалуйста, работаем непокладая рук, постоянно расширяем ассортимент и возможности, так что периодически навещайте сайт программы...

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий