юни

юни
Рейтинг
933
Регистрация
01.11.2005
DecAnisimov:
Какой фильтр используется

Раз программе приходится просматривать весь список, то любой, я полагаю. Можете проверить самостоятельно, у меня теперь новая ошибка - не могу открыть файл \temp.52043 (цифры могут быть другими, точно не помню). Т.е. даже до анализа теперь дело не доходит.

Скачиваемый список - домены в зоне ru через r01 или reghouse.

Надо начинать тогда. Наполнение и всё остальное.

1. Можно подробно описать процесс, который происходит после выбора команды "Скачать"? При условии, что мы хотим обработать его фильтром, который отсекает домены с PR меньше или равному 3.

2. Схема "полное скачивание, потом обработка" сейчас малорациональна. К примеру, чтобы выудить освобождающиеся в течение 15 дней .ru домены, мне нужно скачать весь список (из более чем трёх миллионов имён), после чего обработать каждое из них.

Софт забирает больше 2Гб памяти и виснет, не выполнив и десятой части работы. На этой же машине я могу открыть древний Access, внутри которого отсортировать распакованный partner.r01.ru/ru_domains.gz по пятой (или какой там) колонке примерно за 2-3 минуты, после чего копипастом дать чекеру итог из 3-7 тысяч доменов.

Соответственно, зачем нужны функции, которые всё равно приходится дублировать через сторонние программы и прочие костыли? Есть способы получить нужные доли процента данных не скачивая и/или не обрабатывая весь их массив?

Если программа ещё не знает о структуре файла, как она поймёт, какой фильтр подходит для пользовательской задачи?

DecAnisimov:
Фильтрация возможна по любым данным, присутствующим в скачиваемом файле

А если в фильтре есть условия, по которым нет информации в файле, тогда как?

DecAnisimov:
При декодировке

Я имею в виду - до полного скачивания. Или так не получится?

Кстати, такая ошибка появляется в Win 7 - "Cannot create file "E:\Program Files\MyDomainCheker\temp". Отказано в доступе". Как решить? Можно указать программе использовать общую временную папку?

sear4er:
Он прикалывается

С каким направлением деятельности она связана, на данном этапе можно сказать?

Redbaron_chaos:
Так как платники по выращиванию

Т.е. это партнёрки, смс и прочее?

А, отлично. Кстати, такой вопрос - в некоторых подобных файлах зашита дата (или несколько дат) для доменов - можно ли на основе этих цифр скачивать не весь файл, а какой-то определённый диапазон?

К примеру, в виде опции (скажем, к "Скачать" - "RU" - "reghouse.ru" - "Домены в зоне RU") "скачать только домены, зарегистрированные в предыдущем месяце"? Или сделать отдельную настройку, в которой выбирать дату (или диапазон дат) и тип доменов (зарегистрированные, освобождающиеся, свободные и пр.).

Collapse:
явно где-то валяются в паблике

Подскажите ссылку кто-нибудь.

Всего: 34981