- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Что делать, если ваша email-рассылка попала в спам
10 распространенных причин и решений
Екатерина Ткаченко
В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Ylich, я подправил свой пост. Пример запуска есть.
./перл_скрипт.pl ваш_файл.txt
В моем примере 1 миллион коротких строк.
---------- Добавлено 04.05.2014 в 02:07 ----------
т.е. будет выполнятся с пол часа если не больше в вашем случае. Нагрузка на все ядра ))
---------- Добавлено 04.05.2014 в 02:08 ----------
И создаст файл out_ваш_файл.txt.
WapGraf, супер, все работает отлично, спасибо огромное
Ylich, был рад помочь!
perl вариант быстрее, потому что без сортировки.
iHead, и в отличии от bash не дает сбоев в зависимости от кодировки.
Да и ТС не просил сортировку сделать.
Всё же интересно, почему не сработали uniq и sort.
Полагаю, всё надо делать в utf8.
Полагаю, sh/csh/tcsh отработает более предсказуемо.
perl вариант быстрее, потому что без сортировки.
а как выкинуть дубли без сортировки ?:)
Всё же интересно, почему не сработали uniq и sort.
Полагаю, всё надо делать в utf8.
Полагаю, sh/csh/tcsh отработает более предсказуемо.
Так и есть. Во всяком случае именно с utf8 никогда проблем не возникало, а вот с другими кодировками бывает.
а как выкинуть дубли без сортировки ?:)
товарищ просто время замерял. решения сильно разные, чтобы их сравнивать.