Помогите очистить список от дубликатов

Оу!
На сайте с 19.12.2007
Offline
239
858

Здравствуйте.

У меня вот такая, кажется, необычная проблема, очень прошу помочь:

Требуется составить список страниц, на которые были переходы за последний месяц, и запросов, по которым было наибольшее кол-во переходов (по 1 запросу для каждой страницы).

Собрал список всех страниц и ключевых слов, по которым были переходы на них с поисковиков. Отсортировал список в порядке убывания начиная с ключевых слов, по которым было наибольшее кол-во переходов.

Получил что-то наподобие:

site.ru/index1.html - кубики

site.ru/index1.html - рубики
site.ru/index3.html - квадратики
site.ru/index1.html - нулики
site.ru/index3.html - солдатики

Теперь мне требуется подчистить этот список так, чтобы для каждой страницы остался только 1 наиболее посещаемых поисковой запрос, то есть получить на выходе следующее:

site.ru/index1.html - кубики

site.ru/index3.html - квадратики

Подскажите какими средства можно решить поставленную мной задачу?? Может быть Excel может удалить все кроме первой найденной строки, которые содержат одинаковое значение в одном из столбиков??

Или есть другая программа, способная мне помочь??

Или посоветуйте другой способ.

Заранее спасибо!

Купить мобильные прокси со скидкой 20%: https://surl.li/eijqnt
MK
На сайте с 02.05.2005
Offline
165
#1

sort < stat.txt | uniq -c | sort -nr | awk '{if (!page[$2]++)print}'

Оу!
На сайте с 19.12.2007
Offline
239
#2

m@ksim, простите, а где эту команду выполнить?? это на Linux'e чтоли??

MK
На сайте с 02.05.2005
Offline
165
#3

Да, или на любом другом юниксе.

Оу!
На сайте с 19.12.2007
Offline
239
#4

спасибо, m@ksim! проблема решена.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий