Как можно сделать подобное быстро?

12
Бумеранг777
На сайте с 08.02.2009
Offline
660
935

Такая задача стоит, есть файлы с содержимым такого вида:

слово слово словонужное слово слово слово

слово слово словонужное слово слово слово

слово слово словонужное слово слово слово

слово слово словонужное слово слово слово

слово слово словонужное слово слово слово

Более 300 000 строчек и всё в кучу. Необходимо колонку "словонужное" как то извлеч. Как разбить файл на колонки это ясно, эксель от майкрософта обрабатывает только около 50 000 строчек. Аналог экселя LibreOffice 4.2 виснет даже при 50 000 строчек. Нотепад++ не подошёл, или я им тут пользоваться не умею.

Какие то трюки есть кроме перечисленных?

Бурж хостинг ( https://vk.cc/8kDAui ) - Разрешён адалт. Секс по телефону ( https://vk.cc/6u7YCX ) - Мужской трафик конвертит на ура. Адалт дейтинг ( https://vk.cc/bZlb2J ) - Смарлинк с высоким EPM
kaskentbobel
На сайте с 24.09.2012
Offline
171
#1
Бумеранг777:
Такая задача стоит, есть файлы с содержимым такого вида:
слово слово словонужное слово слово слово
Более 300 000 строчек и всё в кучу. Необходимо колонку "словонужное" как то извлеч.

Через excel в 6-7 заходов - не катит?

GC
На сайте с 09.04.2007
Offline
159
GKC
#2

Написать/использовать парсер

Автоматическое удаление информации (http://www.gkclab.com/russ/terminator/terminator.html) ... Мистический туризм (http://mystictourism.com/) в гости к призракам...
R1
На сайте с 24.06.2009
Offline
64
#3

notepad++

что ищем ^\w*\s\w*\s(\w*).*

чем заменить $1

поставить галку "регулярное выражение"

как то так

N1
На сайте с 14.05.2009
Offline
83
#4

В 2007 Excel размер листа 1 048 576 строк и 16 384 столбца.

Оптимизатор широкого профиля
humbert
На сайте с 16.03.2006
Offline
540
#5



$a_strings=file("file.txt");
foreach($a_strings as $value)
{$a_words=explode(" ", $value);
echo $a_words[2]."<br />";
}


---------- Добавлено 15.02.2014 в 21:59 ----------

***91; и ***93; это скобки

[]

Парсинг прайс-листов, наполнение интернет-магазина товаром. (https://humbert.ru) Любая CMS (Битрикс, OpenCart, Prestashop и даже Woo Commerce )
-S
На сайте с 10.12.2006
Offline
1354
#6

В notepad ++ открыть замену и "слово" заменить на пустое.

БОЧ рВФ 260602
На сайте с 27.01.2010
Offline
201
#7
-= Serafim =-:
В notepad ++ открыть замену и "слово" заменить на пустое.

:)

ТС имеет наверное в виду вот это:

слово1 слово2 словонужное1 слово3 слово4 слово5

слово6 слово7 словонужное2 слово8 слово9 слово10

слово11 слово12 словонужное3 слово13 слово14 слово15

слово16 слово17 словонужное4 слово18 слово19 слово20

слово21 слово22 словонужное5 слово23 слово24 слово25

не?

-S
На сайте с 10.12.2006
Offline
1354
#8
БОЧ рВФ 260602:
:)

ТС имеет наверное в виду вот это:

слово1 слово2 словонужное1 слово3 слово4 слово5
слово6 слово7 словонужное2 слово8 слово9 слово10
слово11 слово12 словонужное3 слово13 слово14 слово15
слово16 слово17 словонужное4 слово18 слово19 слово20
слово21 слово22 словонужное5 слово23 слово24 слово25


не?

Значит он не умеет формулировать. В стартпосте все слова одинаковые.

humbert
На сайте с 16.03.2006
Offline
540
#9

5 столбцов, нужный столбец 3-ий

Разбиваем на строки, выдираем из каждой строки третье слово

---------- Добавлено 15.02.2014 в 22:35 ----------

p.s. делаем из текста одну строку, разбиваем на массив слов (по пробелам), каждое третье слово наше.

SI
На сайте с 03.12.2007
Offline
130
#10

# xclip -o или xsel -o выводит содержимое буфера обмена.

$ xclip -o
слово слово словонужное слово слово слово
слово слово словонужное слово слово слово
слово слово словонужное слово слово слово
слово слово словонужное слово слово слово
слово слово словонужное слово слово слово

$ xclip -o | awk '{print $3}'
словонужное
словонужное
словонужное
словонужное
словонужное

$ xclip -o | cut -d ' ' -f 3
словонужное
словонужное
словонужное
словонужное
словонужное

xclip заменяется на

cat file.txt | ...

-= Онлайн сервисы =-
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий