Как можно сделать подобное быстро?

660

Бумеранг777

15 февраля 2014, 16:09

952

Такая задача стоит, есть файлы с содержимым такого вида:

слово слово словонужное слово слово слово

Более 300 000 строчек и всё в кучу. Необходимо колонку "словонужное" как то извлеч. Как разбить файл на колонки это ясно, эксель от майкрософта обрабатывает только около 50 000 строчек. Аналог экселя LibreOffice 4.2 виснет даже при 50 000 строчек. Нотепад++ не подошёл, или я им тут пользоваться не умею.

Какие то трюки есть кроме перечисленных?

Бурж хостинг ( https://vk.cc/8kDAui ) - Разрешён адалт. Секс по телефону ( https://vk.cc/6u7YCX ) - Мужской трафик конвертит на ура. Адалт дейтинг ( https://vk.cc/bZlb2J ) - Смарлинк с высоким EPM

171

kaskentbobel

15 февраля 2014, 16:58

#1

Бумеранг777:
Такая задача стоит, есть файлы с содержимым такого вида:
слово слово словонужное слово слово слово
Более 300 000 строчек и всё в кучу. Необходимо колонку "словонужное" как то извлеч.

Через excel в 6-7 заходов - не катит?

GC

159

GKC

15 февраля 2014, 17:03

#2

Написать/использовать парсер

Автоматическое удаление информации (http://www.gkclab.com/russ/terminator/terminator.html) ... Мистический туризм (http://mystictourism.com/) в гости к призракам...

R1

64

rec108

15 февраля 2014, 17:30

#3

notepad++

что ищем ^\w*\s\w*\s(\w*).*

чем заменить $1

поставить галку "регулярное выражение"

как то так

N1

83

ns13

15 февраля 2014, 17:42

#4

В 2007 Excel размер листа 1 048 576 строк и 16 384 столбца.

Оптимизатор широкого профиля

540

humbert

15 февраля 2014, 17:57

#5



$a_strings=file("file.txt");
foreach($a_strings as $value)
{$a_words=explode(" ", $value);
 echo $a_words[2]."<br />";
}

---------- Добавлено 15.02.2014 в 21:59 ----------

***91; и ***93; это скобки

[]

Парсинг прайс-листов, наполнение интернет-магазина товаром. (https://humbert.ru) Любая CMS (Битрикс, OpenCart, Prestashop и даже Woo Commerce )

-S

1356

-= Serafim =-

15 февраля 2014, 18:06

#6

В notepad ++ открыть замену и "слово" заменить на пустое.

208

БОЧ рВФ 260602

15 февраля 2014, 18:11

#7

-= Serafim =-:
В notepad ++ открыть замену и "слово" заменить на пустое.

:)

ТС имеет наверное в виду вот это:

слово1 слово2 словонужное1 слово3 слово4 слово5

слово6 слово7 словонужное2 слово8 слово9 слово10

слово11 слово12 словонужное3 слово13 слово14 слово15

слово16 слово17 словонужное4 слово18 слово19 слово20

слово21 слово22 словонужное5 слово23 слово24 слово25

не?

Обновление Google Panda Исследование: показатели кликабельности в Google приступил к плавному

-S

1356

-= Serafim =-

15 февраля 2014, 18:13

#8

БОЧ рВФ 260602:
:)

ТС имеет наверное в виду вот это:

слово1 слово2 словонужное1 слово3 слово4 слово5
слово6 слово7 словонужное2 слово8 слово9 слово10
слово11 слово12 словонужное3 слово13 слово14 слово15
слово16 слово17 словонужное4 слово18 слово19 слово20
слово21 слово22 словонужное5 слово23 слово24 слово25

не?

Значит он не умеет формулировать. В стартпосте все слова одинаковые.

1

540

humbert

15 февраля 2014, 18:25

#9

5 столбцов, нужный столбец 3-ий

Разбиваем на строки, выдираем из каждой строки третье слово

---------- Добавлено 15.02.2014 в 22:35 ----------

p.s. делаем из текста одну строку, разбиваем на массив слов (по пробелам), каждое третье слово наше.

SI

130

Sigmo#ID

15 февраля 2014, 21:00

#10

# xclip -o или xsel -o выводит содержимое буфера обмена.

$ xclip -o
слово слово словонужное слово слово слово
слово слово словонужное слово слово слово
слово слово словонужное слово слово слово
слово слово словонужное слово слово слово
слово слово словонужное слово слово слово

$ xclip -o | awk '{print $3}'
словонужное
словонужное
словонужное
словонужное
словонужное

$ xclip -o | cut -d ' ' -f 3
словонужное
словонужное
словонужное
словонужное
словонужное

xclip заменяется на

cat file.txt | ...

-= Онлайн сервисы =-

Все что нужно знать о DDоS-атаках грамотному менеджеру

Курс биткоина превысил $50 тысяч