Вопросы новичков. Часть 3

S
На сайте с 24.10.2014
Offline
63
#651
shurik0:
Найти:

^(.*)$

Заменить на:

{\1}

shurik0, не работает.

shurik0
На сайте с 07.01.2011
Offline
301
#652
Shmalex:
shurik0, не работает.

У меня работает .... 😕

jpg 160395.jpg
Качественный хостинг по низкой цене. (http://goo.gl/MpjbKi)
AESCBC192
На сайте с 11.06.2016
Offline
51
#653

^(.*)$

в регэкспх - это обзначение любого символа

^ - начало строки

$ конец строки

если рашириртель ism - то берет весь текст в строку и вытащищь ты по итогу тоже весь текст.


preg_match_all( "~\S+?(search-sequence)\s{1}~ism" , $text , $searched );

// искомая последовательность
$a = $searched[ 1 ];

// полное вхождение
$b = $searched[ 0 ];

по регксапам есть таблица понятная

замена - это

preg_replace( "~\S+?(search-sequence)\n~ism" , "\$1" ,$text );

заменит строку на значение первой скобки (1 - номер скобки).

вообще регэксп полезная вещь, снимающая потребность во всяких нагроможденных DOM-парсерах которые еще и не всегда совместимы с проприетарной лицензией, вобщем рекомендую один раз выучить табличку, там не так много конструкций частоупотребляемых.

PS и лучше под перебор листов накидывать простенький скрипт - быстрее получается, перебирать отдельной тулзой негибко и громоздко очень.

realefs
На сайте с 27.06.2010
Offline
87
#654
shurik0:
У меня работает .... 😕

пара программ, копипаст с форума не принимает. если это же самое ввести руками, отрабатывает

з.ы. я бы не использовал жадный квантификатор, отдельные проги пример выше воспринимают как "от начала файла и до конца файла", а не "от начала строки и до конца строки"

^(.*?)$
Рубероид дорожает.
AESCBC192
На сайте с 11.06.2016
Offline
51
#655

кватификатор лучше типа {3,140}

M
На сайте с 18.10.2006
Offline
185
#656

Посоветуйте быстрый синоминизатор). На большие объёмы.

Кому-то - асерет-а-диброт, а кому-то - хатуль мадан. Вам выбирать!
[Удален]
#657
MO $$$:
Посоветуйте быстрый синоминизатор). На большие объёмы.

у меня есть англоязычный. нейронка + словарь. не предлагаю, хвастаюсь

AESCBC192
На сайте с 11.06.2016
Offline
51
#658

нейронка - это однослойный сатанализатор типа word2vec сейчас так называется?

---------- Добавлено 17.02.2017 в 23:57 ----------

что касается конструктива то можно собрать на word2vec синонимаз нормальный, но смысл, когда полно сервисов включая свой миксер на основе фри транслейтеров, который реализовать намного проще чем возиться с word2vec самому.

[Удален]
#659
AESCBC192:
нейронка - это однослойный сатанализатор типа word2vec сейчас так называется?

---------- Добавлено 17.02.2017 в 23:57 ----------

что касается конструктива то можно собрать на word2vec синонимаз нормальный, но смысл, когда полно сервисов включая свой миксер на основе фри транслейтеров, котрый реализовать намного проще чем возиться с word2vec самому.

я в твоей терминологии не разбираюсь. я взял готовую либу, взял модели, взял словарь. нейронка разбивает текст на токены, определяет части речи, ищет именованные сущности. далее существительное, к пример, заменяется существительным из синонимов из словаря. имя человека на другое имя, название места на другое название. я пробовал обучать нейронку переводу с английского на немецкий, обучилась. но пока отложил это дело, медленно

AESCBC192
На сайте с 11.06.2016
Offline
51
#660

Тк это проще делается зачем нейронка когда есть готовые словари под это с мофграмматическими каркасами под языки разные. Я почему-то подумал что речь идет о грамотном подходе где каждое слово стаистическивзвешивается и ему подбирается наиболее частотноблизкое из словарая синонимов)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий