Идите по html-коду от начала до конца. Натыкаетесь на слово, проверяете не находится ли оно в списке активных - Курилка

хочу автоматом заменить все словоформы одного слова на этоже только обрамленного тего

Miracle · 2008-04-05T09:01:42.0000000Z

хочу автоматом заменить все словоформы одного слова на этоже только обрамленного тегом как это сделать самое первое что пришло в голову это ворд, он может работать с словоформами, Например слов^$ надо заменить на слов^$ как это сделать. Рассмотрю любые варианты, можно на языке программирования, интересно именно с словоформами, потому как без реализуется просто. Спасибо.

42

ИМХО

5 апреля 2008, 16:12

#11

Miracle:
Ребята, реализовую подобное на пхп., но столкнулся с проблемой, если в тексте уже есть тег смысл ставить еще один, как обойти не знаю

Тут сложнее, имхо, придется делать полный разбор текста. Идете по html-коду от начала до конца.

Натыкаетесь на открывающий тэг, заносите в список активных.

Натыкаетесь на закрывающий тэг, если тэг в списке активных, вычеркиваете из списка.

Натыкаетесь на слово, проверяете не находится ли оно в списке тех которые скрипт должен обрамить тэгом. Если находится, проверяете какие тэги сейчас в списке активных. Если нужного нет, обрамляете.

Проблем с кривым html-кодом будет туева хуча.

Miracle:
разбивать на кол-во слов и делать разные варианты

или не заморачиваться, и обрамить каждое слово по отдельности ;)

С уважением, Константин.

M

376

Miracle

5 апреля 2008, 16:26

#12

ИМХО:
Тут сложнее, имхо, придется делать полный разбор текста. Идете по html-коду от начала до конца.
Натыкаетесь на открывающий тэг, заносите в список активных.
Натыкаетесь на закрывающий тэг, если тэг в списке активных, вычеркиваете из списка.
Натыкаетесь на слово, проверяете не находится ли оно в списке тех которые скрипт должен обрамить тэгом. Если находится, проверяете какие тэги сейчас в списке активных. Если нужного нет, обрамляете.

Проблем с кривым html-кодом будет туева хуча.

Кривово хтмл и других не нужных тегов не будет, это для своих проектов.

Насчет обрамлять по одиночке , тож не правильный подход :)), с таким же успехом и словоформ не надо

По поводу предложенного вами решения, эти же мысли у меня и в голове, но это не решение :), уж проще после в тексте найти все с тегами, и внутри каждого вырезать все не нужные и записать на старое место, и так циклом ... но ведь не решение :))

Может есть умы которые предложат гениально-простую идею :))

отец сыночка, лапочки дочки и еще одного сыночка

C

82

Cage

5 апреля 2008, 16:57

#13

Чтобы удалить лишние теги

$text = preg_replace ('/<b>(*.)<b>(*.)</b>(*.)</b>/Ui', '<b>\\1\\2\\3</b>', $text);

69

Kolyaj

5 апреля 2008, 17:57

#14

Miracle, чтобы не терзать чужие сервера, используйте phpMorphy.

Cage, какая-то загадочная у вас регулярка.

176

Oniks

5 апреля 2008, 21:42

#15

Мое имхо - надо делать так: эксплодите строчку в массив по "", делаете реверс массива, проходите по нему в поисках двойного "", если находите - удаляете лишний и объединяете 2 последующих элемента. Ну а дальше реверсуете массив и имплодите с разделителем "".

Профессиональные услуги фотографа в Москве и области (http://www.oniks-photo.ru/) покупаю стать и ссылки с сайтов про охоту

C

82

Cage

5 апреля 2008, 22:43

#16

Kolyaj:
Cage, какая-то загадочная у вас регулярка.

В ней, кстати, не хватает парочки обратных слешей :). Вот так правильно:

$text = preg_replace("/<b>(.*)<b>(.*)<\/b>(.*)<\/b>/Ui", "<b>\\1\\2\\3</b>", $text);

69

Kolyaj

6 апреля 2008, 05:45

#17

Cage:
В ней, кстати, не хватает парочки обратных слешей

В общем случае все равно работать не будет, попробуйте хотя бы на строке "111222333444555666777". Более того, в общем случае регулярками вообще не получится.

Для таких задач испольуется алоритм, на подобие того, что описал ИМХО, только использовать надо не "список активных", а класть теги на стек.

C

82

Cage

6 апреля 2008, 09:41

#18

Kolyaj:
В общем случае все равно работать не будет, попробуйте хотя бы на строке "111222333444555666777".

В общем случае не будет работать, безусловно. Но ТС описал свою конкретную проблему, а я предложил ему конкретное решение, очень простое и уже готовое :).

Kolyaj:
Более того, в общем случае регулярками вообще не получится.

while ($text != $old_text) {

  $old_text = $text;

  $text = preg_replace("/<b>(.*)<b>(.*)<\/b>(.*)<\/b>/Ui", "<b>\\1\\2\\3</b>", $old_text); 

}

Я не знаю, насколько этот код будет эффективно (быстро) работать, но он хотя бы будет работать :).

Подскажите по docker-y кто CMS для потрала с Как вывести сайт в

69

Kolyaj

6 апреля 2008, 18:11

#19

Cage:
Я не знаю, насколько этот код будет эффективно (быстро) работать, но он хотя бы будет работать

Вы даже не представляете себе, насколько неэффективно этот код будет работать (хотя бы из-за использования максимальных квантификаторов), в то время как существует алгоритм, требующий всего одного прохода по тексту, да и его можно совместить с поиском самих слов для замены (т.е. издержек на проверку не будет вообще никаких).

З.Ы. Кстати, я имел в виду одни лишь регулярки, без циклов и прочего ;)

M

376

Miracle

6 апреля 2008, 18:25

#20

Kolyaj, так делитесь как? Это и ищемс :). И еще что бы в общем случае, например любой другой тег, с атрибутами и свойствами?!Cage, Спасибо, подождем Kolyaj.

Зачем быть уникальным в мире, где все можно скопировать

VK приобрела 70% в структуре компании-разработчика red_mad_robot

хочу автоматом заменить все словоформы одного слова на этоже только обрамленного тего