Регулярное выражение для поиска текста на русском...

12
Unlock
На сайте с 01.08.2004
Offline
779
3043

Есть файл в котором текст преимущественно на английском, но есть немного на русском. Реально ли его найти с помощью регулярных выражений?

И еще вопрос. Можно ли с помощью регулярных выражений заменить русский текст на транслит?

Есть желание, - тысяча способов; нет желания, - тысяча поводов! /Петр-I/.
Vitо
На сайте с 17.07.2007
Offline
25
#1

Регулярные выражения (в пхп покрайней мере) отлично работают с русским языком [а-я].

А на транслит я бы переводил с помощью функции str_replace()

Онлайн школа покера (http://www.pokermoscow.ru/school/)
Vitо
На сайте с 17.07.2007
Offline
25
#2

дубль-гум...

K1
На сайте с 12.08.2007
Offline
48
#3
Unlock:
Есть файл в котором текст преимущественно на английском, но есть немного на русском. Реально ли его найти с помощью регулярных выражений?
И еще вопрос. Можно ли с помощью регулярных выражений заменить русский текст на транслит?

Найти текст? Не вопрос. Perl вам в помощь :)

Заменить на транслит тоже можно. На том же перле сделать это будет не сложно.

Никогда не позволяйте морали удерживать вас от правильных поступков.
Vitо
На сайте с 17.07.2007
Offline
25
#4

Пример функции:

 <?php

function ru2Lat($string)
{
$rus = array('ё','ж','ц','ч','ш','щ','ю','я','Ё','Ж','Ц','Ч','Ш','Щ','Ю','Я');
$lat = array('yo','zh','tc','ch','sh','sh','yu','ya','YO','ZH','TC','CH','SH','SH','YU','YA');
$string = str_replace($rus,$lat,$string);
$string = strtr($string,
"АБВГДЕЗИЙКЛМНОПРСТУФХЪЫЬЭабвгдезийклмнопрстуфхъыьэ",
"ABVGDEZIJKLMNOPRSTUFH_I_Eabvgdezijklmnoprstufh_i_e");

return($string);
}
?>
Unlock
На сайте с 01.08.2004
Offline
779
#5

Vitо, спасибо! Но вот только мне не очень поможет. У меня текстовый редактор поддерживает регулярные выражение, но не PHP скрипты. Но даже не это плохо, еще бы понять как этим скриптом конкретный файл обработать :) Знал бы PHP я бы вообще тему не поднимал.

И подскажите пожалуйста, как все таки текст на русском искать?

DyaDya
На сайте с 11.04.2007
Offline
147
#6

На пхп я бы помог тебе написать. Я вот подумываю как найти такие фразы в тексте, в которых есть опечатки в другой раскладке.

Например

sony KM-8000 и sony KМ-8000 во втором случае "М" - кириллица. или наоборот, может быть фраза на русском, но одна-две буквы из английской раскладки. Чтобы хотябы вывести и подсветить цветом те буквы которых в меньшенстве, например.

В общем скоро сделаю) ибо надо. А то когда базу инет магазина набивают, частенько ошибаются елки-палки. Нужно выискать это дело.

Кстати, Unlock , у тебя задача полегче. нужно просто файл открыть и просто прочитать и обработать указанный файл с помощью функции, которую выше предложили. Результат записать для надежности в новый файл. Потом делайте с ним, что хотите.

Выбирайте качественный хостинг (http://vashmaster.ru/informaciya/o_poleznyh_programmah/news83.php) и продвигайте сайты в СЕОПУЛЬТ (http://seopult.ru/ref.php?ref=72b5ed9561fe66a1). А на «SAPE» я в обиде :) Не упрекайте за очепятки, пишу вслепую (http://ergosolo.ru/) и также делаю сайты (http://www.vashmaster.ru/) ;)
[Удален]
#7

Попробуйте переводить в url-код. Если используете notepad++, то там есть в плагинах такая функция.

Unlock
На сайте с 01.08.2004
Offline
779
#8

Люди, подскажите одну простую вещь, как искать текст написанный на русском языке? C трудом мне верится что это сложно, или я не прав?

Dreammaker
На сайте с 20.04.2006
Offline
569
#9

~[а-я]+~i

Такая вроде будет регулярка. Там ещё в зависимости от локали могут быть проблемы, но в большинстве случаев так :)

Shtogrin
На сайте с 02.11.2006
Offline
95
#10
Unlock:
Люди, подскажите одну простую вещь, как искать текст написанный на русском языке? C трудом мне верится что это сложно, или я не прав?

Владимир, это скорее всего проблема редактора. Напишите мне список типичных задач по обработке ваших файлов, приблизительные размеры файлов и мы 18-го решим их с остальными задачами. Это будет простой интерфейс по пакетной обработке файлов.

www.shtogrin.com (http://www.shtogrin.com/). Канцтовары (http://www.invit.com.ua/). 1С Бухгалтерия (http://account.kiev.ua/).
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий