Поиск в переменной PHP и запись найденного слова

DarkHorse · 2016-12-11T07:43:48.0000000Z

Здравствуйте, друзья! Пожалуйста, помогите в данном вопросе. Дано: Имеется переменная $text = "Петя решил отпраздновать Новый год в славном городе Казань, хотя Маша предлагала ему поехать в Санкт-Петербург". Задача: Записать в переменную $gorod - любой город (первый попавшийся, или наоборот последний, без разницы, но только один) из массива городов, встречающийся в переменной $text. Массив городов Если встречается слово "Воронеж" записать $gorod = "voronezh" Если встречается слово "Москва" записать $gorod = "moskva" Если встречается слово "Казань" записать $gorod = "kazan" Если встречается слово "Реутов" записать $gorod = "reutov" Если встречается слово "Санкт-Петербург" записать $gorod = "piter" Если встречается слово "Нью-Йорк" записать $gorod = "newyork" Если встречается слово "Владивосток" записать $gorod = "vladivostok" И если не встречается ничего из предложенного нами то записать $gorod = "netgoroda"

[Удален]

13 декабря 2016, 22:53

#31

rereg:
модификатор u "#москв\w#"ui и файл должен быть в utf-8

---------- Добавлено 14.12.2016 в 00:54 ----------

А вообще есть куча либ чтобы привести слово к базовой форме. Тот же phpmorphy

Вау!!! Это работает! Спасибо огромное.

Прикрутил Москву

А за Москвой и всё само прикрутилось

153

danforth

13 декабря 2016, 23:37

#32

rereg:
А вообще есть куча либ чтобы привести слово к базовой форме. Тот же phpmorphy

Нет никакого смысла приводить к базовой форме. Достаточно просто находить дистанцию между словами. Например: Между "Москва" и "Москве" дистанция 1 символ: "а" меняется на "е". Между "Москва" и "Моксва" - 2 символа. Предварительно, можно сделать фонетический разбор слова, есть множество алгоритмов, но не все они подходят под русский, если вкратце, то пропущенное через функцию фонетического разбора слово "Ростов-на-Дону" будет выглядеть где-то так: РСТВНДН, и даже если мы его просклоняем - слово не изменится, т.к. гласные из слова убраны, а если и слово не меняется - значит расстояние между двумя словами будет равно 0 - а это значит точное попадание. Это конечно лучше чем милторговские алгоритмы, но не идеально ввиду того, что если слово напишут "Ростов на дону" (вместо тире - пробелы), то регулярка по тире может не сработать, ну и ещё по мелким косячкам, которые сработают: например город "Обь" и слово "об" пропущенные через функцию фонетического разбора будут выглядеть как "б", что является полным совпадением с точки зрения дистанции между словами.

Я как-то раз писал алгоритм, который учитывал ошибки пользователей в поисковых запросах. Удобно, с учетом автодополнения и автозамены при подтверждении.

Junior Web Developer

Еще раз о пересечениях Вопросы новичков Какой домен лучше: с

[Удален]

14 декабря 2016, 00:06

#33

danforth:
Нет никакого смысла приводить к базовой форме. Достаточно просто находить дистанцию между словами. Например: Между "Москва" и "Москве" дистанция 1 символ: "а" меняется на "е". Между "Москва" и "Моксва" - 2 символа. Предварительно, можно сделать фонетический разбор слова, есть множество алгоритмов, но не все они подходят под русский, если вкратце, то пропущенное через функцию фонетического разбора слово "Ростов-на-Дону" будет выглядеть где-то так: РСТВНДН, и даже если мы его просклоняем - слово не изменится, т.к. гласные из слова убраны, а если и слово не меняется - значит расстояние между двумя словами будет равно 0 - а это значит точное попадание. Это конечно лучше чем милторговские алгоритмы, но не идеально ввиду того, что если слово напишут "Ростов на дону" (вместо тире - пробелы), то регулярка по тире может не сработать, ну и ещё по мелким косячкам, которые сработают: например город "Обь" и слово "об" пропущенные через функцию фонетического разбора будут выглядеть как "б", что является полным совпадением с точки зрения дистанции между словами.

Я как-то раз писал алгоритм, который учитывал ошибки пользователей в поисковых запросах. Удобно, с учетом автодополнения и автозамены при подтверждении.

Вы слов-постановки задачи написали в 5 раз больше чем рабочая программа которую я написал

И если бы не u - всё бы было готово за час

Кстати. Ростов на Дону через пробелы - у меня работает

---------- Добавлено 14.12.2016 в 02:10 ----------

Вообще. Давным давно. В 2003 году я написал Антиматерильник. Вот то была интересная штука. Надо его найти

---------- Добавлено 14.12.2016 в 03:00 ----------

Нашёл. Вот он:

http://chajnik.ru/antimat

Вот что выдает вместо мата:

бери мой писюль, кончик писюлька

Клон сайта Etxt Антиплагиат 2.0. Проверка Как платить за ссылки?

456

[umka]

14 декабря 2016, 08:06

#34

danforth:
и даже если мы его просклоняем - слово не изменится, т.к. гласные из слова убраны

Далеко не все слова и названия городов с выкинутыми гласными будут одинаковы в склонениях.

Химки — в Химках

Жуковский — в Жуковском

Набережные Челны — в Набережных Челнах

danforth:
что если слово напишут "Ростов на дону"

Да, и "Набережные Челны" пишутся именно через пробел, а не через дефис, и это не единственный такой город :)

Лог в помощь!

Биржа ссылок Uniplace (beta) Покупаю домены - города Изменения условий выплат через

1609

SeVlad

14 декабря 2016, 08:24

#35

veleg:
Он представил рабочий код,

Серьёзно?🍿

Хотя разве что для 1еуро/час в Мыколайках такое пойдёт.

<?

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.

153

danforth

14 декабря 2016, 09:20

#36

umka:
Далеко не все слова и названия городов с выкинутыми гласными будут одинаковы в склонениях.

Да, но дистанция в 1-3 символ - не много. Можно считать, что это искомое слово. Хотя, конечно, нужно брать контекст. Тут все зависит от фонетического разбора: чем он точнее разбирает произношение слов, тем ниже ошибка. Можно звонкие на глухие менять, и гласные не убирать, тогда точность высится. В любом случае, это более точный алгоритм, чем доверится на правильное написание города пользователем.

Вообще интересная темка, я давно хотел написать кое-какую штуку на эту тему: что-то вроде мини-поисковой системы, которая бы оценивала релевантность слова. Но пока руки не доходят, и не уверен что доведу до конца.

P.S. [umka], ваш ник ломает систему быстрого цитирования :)

неправильная выдача сайта по возрасту сайтов Вес ссылки

Маркетинг для шоколадной фабрики. На 34% выше средний чек

Open AI тестирует память для ChatGPT