Как почистить кеи от непонятных символов?

G
На сайте с 21.04.2010
Offline
161
1506

Собственно самж

Кеи в UTF-8 без бом.

Есть там вот такой бред

Fethullah G�� Hocaefendi B�� Eserleri (2010).rar

FETI 027 40人の黒ストッキング足コキ 2枚組8時間

FETI 029 46?��???????��????��???��???��????��???????��?????????��?????2��???����?��?8��????????

FETI 029 46?oo?????????????????□??1□?3??3?? 2????□?8???□??

FETI 029 46?oo?????????????????��??1��?3??3?? 2????��?8???��??

Anna AJ��Ƶȫ��ϵ��֮�ġ�HEGRE����52BTרҵ��ͼ����д�桿

Чем удалить всю эту бороду?

simbatron
На сайте с 19.05.2007
Offline
78
#1

php скриптом:

сначала узнаешь коэффициент присутствия русских букв в ключе

$kw = preg_match_all('/[а-я]/u', $keywords, $match);

$kw1 = $kw/mb_strlen($keywords, 'utf-8');

потом сохраняешь в новый файл если коэффициент $kw1 больше определенного значения

http://webmaster96.ru (http://webmaster96.ru)
AP
На сайте с 14.04.2010
Offline
122
#2

GAGAn, KeyWordKeeper 5 должен справиться

http://newox.ru/kwk/KeyWordKeeper_5B5.exe

1 вариант

Создание выборки - отмечаем "Спецсимволов не должно быть", ключи указывать не нужно

2 вариант

Элементарная чистка - ставим галочку "удалить символы с плохими кодами"(можно указать свой фильтр)

Перед использованием изменить кодировку на Windows 1251 этой же программой

Или этой, rasiell выкладывал у себя в теме

http://spartanets.ru/downloads/Converter.zip

А вообще ленишься, в сети очень много программ для работы с текстами

XPraptor
На сайте с 15.10.2004
Offline
333
#3

Да реально через php проще:

<?php

$_file_keys=file_get_contents("путь к файлу с кеями");

$_file_keys=preg_replace("(^[:print:][:allnum:])", "", $_file_keys);

//$_file_keys теперь без левых символов

?>

Dos3
На сайте с 07.01.2011
Offline
363
#4

"(^[:print:][:allnum:])"

впервые такую регулярку вижу 😮

XPraptor
На сайте с 15.10.2004
Offline
333
#5

Dos3, это символьные классы - первый все знаки препинания и спецсимволы второй все буквы и цифры. Все остальное не нужно кроме этих символов в кеях.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий