- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов
А 24,9% – на сегмент электронной коммерции
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
По-моему что-то там не ладное или проблема решается не с того бока.
Определение кодировки в PHP и так кривое, а уж разные куски и такие выкрутасы она будет показывать бред.
joost, в таком случае только если кодировка не utf-8, то надо определять кодировку именно этого текста и конвертировать именно из его кодировки в utf-8.
if (mb_detect_encoding($a->plaintext)!='utf-8')
$a->plaintext = iconv(mb_detect_encoding($a->plaintext),"UTF-8//TRANSLIT//IGNORE",$a->plaintext);
но все что не ютф в БД не пишет
п.с. с указанием списка кодировок аналогично
---------- Добавлено 17.11.2017 в 14:50 ----------
По-моему что-то там не ладное или проблема решается не с того бока.
Определение кодировки в PHP и так кривое, а уж разные куски и такие выкрутасы она будет показывать бред.
делаю парсинг
http://www.njcar.ru/prices-partners/barnaul/renault/duster/all
Ну весь сайт в win1251 в чём проблема то?! Какие там куски не в этой кодировке?
Я же дал вам код, вы сказали с ним всё ок. Тогда в чём проблема то?!
там указано windows-1251
а определяется как ASCII
может в этом проблема?
там указано windows-1251
а определяется как ASCII
может в этом проблема?
Ничего не надо определять или смотреть. Берёте просто мой кусок кода и с ним работаете. Не надо функцию по определению кодировки вставлять вообще.
ок
делаю
$a->plaintext = iconv("windows-1251","UTF-8//TRANSLIT//IGNORE",$a->plaintext);
в БД русские буквы Продажа
---------- Добавлено 17.11.2017 в 14:58 ----------
Ничего не надо определять или смотреть
парсинг разных сайтов идет
делаю
$a->plaintext = iconv("windows-1251","UTF-8//TRANSLIT//IGNORE",$a->plaintext);
в БД русские буквы Продажа
Конкретно этого сайта?
Так проверяйте по этой строчке на странице:
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251" />
если нет этой строчки, то проверяйте по хедеру ответа в какой кодировке предоставляются данные.
Но никак не функциями PHP
---------- Добавлено 17.11.2017 в 14:02 ----------
как вы это смотрите? phpmyadmin последней версии? БД и таблицы точно в utf-8? При подключении к БД случаем кодировка cp1251 не выставлена?
Поразительное упорство - зная, что там не cp1251, пытаться конвертировать из cp1251 🤪
Поразительное упорство - зная, что там не cp1251, пытаться конвертировать из cp1251 🤪
Нет тут проблема, что всё доверилось стандартным функциям, а они в этом деле "неалло".
делаю парсинг
http://www.njcar.ru/prices-partners/barnaul/renault/duster/all
там вин1251
у меня
файл скрипта в ютф
конект с БД mysql_query("SET NAMES 'utf8' ");
поля в таблице и сама таблица utf8_general_ci
в скрипте $a->plaintext = iconv("windows-1251","UTF-8//TRANSLIT//IGNORE",$a->plaintext);
в БД часть текста в крякозябрах, а часть нормально
следовательно - не весь текст страницы вин1251