Проблема с кодировкой PHP

12
D
На сайте с 28.06.2008
Offline
1108
331

Вот сайт https://www.missaqua.ru/item/akrilovaya-vanna-triton-ultra-120_18252.html

Название ванны в h1 фиг знает в какой кодировке. Пробую преобразовать так

$convertedText = mb_convert_encoding($h1, 'utf-8', mb_detect_encoding($h1));

Уже все варианты перепробовал - на выходе кробозяки. Как победить?

Изначально получил такое

string(53) "Àêðèëîâàÿ âàííà TRITON Óëüòðà 120"

Далее пробую победить кодировку, пока безтолку.  

mb_detect_encoding($h1)

 показывает утф8

X
На сайте с 04.12.2018
Offline
285
#1
 норм же

 

Удобный съем позиций (http://allpositions.ru/redirect/58277)
totamon
На сайте с 12.05.2007
Offline
437
#2
Dram :
Название ванны в h1 фиг знает в какой кодировке.

хочешь сказать что весь остальной текст в другой кодировке?

"на выходе " это куда? может со страницей все нормально, а твой скрипт отдает текст фиг знает в какой кодировке?

Домены и хостинг https://8fn.ru/regru | Дедик от 3000р https://8fn.ru/73 | VPS в Москве https://8fn.ru/72 | Лучшие ВПС, ТП огонь, все страны! https://8fn.ru/inferno | ХОСТИНГ №1 РОССИИ https://8fn.ru/beget
Сергей 2on2
На сайте с 01.10.2010
Offline
149
#3
В БД как?
Пляжный волейбол - https://2on2.me
D
На сайте с 28.06.2008
Offline
1108
#4

В бд пока не пишу. Весь остальной текст тоже коробозяки (кроме латиницы).

Паршу через ПХПквери, подумал мож он виноват, скачал странице через файлгетконтент, тоже самое


K
На сайте с 16.01.2022
Offline
20
#5
Определение кодировки страницы сайта. Чтение страницы сайта и преобразование в UTF-8 или в Windows-1251
  • htmlweb.ru
При формированнии карт сайтов с помощью сервиса периодически сталкивался с проблемами некорректного указания кодировки страницы или неуказания кодовой страницы вообще. В настоящий момент у меня работает функция анализа кодовой страницы похожая на представленную ниже. Представленный ниже пример читает страницу, преобразует её в UTF-8, загружает...
Onecontent
На сайте с 02.05.2016
Offline
91
#6
Dram :

Вот сайт https://www.missaqua.ru/item/akrilovaya-vanna-triton-ultra-120_18252.html

Название ванны в h1 фиг знает в какой кодировке. Пробую преобразовать так

Уже все варианты перепробовал - на выходе кробозяки. Как победить?

Изначально получил такое

string(53) "Àêðèëîâàÿ âàííà TRITON Óëüòðà 120"

Далее пробую победить кодировку, пока безтолку.  

mb_detect_encoding($h1)

показывает утф8

Яндекс говорит что получает Win-1251

png 2022-02-03_10-57_1.png
Создание и продвижение сайтов в Самаре ( https://onecontent.ru ) Автоаксессуары и тюнинг в Красноярске ( https://carbonado24.com )
D
На сайте с 28.06.2008
Offline
1108
#7
Onecontent #:

Яндекс говорит что получает Win-1251

тогда почему не работает ?

$convertedText = mb_convert_encoding($h1, 'utf-8', mb_detect_encoding($h1));
LEOnidUKG
На сайте с 25.11.2006
Offline
1761
#8
Dram #:

тогда почему не работает ?

Потому, что это никогда не работает. Забудь об автоматическом распознавании кодировки.

✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/ ✅ Настройка и оптимизация серверов https://getmanyspeed.ru/
D
На сайте с 28.06.2008
Offline
1108
#9

В общем проблему решил.  Баг где то в пхпКвери.

Сперва скачал страницу через файл гет контент, потом

        $str = file_get_contents($url3);
        $html_utf8 = mb_convert_encoding($str, "utf-8", "windows-1251");

И только потом распарсил

totamon
На сайте с 12.05.2007
Offline
437
#10
Dram #:
Баг где то в пхпКвери.
не выдумывай)
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий