проблема с кодировкой русского текста в google

E
На сайте с 05.01.2010
Offline
46
873

гуглу в результатах выдачи выдает русский текст в виде последовательности какой то фигни

#1042;#1080;#1082;#1080;#1089;#1083;#1086;#1074;#1072;#1088;#1100;

что по нашему:

Викисловарь

как это перегнать в читаемый/кирилический вид на PHP ?

[umka]
На сайте с 25.05.2008
Offline
456
#1

Скорей всего, кодировка текста на сайте не совпадает с кодировкой, которую отдаёт веб-сервер.

Проверьте кодировку в ваших файлах, в meta-тегах (если есть), и в заголовке Content-Type. Она должна быть одинаковая.

Лог в помощь!
E
На сайте с 05.01.2010
Offline
46
#2
'[umka:
;8242819']Скорей всего, кодировка текста на сайте не совпадает с кодировкой, которую отдаёт веб-сервер.
Проверьте кодировку в ваших файлах, в meta-тегах (если есть), и в заголовке Content-Type. Она должна быть одинаковая.

поясню более детально.

У меня задача стоит на PHP выпарсить первые 10 результатов google по ключевому слову и сохранить урл и тайтл к нему. Ссылка сохраняется нормально, а вот русские буквы представлены в виде вышеописанной последовательности, которую я не могу привести к нормальному виду

[umka]
На сайте с 25.05.2008
Offline
456
#3
exphpman:
поясню более детально.
У меня задача стоит на PHP выпарсить первые 10 результатов google по ключевому слову и сохранить урл и тайтл к нему. Ссылка сохраняется нормально, а вот русские буквы представлены в виде вышеописанной последовательности, которую я не могу привести к нормальному виду

http://php.net/manual/en/function.html-entity-decode.php

:) ?

E
На сайте с 05.01.2010
Offline
46
#4

$convmap = array(0x0, 0x2FFFF, 0, 0xFFFF);

$body = file_get_content('http://google.ru');
return html_entity_decode( mb_decode_numericentity($body, $convmap, 'UTF-8'));

Спасибо всем, решение найдено.

M
На сайте с 27.10.2006
Offline
111
#5

Правильно, мультибайт. Только есть одно. В вашем диапазоне от 0x2F до 0xFF есть предположительно враждебные знаки.

Бесплатное хранилище данных (http://bit.ly/gJYy9Z) (5GB) с синхронизацией. По ссылке — бонус 500MB.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий