Подскажите рег выражение для поиска в контентне страницы метатега с кодировкой

123
[Удален]
#11

http://ru.php.net/mb_detect_encoding

вот это попробуй

T.R.O.N
На сайте с 18.05.2004
Offline
314
#12
plamar:
А можно ли как-то указать курлу, чтобы он получал только в utf-8?

а если сервер не сможет исполнить такой запрос?

T.R.O.N добавил 26.02.2010 в 14:29

plamar:
Это всегда так, когда кодировка не возвращается она является win1251?

это броузеры (при русском регионе) считают так

От воздержания пока никто не умер. Хотя никто и не родился! Prototype.js был написан теми, кто не знает JavaScript, для тех, кто не знает JavaScript (Richard Cornford)
[Удален]
#13
bearman:
http://ru.php.net/mb_detect_encoding

вот это попробуй

да попробую, но читал много нелестных отзывов о ней (вроде того, что она не на всех хостах работает)... Сам правда, еще не юзал

О даже у меня на локалке не пашет:

Fatal error: Call to undefined function mb_detect_encoding()

[Удален]
#14
plamar:
О даже у меня на локалке не пашет:
Fatal error: Call to undefined function mb_detect_encoding()

круто, видимо нелестные отзывы пишут такие же как вы :)

удалить к х*ям денвер и поставьте нормальный веб сервер, пролем будет меньше.

mbstring.dll незагружено

B
На сайте с 24.09.2005
Offline
62
#15


preg_match('~<meta\s[^>]+charset=windows-1251~i', $html)
Куда делось свободное место (http://se-chronicle.blogspot.com/) на жестком диске
S
На сайте с 28.10.2005
Offline
313
#16
bearman:

удалить к х*ям денвер и поставьте нормальный веб сервер, пролем будет меньше.

Поставить денвер обратно и накатить дополнительные модули с одноименного сайта 😂

[Удален]
#17
semenov:
Поставить денвер обратно и накатить дополнительные модули с одноименного сайта

имхо лучший дев сервер - linux машина виртуальная с рабочей сродей. плюсы:

- окружение переменных как на хостинге

- все ставится с полпинка, а не с одноименного уга сайта

- можно все "поставить на паузу" в любой момент времени

- не будет проблем при переносе

еще много плюсов

[Удален]
#18
bearman:
круто, видимо нелестные отзывы пишут такие же как вы :)

удалить к х*ям денвер и поставьте нормальный веб сервер, пролем будет меньше.

mbstring.dll незагружено

ok, тогда ситуация следующая. Вот скрипт, который я запустил на хосте:


$result=get_web_page("http://www.e-kirpich.ru/klink_kirpich.html");
echo mb_detect_encoding($result['content'])."<br>";

$result=get_web_page("http://www.apriori-salon.ru/");
echo mb_detect_encoding($result['content']);

function get_web_page( $url )
{
$uagent = "Mozilla/5.0 (Windows; U; Windows NT 5.1; ru; rv:1.9.0.8) Gecko/2009032609 Firefox/3.0.8";

$ch = curl_init( $url );


curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); // возвращает веб-страницу //http://ru.php.net/manual/en/function.curl-setopt.php
curl_setopt($ch, CURLOPT_HEADER, 0); // не возвращает заголовки
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); // переходит по редиректам
curl_setopt($ch, CURLOPT_ENCODING, ""); // обрабатывает все кодировки
curl_setopt($ch, CURLOPT_USERAGENT, $uagent); // useragent
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 120); // таймаут соединения
curl_setopt($ch, CURLOPT_TIMEOUT, 120); // таймаут ответа
curl_setopt($ch, CURLOPT_MAXREDIRS, 10); // останавливаться после 10-ого редиректа

$content = curl_exec( $ch );
//echo $content;
$err = curl_errno( $ch );
$errmsg = curl_error( $ch );
$header = curl_getinfo( $ch ); //http://ru.php.net/manual/en/function.curl-getinfo.php

curl_close( $ch );

$header['errno'] = $err;
$header['errmsg'] = $errmsg;
$header['content'] = $content;

return $header;
}

скрипт вывел:


UTF-8
UTF-8

У первой страницы кодировка точно не задана (но возвращается win1251), у второй точно win1251. Почему mb_detect_encoding выводит UTF?

T.R.O.N
На сайте с 18.05.2004
Offline
314
#19
bearman:
имхо лучший дев сервер - linux машина виртуальная с рабочей сродей

или, что грамотней, просто комп, который полностью программно идентичен хосту, который используете. Цена вопроса 200$.

[Удален]
#20
T.R.O.N:
что грамотней, просто комп

я с буком люблю гулять по офесам и местам разным, на буке работа, не потащу же с собой комп =))))

тут дело имхо не в грамотности а в удобстве. ну и плюс еще один комп - нахрен ))))))) он же жжжужжжжжит

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий