Подскажите рег выражение для поиска в контентне страницы метатега с кодировкой

1 23
T.R.O.N
На сайте с 18.05.2004
Offline
314
#21
bearman:
я с буком люблю гулять по офесам и местам разным, на буке работа, не потащу же с собой комп =))))

это действительно, дело вкуса =))) предпочитаю работать только на работе. Вне ее стен - отдых

От воздержания пока никто не умер. Хотя никто и не родился! Prototype.js был написан теми, кто не знает JavaScript, для тех, кто не знает JavaScript (Richard Cornford)
[Удален]
#22

Ребят, ответьте плз на мой последний вопросик, ну очень надо)

T.R.O.N
На сайте с 18.05.2004
Offline
314
#23

plamar, ну как ответить, если в сети не нашел ни одного отзыва, где с высокой вероятностью доказывается работоспособность mb_detect_encoding ?

Определение кодировок (100%) неподсилу даже MSExcel... Что же вы хотите от пыха? приходится считаться с допущениями

[Удален]
#24
plamar:
Ребят, ответьте плз на мой последний вопросик, ну очень надо)

как вы вызываете эту функцию? перечисляете "искомые" кодировки?

mb_detect_encoding($str,"UTF-8, cp1251, CP866, KOI8-R")

последние 3 имхо могут иногда некоректно определяться, надо тестировать :) это раз, во вторых видел где то инетерсный алгоритм "определяния"

там брали строчку и переводили ее в кжадую из тестируемых кодировок, если строка исходная и переведенная совпадали, значит кодировка - верная :) как то так

T.R.O.N
На сайте с 18.05.2004
Offline
314
#25
bearman:
во вторых видел где то инетерсный алгоритм "определяния"

Сам игрался алгоритмом, который основан именно на русском языке. В нашем языке, чаще всего используются буквы ОТЕHАР, на этом принципе пытаемся определить кодировку

frantic
На сайте с 09.02.2009
Offline
27
#26

plamar, ну если вы сайт какой то парсите, попробуйте прочитать заголовок, который посылает серв (Content-Type: text/html; charset=cp1251) . Если он вообще его посылает :)

Я думаю в мете должна быть такая же кодировка

[Удален]
#27
frantic:
думаю в мете должна быть такая же кодировка

абсолютно не факт, иногда когда я нагло паршу просматриваю чужие сайты, чтобы вывести контент в нужной мне кодировке (после иконв конечно) я добавляю header("Content-type .."); он для браузера приоритетнее чем мета в теле страницы.

frantic
На сайте с 09.02.2009
Offline
27
#28
bearman:
абсолютно не факт, иногда когда я нагло паршу просматриваю чужие сайты, чтобы вывести контент в нужной мне кодировке (после иконв конечно) я добавляю header("Content-type .."); он для браузера приоритетнее чем мета в теле страницы.

ну все равно ведь по контент тайпу и можно определить, и тогда мета не сработает если в ней другая кодировка. правда я смотрю не всегда этот Content-Type посылается...

[Удален]
#29
frantic:
ну все равно ведь по контент тайпу и можно определить, и тогда мета не сработает если в ней другая кодировка. правда я смотрю не всегда этот Content-Type посылается...

да в том то и дело, что это я все делаю (сначала контент тайп проверяю, потом мету), но вот в случаях, когда ни то, ни другое не помогает (как здесь http://www.e-kirpich.ru/klink_kirpich.html), я и хочу определять

plamar добавил 26.02.2010 в 19:22

bearman:
как вы вызываете эту функцию? перечисляете "искомые" кодировки?

mb_detect_encoding($str,"UTF-8, cp1251, CP866, KOI8-R")
последние 3 имхо могут иногда некоректно определяться, надо тестировать :) это раз, во вторых видел где то инетерсный алгоритм "определяния"

там брали строчку и переводили ее в кжадую из тестируемых кодировок, если строка исходная и переведенная совпадали, значит кодировка - верная :) как то так

а вот это прикольно, надо попробовать, спасибо!

plamar добавил 26.02.2010 в 20:20

bearman:

там брали строчку и переводили ее в кжадую из тестируемых кодировок, если строка исходная и переведенная совпадали, значит кодировка - верная :) как то так

только вот в случае с iconv (в данном алгоритме) вопрос - а какую ставить ИСХОДНУЮ кодировку?

plamar добавил 26.02.2010 в 21:01

а кто подскажет, какие есть самые распространенные кодировки кроме UTF и win1251? Также нужны примеры сайтов на этих кодировках. Функцию я написал проверки - хочу оттестить.

1 23

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий