- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Вот пример метатега.
Мне нужно регулярное выражение, которое определяет включает ли этот тег запись windows-1251. (простое сраснение строки не подходит, так как это тег может иметь разный вид).
text/html; charset=windows-1251
text/html; charset=windows-1251 или charset=windows-1251 - такая конструкция должна быть всегда, ведь так ? так что мешает ее просто искать не тратя время на обработку регулярок?
text/html; charset=windows-1251 или charset=windows-1251 - такая конструкция должна быть всегда, ведь так ? так что мешает ее просто искать не тратя время на обработку регулярок?
а если на странице с кодировкой UTF (практически на любом вордпресс блоге) автор в теле страницы упомянет фразу charset=windows-1251 ???
plamar,
регулярки работают очень медленно и создают очень большую нагрузку... стараюсь, где возможно, их избегать
как вариант Искать только в <head>
т.е. взять весь текст, разрезать его по </head> или по <body
общая регулярка ^(.*)meta http-equiv(.*)Content-Type(.*)windows-1251 (пользуюсь перлом, посему сами решите как в пых это воткнуть)
😂
semenov,
блин, читай выше?
я чтото такое такое использовал
http://xp.helldude.ru/repositories/entry/dudecurl/trunk/libs/DudeCurl.class.php?rev=62#L251
Как вариант
Как вариант
прожорливо сожрет
а если на странице с кодировкой UTF (практически на любом вордпресс блоге) автор в теле страницы упомянет фразу charset=windows-1251 ???
Спасибо за ответы, с этим понятно. Но вот напоролся на такую фишку:
http://www.e-kirpich.ru/klink_kirpich.html
Данный сайт не отдает кодировку ни в заголовке, ни в теле. Реальная кодировка его win1251. Это всегда так, когда кодировка не возвращается она является win1251?
plamar добавил 26.02.2010 в 14:23
Спасибо за ответы, с этим понятно. Но вот напоролся на такую фишку:
http://www.e-kirpich.ru/klink_kirpich.html
Данный сайт не отдает кодировку ни в заголовке, ни в теле. Реальная кодировка его win1251. Это всегда так, когда кодировка не возвращается она является win1251?
в связи с этим еще такой вопрос. Вот один из заголовков запроса к данной странице моего браузера:
Accept-Charset: windows-1251,utf-8;q=0.7,*;q=0.7
А можно ли как-то указать курлу, чтобы он получал только в utf-8?