Кодировка Win-1251

богоносец
На сайте с 30.01.2007
Online
717
#41
Xubart #:
Посмотрел сохраненку Яндекса

Она отдаётся с HTTP-заголовком   Content-Type: text/html; charset=utf-8    и этого достаточно для проблем с отображением именно сохраненки. Но дописываем в адресной строке перед урлом сохраненки      view-source: 

<!DOCTYPE html><html lang=en><meta http-equiv=Content-Type content="text/html; charset=utf-8"><meta name=viewport content="width=device-width,initial-scale=1"><base href="https://..."><style> /* много стилей яндекса */ </style><div id=yandex-cache-hdr><b style="margin:8px 0;float:left;font-size:16px">Копия страницы...

<!-- код исходной страницы  --> <!DOCTYPE html><html lang="ru"><head>

<meta http-equiv="Content-Type" Content="text/html; Charset=Windows-1251"> 


Т.е. формировалка сохраненки игнорирует кодировку страницы, поленились яндексоиды, надо было свою вставку в начале html-кода страницы делать не в utf или преобразовать  исходную страницу в utf-8 / не указывать http-заголовка кэша... 

братьям-мракобесам надо гневно попинать яндексоидов.


При проверке по url:domain.ru/page – все буквы в выдаче нормальные, т.е. индексатор воспринял всё правильно. Проблема исключительно при формировании/просмотре кэша.

fliger
На сайте с 17.09.2015
Offline
85
#42

LEOnidUKG #:

у них всегда UTF-8 ради вашего одного сайта на w1251, это что касается сохранённой копии

На моих в сохраненных копиях Яндекс ставит windows-1251, а в Гугле - UTF-8.

богоносец
На сайте с 30.01.2007
Online
717
#43
fliger #:
На моих в сохраненных копиях Яндекс ставит windows-1251

Каким образом "ставит"? Посмотрите у кэша HTTP-заголовок  Content-Type   и  выложите тут HTML-код  шапки, вставляемой в кэш про  "Копия страницы... Яндекс не связан"... с началом html-кода самой страницы.

and2005
На сайте с 21.05.2005
Offline
143
#44
богоносец #:
Каким образом "ставит"? Посмотрите у кэша HTTP-заголовок  Content-Type   и  выложите тут HTML-код  шапки, вставляемой в кэш про  "Копия страницы... Яндекс не связан"... с началом html-кода самой страницы.


<!DOCTYPE html><html lang=en><meta http-equiv=Content-Type content="text/html; charset=windows-1251"><meta name=viewport content="width=device-width,initial-scale=1"><base href="https://www.LLLLL.html"><style>body{margin:0;min-width:320px}#yandex-cache-hdr{background:#f2f2f2;font:14px arial,sans-serif;text-align:left;color:#151a1f;line-height:18px;margin:0;padding:6px 16px 16px;border:0;border-bottom:1px solid #c9cdd1;overflow:hidden}#yandex-cache-hdr *{display:inline;font:inherit;text-align:inherit;color:inherit;line-height:inherit;background:0 0;border:0;margin:0;padding:0;letter-spacing:0}#yandex-cache-hdr a{text-decoration:none;color:#969a9e;font-weight:700}#yandex-cache-hdr>div>*{margin-left:16px;padding:8px 0}#yandex-cache-hdr b{font-weight:700;color:#151a1f}#yandex-cache-hdr div{display:block;margin-top:8px}#yandex-cache-hdr>div{margin:14px -16px -30px -32px;padding:0 16px 30px 16px;clear:both}#yandex-cache-hdr>div svg{vertical-align:text-top;margin-right:5px}#yandex-cache-hdr>span:nth-child(2){clear:left}#yandex-cache-hdr>div>*{position:relative}#yandex-cache-hdr>div b::after{position:absolute;bottom:-9px;left:0;display:block;width:100%;content:'';border-top:3px solid #000}@media (min-width:850px){#yandex-cache-hdr{padding:14px 32px 16px}#yandex-cache-hdr>div>*{margin-left:24px}#yandex-cache-hdr i{display:none}#yandex-cache-hdr a:hover,#yandex-cache-hdr a:hover svg{fill:#65686b;color:#65686b}#yandex-cache-hdr>span:nth-child(2){clear:unset;margin-top:8px}#yandex-cache-hdr>span:nth-child(2)::first-letter{text-transform:lowercase}#yandex-cache-hdr>span:nth-child(4){float:right;margin-top:14px}#yandex-cache-hdr>div{margin:14px -16px -30px -40px;clear:left;float:left}}</style><div id=yandex-cache-hdr><b style="margin:8px 0;float:left;font-size:16px">Копия страницы&nbsp;</b><span style=float:left>От 10 January 2022 18:33:12 GMT<i>.&nbsp;</i></span><span style="text-align:right;display:block;white-space:nowrap;padding:8px 0 4px"><a href=https://www.LLLLL.html target=_blank style="padding:8px 0"><span style=display:inline-block;width:40vw;max-width:151px;overflow:hidden;text-overflow:ellipsis>Актуальная страница</span><svg width=16 height=16 fill=#969a9e style=margin-left:6px><path d="M14 9.503a1 1 0 011 1v3a1.5 1.5 0 01-1.5 1.5h-11a1.5 1.5 0 01-1.5-1.5v-11a1.5 1.5 0 011.5-1.5h3a1 1 0 110 2H3v10h10v-2.5a1 1 0 011-1zm-1.7-6.716v-.323l-1.15.314a6.258 6.258 0 01-1.65.221c-.6 0-1-.447-1-1a1 1 0 011-1H14a1 1 0 011 1v4.504a1 1 0 01-1 1c-.552 0-1-.403-1-1a6.3 6.3 0 01.222-1.656l.313-1.147h-.32l-1.078 1.437a10 10 0 01-.93 1.072l-3.5 3.498a1 1 0 11-1.414-1.414l3.5-3.5c.334-.332.69-.64 1.065-.923L12.3 2.787z"/></svg></a></span><span>Яндекс не связан с&nbsp;авторами и&nbsp;содержимым страницы</span><div style="padding:0 16px 30px 16px;white-space:nowrap;overflow-x:auto"><span><svg width=16 height=16 fill=#151a1f><path d="M13.5 1.003h-11a1.5 1.5 0 00-1.5 1.5v11a1.5 1.5 0 001.5 1.5h11a1.5 1.5 0 001.5-1.5v-11a1.5 1.5 0 00-1.5-1.5zM5.224 9.87L3 12.836V3.003h10v7.214l-2.569-2.752a.5.5 0 00-.781.063l-1.88 2.82a.5.5 0 01-.682.147L5.89 9.746a.5.5 0 00-.665.124zM7.5 6.003a1.5 1.5 0 11-3 0 1.5 1.5 0 013 0z"/></svg><b>Полная версия</b></span><a href=https://yandexwebcache.net/yandbtm?fmode=inject&amp;tm=1642417425&tld=ru&lang=ru&la=1642173824&text=%D0%BA%D0%B0%D1%82%D0%BE%D0%BA+%D0%B2%D0%B4%D0%BD%D1%85&url=https%3A//www.LLLLL.html&l10n=ru&mime=html&sign=14fb13276a3098980efd0159e3cb0687&keyno=0&mode=text><svg width=16 height=16 fill=#969a9e><path fill-rule=evenodd d="M3.5.003h4.757A3 3 0 0110.38.88l1.12 1.123 1.621 1.621A3 3 0 0114 5.745v8.758a1.5 1.5 0 01-1.5 1.5h-9a1.5 1.5 0 01-1.5-1.5v-13a1.5 1.5 0 011.5-1.5zm4.5 2v3a1 1 0 001 1h3v8H4v-12h4z"/></svg><span>Только текст</span></a></div></div><div style=position:relative>

Вы это имели в виду?

kustov
На сайте с 23.04.2021
Offline
32
#45

Вот три сайта на windows1251:

1 - нормально показывает:


2 - криво


3  - криво

suffix
На сайте с 26.08.2010
Offline
301
#46
богоносец #:

Она отдаётся с HTTP-заголовком   Content-Type: text/html; charset=utf-8    и этого достаточно для проблем с отображением именно сохраненки. Но дописываем в адресной строке перед урлом сохраненки      view-source: 

<!DOCTYPE html><html lang=en><meta http-equiv=Content-Type content="text/html; charset=utf-8"><meta name=viewport content="width=device-width,initial-scale=1"><base href="https://..."><style> /* много стилей яндекса */ </style><div id=yandex-cache-hdr><b style="margin:8px 0;float:left;font-size:16px">Копия страницы...

<!-- код исходной страницы  --> <!DOCTYPE html><html lang="ru"><head>

<meta http-equiv="Content-Type" Content="text/html; Charset=Windows-1251"> 


Т.е. формировалка сохраненки игнорирует кодировку страницы, поленились яндексоиды, надо было свою вставку в начале html-кода страницы делать не в utf или преобразовать  исходную страницу в utf-8 / не указывать http-заголовка кэша... 

братьям-мракобесам надо гневно попинать яндексоидов.


При проверке по url:domain.ru/page – все буквы в выдаче нормальные, т.е. индексатор воспринял всё правильно. Проблема исключительно при формировании/просмотре кэша.

Поддерживаю.

Проверил - у меня сайт в 1251 и в сохранённой копии яндекса крякозябры ибо он дописывает

<meta http-equiv=Content-Type content="text/html; charset=utf-8">

вверху стрницы :(

Клуб любителей хрюш (https://www.babai.ru)
suffix
На сайте с 26.08.2010
Offline
301
#47

Хотя у опеннет в сохранённой копии правильно определяет аж кои8-у

https://yandexwebcache.net/yandbtm?fmode=inject&amp;amp;amp;tm=1642424168&tld=ru&lang=ru&la=1642233856&text=opennet&url=https%3A//www.opennet.ru/&amp;amp;amp;l10n=ru&mime=html&sign=27272af779184f9725da7d4f89863bd9&keyno=0

богоносец
На сайте с 30.01.2007
Online
717
#48
kustov #:

Вот три сайта на windows1251:

1 - нормально показывает:
2 - криво
3  - криво

Самый подробный ответ, ещё с путаницей HTTP-заголовков осталось...    а мне ТС один кривой пример показал.

Значит у яндексоидов бывает и нормальная формировалка кэшей. 

and2005 #:
Вы это имели в виду?

Да, и ещё бы начало html-кода исходной страницы (какой там мета-тег указан), и HTTP-заголовок кэша... хотя примеры в теме уже есть.   Браузеры в этой путанице указаний кодировки могут и не разобраться.

kustov
На сайте с 23.04.2021
Offline
32
#49
богоносец #:
ещё с путаницей HTTP-заголовков осталось...
что за путаница заголовков?
suffix
На сайте с 26.08.2010
Offline
301
#50
богоносец #:  Да, и ещё бы начало html-кода исходной страницы (какой там мета-тег указан)

У меня в исходной странице:

<meta http-equiv="Content-Type" content="text/html; charset=windows-1251" />

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий