Что лучше утф-8 или виндовс-1251 ?

SeVlad
На сайте с 03.11.2008
Offline
1609
#41
edogs:
Вот, например, сайт библиотеки, где больше 50гб русских (и только русских книг).

Это как раз тот редкий случай, о котором я говорил. :)

Но и тут может возникнуть проблема.. ну, ок, задача. Даже в "русских" текстах, а особенно в современных, могут быть символы, коих нет в 1251. Тот же евро к примеру.

Вторая проблема. Конечно, многих устраиваете сайты аля Мошкова. Но что-то мне подсказывает, что современная ЦА (юзеры) всё-таки хочет "что-то по-современнее". А как сегодня обойтись, например, без включений комментов или др сторонних включений, которые в большинстве своём всё же в ЮТФ. На каждый пук писать конвертер? А потом мучатся с вопросами в робмиках?

И третье - в ссылке, данной ранее, я не просто так говорил о "конструкции интернета". Траблы вполне реальны на хопах, серверах, проксях, провайдеров.

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.
edogs software
На сайте с 15.12.2005
Offline
775
#42
foxi:

т.е. в одной из них придется костылить, а если не ограничиваться этими двумя кодировками, то вообще хз что будет, на каждую простую и стандартную функцию нужно будет писать свой костыль замену. Кстати во многих "универсальных" движках так и делается как смотрю.

Никто не мешает поступить по аналогии с "битриксвей", хотя это конечно не совсем кошерно, но все же лучше чем костылить на каждую функцию. Конвертим строку в утф, делаем что надо, конвертим обратно. Скорость это конечно уменьшит, но поскольку это будет касаться только уже найденного текста (а не хранящегося и ищущегося - ибо в мускуле проблем с кодировками нет), выигрышь будет все равно.

foxi:
edogs, очень часто получается так, что в вин нету того что есть в утф, а в утф нету того что в вин (я про применяемые php функции).

Можно пару примеров рядовых штатных функций которые Вы используете, которые умеют что-то делать в утф, но не умеют делать то же самое с 1251?

Разработка крупных и средних проектов. Можно с криптой. Разумные цены. Хорошее качество. Адекватный подход. Продаем lenovo legion в спб, дешевле магазинов, новые, запечатанные. Есть разные. skype: edogssoft
Mad_Man
На сайте с 10.11.2008
Offline
162
#43
edogs:
Можно пару примеров рядовых штатных функций которые умеют что-то делать в утф, но не умеют делать то же самое с 1251?

mb_strimwidth и прочие по списку. Вторая половина CP1251 будет убита если не подрубить mb_* и не подсказать с кодировкой исходника.

edogs software
На сайте с 15.12.2005
Offline
775
#44
SeVlad:
Это как раз тот редкий случай, о котором я говорил. :)
Но и тут может возникнуть проблема.. ну, ок, задача. Даже в "русских" текстах, а особенно в современных, могут быть символы, коих нет в 1251. Тот же евро к примеру.

***8364;

SeVlad:
Вторая проблема. Конечно, многих устраиваете сайты аля Мошкова. Но что-то мне подсказывает, что современная ЦА (юзеры) всё-таки хочет "что-то по-современнее". А как сегодня обойтись, например, без включений комментов или др сторонних включений, которые в большинстве своём всё же в ЮТФ.

Не, ну если нужно то нужно.

Но и тут - можно разделять контент. Например форма комментов на той же библиотеке - вполне имеет право быть в утф. С другой стороны в "легких" случаях никто не мешает сделать //translit //ignore

SeVlad:
И третье - в ссылке, данной ранее, я не просто так говорил о "конструкции интернета". Траблы вполне реальны на хопах, серверах, проксях, провайдеров.

Дело в том, что иногда эти траблы вызывает как раз утф8. Т.е. ситуация неоднозначная.

К тому же конкретно это можно решить рекодингом в утф8 перед выдачей клиенту, да и https в общем-то рано или поздно прийдет как стандарт де-факто.

SeVlad
На сайте с 03.11.2008
Offline
1609
#45
edogs:
***8364;

И так на каждый пук? :) И как правило уже после того, как новый тест провисит nn-ное время, проиндексируется и только потом кто-то из читателей обнаружит траблу.

edogs:
Дело в том, что иногда эти траблы вызывает как раз утф8.

Вот лично я ни разу не встречал (хабр еще тоже). Зато при 1251 - сколько угодно.

edogs software
На сайте с 15.12.2005
Offline
775
#46
SeVlad:
И так на каждый пук? :) И как правило уже после того, как новый тест провисит nn-ное время, проиндексируется и только потом кто-то из читателей обнаружит траблу.

Что именно "на каждый пук"? € ? Все автоматом же преобразуется.

Вы времена latin1 не застали видать?:)

SeVlad:
Вот лично я ни разу не встречал (хабр еще тоже). Зато при 1251 - сколько угодно.

Мы встречали. При скачке файлов, при http авторизации, еще в каких-то аналогичных ситуациях.

p.s.: Вбили € в яндекс. Пишет синтаксическая ошибка 😂

Artisan
На сайте с 04.03.2005
Offline
379
#47

По поводу русских книг, попробуйте

изобразить в кодировке Windows-1251

книги Льва Толстого со вставками

на французском языке.

Если есть желание, то можно

тексты морзянкой передавать,

очень много полезностей.

Но если надо не развлекаться, а работать,

то время отладки дороже места на диске.

http://en.wikipedia.org/wiki/Morse_code

Morse code is a method of transmitting

text information as a series of on-off tones,

lights, or clicks that can be directly understood

by a skilled listener or observer without

special equipment.

http://en.wikipedia.org/wiki/Continuous_wave

Early radio transmitters could not be modulated

to transmit speech, and so CW radio telegraphy

was the only form of communication available.

CW still remained a viable form of radio communication

for many years after voice transmission was perfected,

because simple transmitters could be used.

The low bandwidth of the code signal,

due in part to low information transmission

rate, allowed very selective filters to be used

in the receiver which blocked out much of

the atmospheric noise that would otherwise

reduce the intelligibility of the signal.

www.leak.info / ДАРОМ линки конкурентов и забытых доменов
M
На сайте с 20.08.2004
Offline
376
#48

Как то тема переходит на личности... Бээээ

отец сыночка, лапочки дочки и еще одного сыночка
DV
На сайте с 01.05.2010
Offline
644
#49

edogs, если честно, какое-то высасывание проблем из пальца. Работает в юникоде огромнейшее число сайтов, и их владельцы не догадываются о каких-то "проблемах русского народа".

А уменьшение веса контента html, в сравнении со всем объёмом данных, подгружаемым на современной странице выглядит экономией на спичках.

VDS хостинг ( http://clck.ru/0u97l ) Нет нерешаемых задач ( https://searchengines.guru/ru/forum/806725 ) | Перенос сайтов на Drupal 7 с любых CMS. ( https://searchengines.guru/ru/forum/531842/page6#comment_10504844 )
edogs software
На сайте с 15.12.2005
Offline
775
#50
DenisVS:
edogs, если честно, какое-то высасывание проблем из пальца. Работает в юникоде огромнейшее число сайтов, и их владельцы не догадываются о каких-то "проблемах русского народа".

Честно говоря, вообще не поняли о каких Вы проблемах говорите. Работает и в утф8 и в 1251 куча сайтов.

Мелкие нюансы с корявыми настройками бывают в любой кодировке, на погоду это никак не влияет вообще.

DenisVS:
А уменьшение веса контента html, в сравнении со всем объёмом данных, подгружаемым на современной странице выглядит экономией на спичках.

Совершенно верно! Более того, мы об этом уже говорили тут же в топике раньше

edogs:
Размер страницы отдаваемой клиенту действительно вторичен.

Хотя если Вы упираетесь в ширину канала, а статика у Вас разбросана по облачным сервисам, то разница в полтора раза в объеме страницы может быть заметна. Для 80 мбит достаточно дешевых 100мбит, а вот для 120 мбит приходится уже гигабит покупать:)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий