Кто-нибудь работал с иероглифическими языками?

1183

wolf

3 ноября 2005, 10:01

496

Столкнулся с проблемой с документом на японском. Кодировка utf-8. Гугль документ проиндексировал, кеш его в наличии, а вот выдавать документ по запросам, взятым из контента документа, не хочет. Документа просто нет в выдаче. Если загрузить документ в браузер, с помощью соответствующей кнопочки Гугль-бара ("Toggle highlighting of search terms on this page" - иконка с желтым маркером) фразы подсвечиваются. Глянул кодировку у тех документов, которые присутствуют в выдаче, попадаются только специфические японские типа EUC-JP или shift_jis. Насколько помню, с русскоязычными документами в кодировке UTF-8 подобных проблем не возникало...

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )

257

AiK

3 ноября 2005, 12:27

#1

wolf, есть сильное подозрение, что иероглифы это всё же utf-16.

Т.е. у тебя получается эффект, аналогичный использованию 7-ми битной кодировки для русского.

LF

6

LeoFix

3 ноября 2005, 14:56

#2

wolf, Все нормально работает с utf-8.

Проверено на японском и китайском.

В ODP не просто так переходили на utf-8 ;)

EUC-JP и UTF-8 для гугла все равно, что CP1251 и UTF-8.

1183

wolf

5 ноября 2005, 09:11

#3

wolf, Все нормально работает с utf-8.
Проверено на японском и китайском

Тогда будем разбираться. Что-то не так, видимо, с кодировками...

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах

Что делать, если ваша email-рассылка попала в спам