Кто-нибудь работал с иероглифическими языками?

wolf
На сайте с 13.03.2001
Offline
1183
480

Столкнулся с проблемой с документом на японском. Кодировка utf-8. Гугль документ проиндексировал, кеш его в наличии, а вот выдавать документ по запросам, взятым из контента документа, не хочет. Документа просто нет в выдаче. Если загрузить документ в браузер, с помощью соответствующей кнопочки Гугль-бара ("Toggle highlighting of search terms on this page" - иконка с желтым маркером) фразы подсвечиваются. Глянул кодировку у тех документов, которые присутствуют в выдаче, попадаются только специфические японские типа EUC-JP или shift_jis. Насколько помню, с русскоязычными документами в кодировке UTF-8 подобных проблем не возникало...

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
AiK
На сайте с 27.10.2000
Offline
257
AiK
#1

wolf, есть сильное подозрение, что иероглифы это всё же utf-16.

Т.е. у тебя получается эффект, аналогичный использованию 7-ми битной кодировки для русского.

LF
На сайте с 08.06.2005
Offline
6
#2

wolf, Все нормально работает с utf-8.

Проверено на японском и китайском.

В ODP не просто так переходили на utf-8 ;)

EUC-JP и UTF-8 для гугла все равно, что CP1251 и UTF-8.

wolf
На сайте с 13.03.2001
Offline
1183
#3
wolf, Все нормально работает с utf-8.
Проверено на японском и китайском

Тогда будем разбираться. Что-то не так, видимо, с кодировками...

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий