ternet.ru

ternet.ru
Рейтинг
140
Регистрация
12.09.2007
Лимончик:
Для слов: горец, перец, пипец получил перевод gorets perets pipets. На мой взгляд gorec perec pipec было бы гораздо лучше.

Горек, перек, пипек?

Netter:
То есть, по-Вашему, фиалка = fialka, киянка = kianka
Отличия "а" от "я" стираются напрочь? Фиялка и кианка рулят? :)

Что-то я Вас не понял...

Фиалка - fialka.

Киянка - kiyanka.

Можете проверить.

А что касается стирания границ между "а" и "я":

"ья" = "ia"

И всё.

Или Вы считаете - могут быть иные варианты?

Netter:
P.S. Кстати, а какой транслит считать правильным? Translit.ру всё усложняет - d'javol.

:D

По версии пока непризнанного translit.биз - diavol.

Надо же... Уже цитируют :)

Да, уверяю Вас, правильно будет именно diavol

temniy:
А вот это как раз и плохо, ибо такое отношение и порождает плюрализм мнений в этом вопросе.

ГОСТ это и есть введение единообразия. Другое дело, что ГОСТ во многих случаях не прав, и его просто надо бы пересмотреть. Скажем, имхо, транслитерировать щ как shsch (или как оно там и не помню уже) - полный бред, правильно - sch. А в остальном я за ГОСТ.

Ну а как некий сервис - безусловно неплохо и интересно. Во всяком случае в большинстве случаев сам транслитерирую так же.

У алгоритма представленного сервиса цель сводится к тому, чтобы наиболее доступно для восприятия перевести кириллицу на латиницу, использовав при этом как можно меньшее кол-во букв. Возьмем, например, слово "восход" - в данном случае нельзя заменять букву "х" на h, т.к. она стоит рядом с s и в итоге получится "вошод", поэтому она заменяется на kh. А вот в слове "доход" таких помех нету и поэтому такое слово будет переведено как dohod, что является более удачным вариантом, т.к. использовано меньшее кол-во букв.

А используя ГОСТ, как правило, получается излишнее нагромождение букв (и именно в этом его минус для доменов).

ternet.ru добавил 24.05.2009 в 15:26

_interceptor_:
Забудте про транслит в доменах, этот костыль пора выбрасывать на помойку,
он уже сослужил хорошую службу, но теперь жутко устарел.

...и вот тут Вы, конечно, должны были сказать, что "да здравствует новая зона РФ на кириллице, долой транслит!" :D

Я даже удивлен, почему Вы это не сказали?

Etranger:
может лучше вместо "ц" - английское "c", а не ts.

Буква "ц" заменяется на ts далеко не во всех случаях. Проверьте - как будут обработаны слова "цифра" и "Липецк".

Ну и никогда не соглашусь с Yu - Ю.

Буква "ю" заменяется на yu далеко не во всех случаях, а именно там, где необходимо подчеркнуть, что это именно "ю", а не "у". Проверьте - как будут обработаны слова "рюмка" и "Юрий".

MVK2:
Скажу Вам как человек, у которого высшее лингвистическое образование. Транслитерация - дело очень не однозначное.

Во-первых, есть два вида транслита:
1) транслит латиницей, когда каждая буква русского алфавита заменяется в соответствии с имеющимися правилами (или тем же ГОСТом) на соответствующую букву латинского алфавита.

2) английская транслитерация - переводческая трансформация, которая используется для перевода русских слов на английский язык. В основе ее также лежит латинский транслит, но с различного рода изменениями и индивидуальными особенностями. Также можно выделить немецкую, французскую и другие транслитерации, просто английская самая распространенная.

Спасибо за подробные разъяснения.

Во-вторых, транслитерация очень сильно зависит от микроконтекста, т.е. позиции буквы в слове и того, какие буквы ее окружают (гласные или согласные). Именно поэтому разные варианты транслитерации имеет буква "х", или "й", в зависимости от той позиции в слове, которую они занимают.

Именно транслитерация с учетом таких особенностей и была реализована в алгоритме данного сервиса. Как я уже подчеркнул, это не банальная замена букв по таблице, а именно замена с учетом расположения букв в слове. Поэтому она и нетривиальная. Прочие же сервисы (например, translit.ru) выполняют именно тривиальную замену.

В-третьих, географические названия и имена собственные в абсолютном большинестве случаев не транслитерируются, а заменяются на устойчивые переводческие эквиваленты. Цхинвал - Tskhinval, Москва - Moscow и т.д.

Moskva - разве плохой транслит? (для домена, например)

Какие отсюда выводы?

Прийти к единому соглашению по транслиту, на мой взгляд, невозможно. Так же как существуют несколько вариантов перевода одного слова, в некоторых (подчеркиваю - не во всех) случаях могут существовать несколько вариантов транслитерации. Соответсвенно сделать сервис, который бы учитывал все особенности транслита (микроконтекст, гео имена), чрезвычайно сложно.

Но Ваш сервис, ТС, безусловно, протестирую :)

Я согласен с Вами, что придти к общему соглашению очень сложно, однако вполне возможно придти к соглашению по транслитерации для доменов. Ведь именно в этом случае очень важно составить именно правильный транслит.

Буду очень благодарен, если результаты тестирования опубликуете здесь.

Hedden, iren K, спасибо за отзывы :)

pupkin, а это тогда что? - http://ru.wikipedia.org/wiki/Цхинвал

http://tskhinval.ru/

Мехалоч:
для чего это?

Вот этого вопроса я ожидал меньше всего ;)

для того чтобы доказать что говнодомены имеют гораздо бОльшую ценность чем они ее имеют на самом деле?

Причем здесь "говнодомены"?

ternet.ru добавил 24.05.2009 в 12:52

_mihey:
по транслиту есть ГОСТ, описывающий, что на что меняется. О чем топег?

ГОСТ, говорите? Ну, хорошо, переведите по ГОСТу название города Цхинвал. Результат киньте сюда, пожалуйста.

art11:
Как вы защищаете .Com домены, чтобы их не увели злобные хакеры?

Ру-центром :)

А вообще, действительно, сейчас уже нужно домены не столько от хацкеров защищать, сколько от самого регистратора (чтоб не засуспендил).

Всего: 1301