Главная » Java » Наборы символов Java

0

Большинству программистов знаком исходный код, подготовленный с помощью двух основных семейств представлений символов: ASCII с его различными вариантами (включая Latin-l) и EBCDIC. В состав обоих наборов входят символы английского и нескольких восточноевропейских языков .

Язык программирования Java ориентирован на применение Uпicode - универсального 16-битового набора символов. Первые 256 символов Unicode соответствуют набору (таблице) Latin-1, а большинство начальных 128 символов Latin-1 равнозначны 7 -битовому набору символов ASCII. Современные Исполняющие системы Java способны корректно читать файлы в формаmax ASCII или Latin-1 и преобразовывать их данные в Unicode "на лету"!

Существует ряд текстовых редакторов, которые поддерживают символы Unicode, позволяя задавать их посредством еsсаре-последовательностей вида \uхххх, где каждый символ Х обозначает шестнадцатеричную цифру. Десятичные значения в интервале от 0 до 9 обозначаются цифрами 0-9, а в интервале от 10 до 15 – цифрами a-f либо A-F. Подобные еsсаре-последовательности разрешается использовать в любом месте кода – не только в тексте символьных или строковых литералов, но и в идентификаторах. В начале escape последовательности допускается задавать более одного символа u:

 

Источник: Арнолд, Кен, Гослинг, Джеймс, Холмс, Дэвид. Язык программирования Java. 3-е изд .. : Пер. с англ. – М. : Издательский дом «Вильяме», 2001. – 624 с. : ил. – Парал. тит. англ.

По теме:

  • Комментарии