DBCS

Двоба́йтовий набі́р си́мволів або DBCS (англ. double-byte character set) - стандартна таблиця для кодування символів.

Термін має два базових значення:

  • В ІТ індустрії Китаю, Японії, Кореї, термін «DBCS» зазвичай означає набір символів, в якому будь-який графічний символ, не представлений в SBCS (наборі однобайтних символів), закодований у двох байтах. Під графічними символами тут розуміються, в основному, ієрогліфи.
  • Термін «DBCS» також означає набір символів, в якому всі символи (включаючи керуючі), закодовані в двох байтах.

Приклади DBCS кодування

  • Розширення національного стандарту GBK. Це розширення доповнює національний «Промисловий стандарт GB», доповнений стандарт включає 20902 визначених у Unicode символів Хан і додаткові символи DBCS, визначені в коді Big-5 (стандарт де-факто традиційної китайської мови для ПК). Такий стандарт GBK містить всі символи DBCS, застосовувані в КНР і на Тайвані. В даний час GBK визнаний нормативним доповненням стандарту GB13000 (КНР стандарт Unicode) і розглядається як проміжна ланка для переходу до Unicode.
  • IBM- eucTW. EUC для традиційного китайського мови - це кодовий набір, що складається з одно- , двох - і чотирьохбайтових символів. Дане кодування EUC заснована на стандарті ISO2022, стандарті CNS, визначеному в Китаї, і визначеннях мультибайтних символів, унікальних для виробника.

Стандарт CNS кодує 13501 символ китайської мови і 684 додаткових знаки. IBM-eucTW містить 15 кодових таблиць по 8836 ( 94x94 ) символів кожна. Кодові значення лежать в інтервалі 0xa1a1 - 0xfefe. В даний час тільки 4 таблиці кодують символи, а решта зарезервовані для використання в майбутньому.

  • Двобайтні символи набору IBM-943[1]

Див. також

Примітки

  1. Кодовые наборы - Обзор [Архівовано 25 травня 2013 у Wayback Machine.](рос.)
  • п
  • о
  • р
Кодування символів
Історичні
кодування
докомп'ютерні
семафорна (Макарова)
Морзе
Бодо
МТК-2
комп'ютерні
6-бітне
УПП
RADIX-50
EBCDIC
ДКОІ
КОІ-7
ISO 646
сучасне
8-бітове
подання
символи
ASCII
керувальні
друковані
не-ASCII
псевдографіка
8-бітові код.стор.
кирилиця
КОІ-8
Основне кодування
MacCyrillic
ISO 8859
1 (лат.)
2
3
4
5 (кир.)
6
7
8
9
10
11
12
13
14
15 (€)
16
Windows
1250
1251 (кир.)
1252
1253
1254
1255
1256
1257
1258
WGL4
IBM & DOS
437
850
852
855
866 «альт.»
МІК
Багатобайтові
традиційні
DBCS
GB2312
HTML
юнікод
UTF-32
UTF-16
UTF-8
список символів
кирилиця