abc Programski jezik Java
Teorijska priprema - Unicode sistem

Unicode je univerzalno internacionalno standardno kodiranje karaktera koje je u stanju da reprezentuje većinu svjetskih pisanih jezika.
Zašto Java koristi Unicode sistem?
Prije Unicode-a, postojalo je mnogo jezičkih standarda:

  • ASCII (American Standard Code for Information Interchange) za SAD.
  • ISO 8859-1 za zapadnoevropske jezike.
  • KOI-8 za ruski.
  • GB18030 and BIG-5 za kineski, itd.

Ovo je uzrokovalo dva problema:

  1. Određena vrijednost koda odgovara različitim slovima u raznim jezičkim standardima.
  2. Kodiranja za jezike sa velikim skupom karaktera imaju promjenljivu dužinu. Neki česti karakteri su kodirani sa jednim bajtom, drugi zahtijevaju dva ili više bajtova.

Da bi se riješili ovi problemi, razvijen je novi jezički standard, tj. Unicode sistem.
U Unicode-u, karakter ima 2 bajta, pa tako i Java koristi 2 bajta za karaktere.


Najniža vrijednost:\u0000

Najviša vrijednost:\uFFFF

Varijabla i tip podataka u Javi    <    Index    >    Naredba if - else u Javi