Magyar ékezetes karakterek kódkészletekben
A kódkészletek megalkotásánál a magyar nyelv a besorolása szerint latin2-es kódkiosztásba került. A korábban általánosan elterjedt kódkészlet a latin1 viszont nem tartalmazza az összes magyar betűt, ill. néhánynak mivel azonos a kódja a latin1-ben és latin2-ben helyettesíthető ezekkel.
A magyar ékezetes betűk, a magyar tipográfia néhány gyakran használt írásjeleit, valamint néhány nem magyar (ám tévedésből magyar szövegben gyakran szereplő) betű kódját vesszük górcső alá a legkülönfélébb karakterkészletekben.
Linux terminál
Az ASCII kiosztást a Linux terminálon kiadott man ascii
, míg a Latin-1 és Latin-2 kiosztás ékezetes betűit a man iso-8859-1
és man iso-8859-2
paranccsal tekinthetjük meg.
Megjegyzés
A 256-nál kisebb értékű Unicode kódok megegyeznek a Latin-1 kódokkal, amelyik pedig, ha csak a magyar betűkre szorítkozunk, az ő és ű (valamint a megfelelő nagybetűs párjuk) kivételével megegyeznek a Latin-2-es kódokkal. A legtöbb magyar betű Latin-2 és Unicode értéke megegyezik, de az ő és ű betűké nem. UTF-.8 esetén az összes említett ékezetes karakter 2 bájt hosszú.
Összehasonlító táblázat
A táblázatban megtalálhatók a régi (Latin-2) és új (Unicode, UTF-8) kódérték. Ha egy karakterkészlet nem képes a magyar nyelv ékezetes betűinek támogatására, az üresen maradt.
Az Unicode oszlopban található kód értékek nem férnek el 1 byte-ban (256-nál nagyobb értékek), ezért változó - általában kettő vagy több bájttal reprezentálhatók UTF-8-as karakterekként.
Kódkészletek | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
Karakter | CP437 | CP850 | CP852 | CWI-2 | Latin-1 | Latin-2 | Windows-1252 | Windows-1250 | Unicode (UCS-16) | UTF-8 |
Á | B5 | B5 | 8F | C1 | C1 | C1 | C1 | 00 C1 | C3 81 | |
É | 90 | 90 | 90 | 90 | C9 | C9 | C9 | C9 | 00 C9 | C3 89 |
Í | D6 | D6 | 8D | CD | CD | CD | CD | 00 CD | C3 8D | |
Ó | E0 | E0 | 95 | D3 | D3 | D3 | D3 | 00 D3 | C3 93 | |
Ö | 99 | 99 | 99 | 99 | D6 | D6 | D6 | D6 | 00 D6 | C3 96 |
Ő | 8A | A7 | D5 | D5 | 01 50 | C5 90 | ||||
Ú | E9 | E9 | 97 | DA | DA | DA | DA | 00 DA | C3 9A | |
Ü | 9A | 9A | 9A | 9A | DC | DC | DC | DC | 00 DC | C3 9C |
Ű | EB | 98 | DB | DB | 01 70 | C5 B0 | ||||
Ô (kalapos) | E2 | E2 | D4 | D4 | D4 | D4 | 00 D4 | C3 94 | ||
Õ (hullámos) | E5 | D5 | D5 | 00 D5 | C3 95 | |||||
Û (kalapos) | EA | DB | DB | 00 DB | C3 9B | |||||
Ũ (hullámos) | 01 68 | C5 A8 | ||||||||
á | A0 | A0 | A0 | A0 | E1 | E1 | E1 | E1 | 00 E1 | C3 A1 |
é | 82 | 82 | 82 | 82 | E9 | E9 | E9 | E9 | 00 E9 | C3 A9 |
í | A1 | A1 | A1 | A1 | ED | ED | ED | ED | 00 ED | C3 AD |
ó | A2 | A2 | A2 | A2 | F3 | F3 | F3 | F3 | 00 F3 | C3 B3 |
ö | 94 | 94 | 94 | 94 | F6 | F6 | F6 | F6 | 00 F6 | C3 B6 |
ő | 8B | 93 | F5 | F5 | 01 51 | C5 91 | ||||
ú | A3 | A3 | A3 | A3 | FA | FA | FA | FA | 00 FA | C3 BA |
ü | 81 | 81 | 81 | 81 | FC | FC | FC | FC | 00 FC | C3 BC |
ű | FB | 96 | FB | FB | 01 71 | C5 B1 | ||||
ô (kalapos) | 93 | 93 | 93 | F4 | F4 | F4 | F4 | 00 F4 | C3 B4 | |
õ (hullámos) | E4 | F5 | F5 | 00 F5 | C3 B5 | |||||
û (kalapos) | 96 | 96 | FB | FB | 00 FB | C3 BB | ||||
ũ (hullámos) | 01 69 | C5 A9 | ||||||||
– (nagykötőjel) | 01 50 | 01 50 | 20 13 | E2 80 93 | ||||||
„ (nyitó idézőjel) | 01 32 | 01 32 | 20 1E | E2 80 9E | ||||||
’ (aposztróf) | 01 46 | 01 46 | 20 19 | E2 80 99 |