ISO/IEC 646

A Wikipédiából, a szabad enciklopédiából

Az ISO 646 az ISO nemzetközi szabványa, ami a 7 bites karakter kódolást határozza meg, és amelyből számos nemzeti szabvány is származik, amelyek közül az egyik legismertebb az ASCII. Mivel az ISO 646 egyes részei minden ország részére közösek, a szabvány angol ábécéjét, míg más országok számára a latin ábécét határozták meg, kiegészítve a nemzeti ábécé (nyelv) sajátosságaival, így az ISO 646 képes kezelni a különböző nyelveket. Mivel jelenleg nincs mindenki által elfogadott 8 bites byte kódolási szabvány nemzeti nyelvekre, így a nemzeti nyelveket csak 7 bites formában lehet szabványosan kódolni, ezért néhány karakter, ami az ASCII-ben szerepel, hiányzik az ISO 646 nemzeti változataiból.

Története[szerkesztés]

Az ISO/IEC 646 és elődjei, az ASCII, az ANSI X3.4, jelentették a telekommunikációs iparban a meghonosodott gyakorlatot.

Az 1960-as évektől szinte állandóan felmerült a karakter kódolási szabványok egységesítésének igénye (mind a nemzeti, mind a nemzetközi szervezetek szintjén), mivel 1) a telekommunikációs ipar létező gyakorlatát követték (amely akkor még többnyire lyukszalag alapú volt, viszont általánosan használták online digitális kábeleken való átvitelek esetében), vagy esetleg 2) a szintén létező, számítógépiparban elterjedt lyukkártya gyakorlat egy részének használata, amit a 2. világháborús és későbbi elektromechanikus lyukkártya gépektől örököltek a digitális számítógépek. Néha a cégek történeti okokból folytatták a Hollerith-lyukkártyák használatát, ahogyan az IBM is beépítette az EBCDIC kódolásba a "kártyás" elemeket, valamint ehhez csatlakoztak más gyártók is, így lassan egy telekommunikációs ipari karakter kódolási szabvány alakult ki.

Az ISO 8859 sorozatú szabványok meghatározták a 8 bites karakter kódolási szabványokat, amik kiváltották az ISO 646 nemzetközi szabványt és annak nemzeti változatait. Az ISO/IEC 10646 szabvány, direkt kapcsolódva a Unicode-hoz, kiváltotta az összes ISO 646-os és ISO 8859-es kódkészletek nemzeti változatait egy egységes karakter kódkészlettel és kódolási eljárással.

Nemzeti változatok[szerkesztés]

Az ISO 646 néhány nemzeti változata:

Kód ISO-
IR
Szabvány Használója
CA-1 121 CSA Z243.4-1985 Kanada (1. számú alternatíva, “î”-val)
(francia, klasszikus)
CA-2 122 CSA Z243.4-1985 Kanada (2. számú alternatíva, “É”-vel)
(francia, reformált írásmód)
CN 057 GB/T 1988-80 Kínai Népköztársaság (Alap Latin)
CU 151 NC 99-10:81 Kuba (Spanyol)
DE 021 DIN 66083 Németország (Német)
DK DS 2089 Dánia (Dán)
FR 069 AFNOR NF Z 62010-1982 Franciaország (Francia)
FR-0 025 AFNOR NF Z 62010-1973 Franciaország (1985. április óta elavult)
GB 004 BSI 4730 Egyesült Királyság (Angol)
GR 088 HOS ELOT Görögország (elavult)
HU 086 MSZ 7795/3 Magyarország (Magyar)
IE 207 NSAI 433:1996 Írország (ír)
 
Kód ISO-
IR
Szabvány Használója
INV ISO 646:1983 nemzetközi (invariáns készlet)
IRV 002 ISO 646:1983 Nemzetközi Referencia Változat
JA 014 JIS C 6220-1969 Japán (Romaji)
JA-O 092 JIS C 6229-1984 Japán (OCR-B)
MT ? Málta (máltai, angol)
NO 060 NS 4551 1-es változat Norvégia
NO-2 061 NS 4551 2-es változat Norvégia (1987 júniusa óta elavult)
SE 010 SEN 85 02 00 Annex B Svédország (alap svéd)
SE-C 011 SEN 85 02 00 Annex C Svédország (bővített svéd nevekhez)
T.61 102 ITU/CCITT T.61 Ajánlás Nemzetközi (Teletex)
US 006 ANSI X3.4-1968 USA (ASCII)
YU 141 JUS I.B1.002 volt Jugoszlávia (horvát, szlovén, szerb, Latin)

A későbbi szabványok bizonyos jellemzőit nemzetközi használatra különböző szabványosítási szervezetek hagyták jóvá:

Kód ISO-
IR
Jóváhagyta Eredete Használója
ES 085 ECMA IBM Spanyol (baszk, kasztíliai, katalán, galíciai)
esp 017 ECMA Olivetti Spanyol (nemzetközi)
DK-SE 009-1 SSK NATS, fő készlet Svédország és Dánia (újságok szövegeire)
FI-SE 008-1 SSK NATS, fő készlet Svédország és Finnország (újságok szövegeire)
 
Kód ISO-
IR
Jóváhagyta Eredete Használója
ita 015 ECMA Olivetti olasz
PT 084 ECMA IBM Portugália (portugál, Spanyol)
por 016 ECMA Olivetti portugál (nemzetközi)

Néhány nemzeti változat specifikumait mutatja a következő táblázat:

Kódok Minden ISO 646-os karakterkészlettel kompatibilis karakterek
bináris decimális hexa INV US T.61 JA JA-O CN IRV GB DK NO NO-2 SE SE-C DE HU FR FR-0 CA-1 CA-2 IE IS ita por PT esp ES CU MT YU
010 0010 34 22 " " " " " " " " " " " " " " " " " " " " " " " " " " " " "
010 0011 35 23   # # # # # # £ # # § # # # # £ £ # # £ # £ # £ # # # # #
010 0100 36 24   $ ¤ $ $ ¥ $ $ $ $ $ ¤ ¤ $ ¤ $ $ $ $ $ $ $ $ $ $ $ ¤ $ $
010 1001 39 27 ' ' ' ' ' '
010 1100 44 2C , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,
010 1101 45 2D - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
010 1111 47 2F / / / / / / / / / / / / / / / / / / / / / / / / / / / / /
100 0000 64 40   @ @ @ @ @ @ @ @ @ @ @ É § Á à à à à Ó Ð § § ´ § · @ @ Ž
101 1011 91 5B   [ [ [ [ [ [ [ Æ Æ Æ Ä Ä Ä É ° ° â â É Þ ° Ã Ã ¡ ¡ ¡ ġ Š
101 1100 92 5C   \   ¥ ¥ \ \ \ Ø Ø Ø Ö Ö Ö Ö ç ç ç ç Í \ ç Ç Ç Ñ Ñ Ñ ż Đ
101 1101 93 5D   ] ] ] ] ] ] ] Å Å Å Å Å Ü Ü § § ê ê Ú Æ é Õ Õ ¿ Ç ] ħ Ć
101 1110 94 5E   ^   ^ ^ ^ ˆ ˆ ˆ ˆ ˆ ˆ Ü ˆ ˆ ^ ˆ î É Á Ö ˆ ˆ ˆ ˆ ¿ ¿ ˆ Č
101 1111 95 5F _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
110 0000 96 60   `   `   ` ` ` ` ` ` ` é ` á µ µ ô ô ó ð ù ` ` ` ` ` ċ ž
111 1011 123 7B   {   { { { { { æ æ æ ä ä ä é é é é é é þ à ã ã ° ´ ´ Ġ š
111 1100 124 7C   | | | | | | | ø ø ø ö ö ö ö ù ù ù ù í | ò ç ç ñ ñ ñ Ż đ
111 1101 125 7D   }   } } } } } å å å å å ü ü è è è è ú æ è õ õ ç ç [ Ħ ć
111 1110 126 7E   ~     ~ ˜ ˜ ˜ ¯ | ˜ ü ß ˝ ¨ ¨ û û á ö ì ° ˜ ˜ ¨ ¨ Ċ č

A fenti táblázatban a nem fehér cellák jelzik a különbségeket az amerikai változat, az ISO/IEC 10646 által használt "alap latin készlet" illetve a Unicode között.

A piros cellákban lévő karakterek használhatók, mint úgynevezett "kombinált diakritikus" karakterek, azaz a karaktereket követő vagy megelőző visszalépés – backspace C0 segítségével speciális ékezetes karakterek kialakításához használhatók (ez a kódolási módszert néhány, már érvénytelen, régebbi szabvány korlátozta, illetve nem támogatta). Komplex kódolás nélkül ezek a szimbólumok nem különböznek az amerikai változatban használt szimbólumoktól (bár bizonyos eltérések lehetségesek az idézőjeleknél, a tilde, illetve a circumflex szimbólumnál).

Később, amikor a 8 bites karakter készletek előtérbe kerültek, fokozatosan az ISO 8859-1, az ISO 8859-2, és az ISO 8859-3 lettek a preferált karakter kódolási módszerek, illetve ezek nemzeti változatai.

ASCII változatok, amelyek nem tartoznak az ISO 646 alá[szerkesztés]

Számos olyan 7 bites karakterkészlet van, amelyek nem hivatalos részei a ISO 646 szabványnak. Néhány példa:

  • 7 bites görög, ELOT 927. A görög ábécé a 0x61–0x71 és a 0x73–0x79 pozíciókra került, a kisbetűs latin karakterkészlet "tetejére". Ez az elrendezés jelenik meg 8 bites változatban az ISO 8859-7-nél.
  • 7 bites cirill, a KOI-7 vagy rövid – short – KOI. A cirill karakterek a 0x60–0x7E pozíciókba kerültek, a kisbetűs latin karakterkészlet "tetejére". A KOI-8 változat megjelenése óta jelentőségét vesztette.
  • 7 bites héber, SI 960. A héber ábécé a 0x60–0x7A pozíciókba került, a kisbetűs latin karakterkészlet tetejére. A 7 bites héber mindig a megjelenítés sorrendjében van tárolva. 8 bites változata (a héber karakterek a This 0xE0–0xFA pozíciókban) a ISO 8859-8.
  • 7 bites arab, ASMO 449. Az arab ábécé a 0x41–0x5A és a 0x60–0x6A pozíciókba került, a latin kis-és nagybetűk "tetejére". A 8 bites változata a ISO 8859-6.

Kapcsolódó szócikkek[szerkesztés]

Egyéb, idegen nyelvű hivatkozások[szerkesztés]