MARC (formátum)

A Wikipédiából, a szabad enciklopédiából
A MARC formátum összetevői

A MARC (MAchine Readable Cataloging; magyarul: géppel olvasható katalogizálás) a könyvtárakban és a nemzeti bibliográfiai központokban általában alkalmazott adatcsere-formátum. Megjelenése szorosan összefügg a szabványosítási törekvésekkel.

A számítógép terjedésének következtében szükségessé vált a könyvtárakban, hogy a számítógép kezelni tudja a bibliográfiai adatokat, ezért szabványos kódokat rendeltek hozzájuk. A gépi katalogizálásban a bibliográfiai leírás elkészítésének, a besorolási adatok kiválasztásának és egységesítésének folyamata összeolvad az adatoknak a bibliográfiai adatcsere-formátum előírásainak megfelelő kódolásával. Ennek során a katalogizáló a gondos elemzés alapján minősített adatelemeket, adatokat a csereformátum megfelelő adatmezőiben rögzíti, a gépi rendszer pedig gondoskodik a kódolásnak megfelelő adatfeldolgozásról, az indexállományok felépítéséről, a bibliográfiai tételek megjelenítéséről.

A MARC formátum történeti háttere[szerkesztés]

Az 1960-as évek elején a Kongresszusi Könyvtár fejlesztette ki az első MARC formátumot. Az Egyesült Államokban végzett fejlesztést közvetlenül követte Nagy-Britannia.

A munka eredményeként két formátum jött létre:

  • LCMARC (későbbi nevén USMARC)
  • UKMARC

A többi nemzeti MARC formátum ezeknek a mintájára készült el.

1970-es évekre jellemző a különböző nemzeti formátumok kialakulása pl.: ANNAMARC (Olaszország), IBERMARC (Spanyolország), DANMARC (Dánia), KATMARC (Katalónia).

1973-ban a Német Szövetségi Köztársaság saját formátumot adott közre. Ez a formátum a MAB (Maschinefles Austauschformat für Bibliotheken) volt. A MAB legfőbb jellemzője, hogy fejlesztői létrehozták a különböző szintű bibliográfiai leírási rekordok – a többkötetes monográfiák, a monográfiák és analitikus leírásai – rekordjainak kapcsolására szolgáló eszközöket. Ez azért volt szükséges, mert a német nemzeti katalogizálási szabályzat (RAK = Regeln für die alphabetische Katalogisierung) előírja, hogy e sajátos bibliográfiai körülmények között többlépcsős bibliográfiai leírásokat kell alkalmazni. A MAB formátum kapcsolás technikája – mely a többlépcsős leírás bibliográfiai feltétel szükségességét felismerő határozott európai gyakorlatra támaszkodik – nagy hatással volt az UNIMARC formátum fejlesztésére.

A legelső nemzetközi MARC formátumnak az 1975-ben megjelent INTERMARC (International MARC) formátum tekinthető. Kifejlesztője a nyugat-európai könyvtárak képviselőinek egy csoportja.

1977 - az UNIMARC formátum első kiadása, mely erősen hatott a nemzeti formátumok kialakulására.

1982-ben jelent meg először, és 1992-ben vált ISO szabvánnyá a Z39.50 szabványkészlet, mely a MARC formátum és az ezzel dolgozó integrált könyvtári rendszerek szerves része.

1994 - HUNMARC magyar nemzeti MARC szabvány megjelenése.

A következő nagy változást az Internet megjelenése jelentette.

A MARC formátum szerkezete[szerkesztés]

Három szintből áll, melyek mindegyikének alkalmazása magas fokú szabványosítást igényel.

A formátum struktúrája[szerkesztés]

Mindegyik MARC formátum az ISO 2709 szabvány alkalmazásának speciális formája, mely szabvány meghatározza a bibliográfiai adatokat tartalmazó rekordok szerkezetét. Következetes alkalmazásával különböző formátumok között, lényegében egyértelmű konverzió lehetséges; lehetővé teszi a géppel olvasható bibliográfiai adatok cseréjét.

E szabvány szerint minden cserére szánt bibliográfiai rekordnak tartalmaznia kell:

  • rekord fejet, amely a rekord szerkezetével kapcsolatos
  • mutatót, mely egy-egy eleme három részből áll: a mező hívójelét, az illető mezőben található karakterek számát és a mező induló (első) karakterének a rekordon belüli pozícióját tartalmazza
  • változó hosszúságú adatmezőket. Ezek indikátorokat, almezőazonosítókat és adatokat tartalmaznak.

A tartalmi azonosító kódok[szerkesztés]

A mezők hívójelei, az indikátorok[1] és az almezőazonosítók.

A formátumok közötti híd[szerkesztés]

A CCF[2] és az SGML

A formátum két jellemzőjét úgy lehet összefoglalni, hogy

  • a formátum nem kötődik katalogizálási szabályokhoz
  • a CCF rekord struktúráját az ISO 2709:1983 szabvány legfrissebb kiadása határozza meg.

Nemzeti szabványok[szerkesztés]

HUNMARC[szerkesztés]

A HUNMARC bibliográfiai rekordok adatcsere-formátuma, magyar szabványalkalmazás, (OSZK 1994; ISBN 963 200 344 6). A nemzeti MARC formátumok rendszeréhez csatlakozva, az MSZ ISO 2709 Információ és dokumentáció Információs csereformátum című szabvány által megadott keretekben határozza meg a bibliográfiai adatok tartalmi jelölőit, és egyéb jellemzőit. Az adatcserében részt vevő adatok közlésmódjára a magyar könyvtári szabványok, valamint könyvtári és szakirodalmi tájékoztatási szabályzatok előírásai az irányadók.

A HUNMARC formátum kialakításakor figyelembe vették a Magyar Nemzeti Bibliográfiai Könyvek Adatbázisa számítógépes rendszerben alkalmazott MAMARC formátum sajátosságait, valamint a nemzetközi szolgáltatásokban elérhető UNIMARC vagy USMARC alapú nemzeti MARC formátumok gyakorlatát.

A HUNMARC formátum, ill. egyes elemei az adatcsere mellett a bibliográfiai adatok beviteli és a bibliográfiai tételek megjelenítési formátumaként is alkalmazható.

A HUNMARC formátum elemei[szerkesztés]

3 elemből áll: rekordszerkezet; tartalomjelölők, adattartalom.

  1. rekordszerkezet: a bibliográfiai rekord alkotó részeinek elrendezésére vonatkozó „MSZ ISO 2709 Információ és dokumentáció. Információs csereformátum” szabvány alkalmazása
  2. tartalomjelölők: meghatározza a HUNMARC bibliográfiai rekord adatelemeit azonosító hívójeleket, indikátorokat és almezőazonosítókat, illetve ezek értékeit, valamint a kódok értékét és jelentéstartalmát.
  3. az adattartalom három fő részből áll:
  • A rekordfej a HUNMARC rekord első mezője, a bibliográfiai rekordnak az elején található, állandó hosszúságú, 24 karakterpozícióból áll. A rekordnak a feldolgozására vonatkozó információkat tartalmazó része. Ezek az információk számok vagy kódértékek, melyeket relatív karakterpozíciójuk azonosít.
  • A mutató a rekord valamennyi adatmezőjének a hívójeléből, az adatmező hosszából és kezdőkarakterének pozíciójából álló tételek összessége. Minden egyes mutatótétel 12 karakter hosszúságú. A mutatótételek a hívójelek növekvő sorrendjében következnek. Azonos hívójelű ismétlődő mezők esetén a kezdőkarakter pozíciójának növekvő sorrendje szerint rendezettek. A mutató mezőhatárjel karakterrel (hex1E) végződik.
  • Adatmezők[3] a HUNMARC bibliográfiai rekordban a bibliográfiai adatokat tartalmazó mezők, melyek mindegyikét egy 3 számjegyből álló, a mutató tételében elhelyezkedő hívójel azonosít. Minden adatmező mezőhatárjel karakterrel végződik.

Az adatmező típusai[szerkesztés]

Tájékoztató adatmezők: a gépi adatfeldolgozáshoz szükséges adatokat tüntetik fel bennük. Nem tartalmaznak sem indikátort, sem almezőazonosítót. Állhatnak egyetlen elemből, vagy adatelemek sokaságából kódolt értékek formájában.

Bibliográfiai adatmezők: a mutatóban hívójelével azonosított minden bibliográfiai adatmező 2 indikátorpozíciót tartalmaz az adatmező elején, melyet közvetlenül követ egy 2 karakteres almezőazonosító. Az almezőazonosító első karaktere hex 1F, második karaktere a latin abc kis- vagy nagybetűje, vagy arab számjegy. A bibliográfiai adatmezők mindig tartalmaznak legalább egy – rendszerint $a – almezőt, de előfordul több, meghatározott azonosítójú, esetenként ismétlődő almező is egy bibliográfiai adatmezőn belül.

Kötelező mezők[szerkesztés]

Minden HUNMARC bibliográfiai rekordban szerepelnie kell a következő mezőknek:

  • 001 Rekordazonosító
  • 005 A rekorddal való utolsó művelet dátuma és ideje
  • 003 Meghatározott jellemzők és információs adatok
  • 040 A leírás forrása

Nemzetközi szabványok[szerkesztés]

UNIMARC[szerkesztés]

A nemzeti könyvtárak igazgatóinak konferenciája tervbe vette a Nemzetközi MARC Hálózat kialakítását, mert az eltérő nemzeti MARC formátumok gyakran inkompatibilisek voltak egymással. A munkák irányát meghatározó tervtanulmányokat Stephen Green (British Library) és R. M. Duchesne (Kanadai Nemzeti Könyvtár) dolgozta ki. R. M. Duchesne már 1971-ben felvetette egy valóban nemzetközi kommunikációs formátumnak a gondolatát, mely a nemzeti változatok szuper halmaza volt.

1977-ben a következő szabványosítási javaslatokat tették:

  • leíró adatok ISBD-alapú szabályozása,
  • tárgyköri adatok szabályozása,
  • a nemzeti központok közötti kommunikációs hálózat, a bibliográfiai adatcsere, a rekordtulajdonságok politikájának szabályozása
  • együttműködésben végzett tervezés és fejlesztés az egyes országokban létrehozott, regionális MARC hálózati csoportok, valamint az International MARC Network Tanácsadó Bizottsága, az IFLA-testületek, az ISO, az UNESCO, az ISDS Központ és minden más, a szabványosításban érintett intézmény részvételével.

A javaslatok egyik eredménye az IFLA International MARC Network Committee létrehozása volt, amely a fejlesztések nemzetközi koordinátoraként működik. 1977-ben jelent meg az UNIMARC első kiadása, második kiadása pedig 1980-ban. Az UNIMARC Handbookot 1983-ban adták ki. Az 1987-es átdolgozott kiadása – az UNIMARC Manual – tartalmazza az ISBD legújabb kiadásaiban található változásokat, így ez tekinthető az UNIMARC formátum harmadik kiadásának. A formátum elsődleges célja az volt, hogy megkönnyítse a nemzeti bibliográfiai központok között a géppel olvasható bibliográfiai adatok cseréjét.

A formátum főbb jellemzői[szerkesztés]

  • a formátum független a katalogizálási szabályzatoktól, az UNIMARC formátumcsalád az egyes nemzeti MARC formátumokhoz képest általánosabb szintű struktúrát határoz meg
  • nem ír elő, illetve nem feltételez különleges katalogizálási szabályokat
  • a szakterület nemzetközi szakérzői együttesen tervezték
  • IFLA-szabvány, ezért az IFLA által javasolt szabványokat és irányelveket alkalmazza
  • IFLA-formátum, ezért az IFLA biztosítja annak szakértői szintű fenntartását és továbbfejlesztését
  • integrált formátum, vagyis különböző könyvtári anyagok esetében használható
  • lehetőséget biztosít a nem latin írás és a többnyelvű rekordok kezelésére
  • biztosítja a rekordkapcsolás mechanizmusát
  • nemzetközi szintű csereformátum, így minden azt alkalmazó intézmény közvetlenül átveheti az adatokat más országok intézményeiből

UNIMARC/Authorities[szerkesztés]

1991-ben megjelent az UNIMARC/Authorities[4] (egységes besorolási adatok formátuma). Ez a formátum az IFLA Working Group on an International Authority System (Egységes Besorolási Adatok Nemzetközi Munkacsoportja) ajánlásait tartalmazó, 1984-ben kiadott Guidelines for Authority and Reference Entries alapjaira épül. Az UNIMARC/Authorities besorolási, utaló- és általános, magyarázatos utaló-tételek mezőinek hívójeleit határozza meg és kiegészíti az UNIMARC Manualban definiált, a bibliográfiai adatok közlésének szerkezetét, tartalmi azonosítóit, kódolási rendszerét és kapcsolási technikáját szabályozó formátumot. Az UNIMARC besorolási formátum alapja a tulajdonnév elemekkel foglalkozó Guidelines for Authority and Reference Entries (GARE, 1984; 2. kiad.: Guidelines for Authority Records and References, GARR, 2001), valamint a tartalomfeltárást célzó besorolási adatokat ismertető Guidelines for Subject Authority and Reference Entries (GSARE, 1993). A két útmutató meghatározza a besorolási rekordok (authority record) és az utalótételek (reference record) adatelemeit.

1990-es években az Európai Közösségben lévő könyvtárak projektjeik adatcseréjéhez már az UNIMARC-ot vették figyelembe szabványos csereformátumként. (Ilyen projekt volt pl.: az EROMM, European Register of Microform Masters; Consortium of European Research Libraries-nek a régi nyomtatványok számbavételére irányuló projektje).

Az authorities formátum alapjai[szerkesztés]

Kiterjed a rekordtípusokra és azok fizikai szerkezetére, az adatelemek kezeléséhez szükséges tartalomjelölőkre és a bibliográfiai feldolgozás szabványos adattartalmi elemeire.

Az authorities formátum felépítése[szerkesztés]

Az UNIMARC besorolási adatok formátuma a MARC formátumok rendszeréhez tartozik. Tartalmazza a szokásos összetevőket: rekordfejet, mutatót, adatmezőket, indikátorokat, almezőazonosítókat, adatelemeket. A formátum adatmezői funkcionális szempontból adatcsoportokat képeznek, amelyeket a kézikönyv külön listáz.

Jegyzetek[szerkesztés]

  1. Az indikátor valamely adatmezőhöz kapcsolódó első elem, mely információt hordoz a mező tartalmáról, ezen mező és a rekord egyéb mezői közötti kapcsolatról, vagy bizonyos adatfeldolgozási folyamatokban szükséges műveletekről
  2. CCF (Common Commonication Format): a formátum alapeszméje, hogy olyan csereformátum legyen, melyet hídként használhatnak a könyvtári közösség és a referáló és indexelő szolgáltatási környezet között. Jellemzői lehetővé teszik azonban, hogy a sok intézet saját belső formátumaként is felhasználja.
  3. Az adatmező a bibliográfiai rekord változó hosszúságú része, mely adott kategóriákhoz tartozó adatokat tartalmaz.
  4. Az authority data, azaz besorolási adatok azok a metaadatok, amelyek a tárolt rekordok kereshetőségéről gondoskodnak.

Források[szerkesztés]