Adatbázis

A Wikipédiából, a szabad enciklopédiából

Az adatbázis azonos minőségű (jellemzőjű), többnyire strukturált adatok összessége, amelyet egy tárolására, lekérdezésére és szerkesztésére alkalmas szoftvereszköz kezel.

Az adatbázis fogalma nem keverendő össze az adatbázis-kezelővel, amely az adatbázis működtetésére, rendszerszintű és felhasználói folyamatainak szervezésére szolgál. Sok esetben azonban mégis egymás szinonimájaként használjuk (például bár a valóságban adatbázis-kezelőket vásárolunk és telepítünk, mégis sokszor mondjuk, hogy „vettem/telepítettem egy adatbázist”), ha ez félreértésre nem ad okot.

Az adatbázisok célja adatok megbízható, hosszú távon tartós (idegen szóval: perzisztens) tárolása, és viszonylag gyors visszakereshetőségének biztosítása.

Osztályozásuk[szerkesztés | forrásszöveg szerkesztése]

Az adatbázisok két fajtáját szokás megkülönböztetni, a logikai és a fizikai adatbázist. Előbbi lényegében a „mit tárolunk” (mit és hogyan akarunk látni az adatokból), míg utóbbi a „hogyan tároljuk” (mit és hogyan érünk el a fizikai háttértáron) kérdésre keresi a leghatékonyabb választ. A két adatbázistípus szétválasztása azért bír nagy jelentőséggel, mert a fizikai háttértáron való állományszervezésnek és az adatok hozzáférésének, lekérdezésének szempontjai, sajátosságai jelentősen eltérnek egymástól; érdemes külön-külön optimalizálni a két feladatot.

A logikai adatbázisokat szerkezetük, felépítési és működési sajátosságai alapján szokás megkülönböztetni. A szerkezeti és működési leírásnak a legáltalánosabb alakját szokás adatmodellnek nevezni. Az adatmodellek eltérései alapján beszélhetünk relációs, objektumorientált, hálós, deduktív, illetve objektumrelációs, deduktív relációs, deduktív objektumorientált stb. adatbázisokról. A korszerű adatbázisokban gyakran előfordul, hogy ugyanazt a fizikai adatbázist több, különböző logikai adatbázison keresztül elérhetjük, így ugyanazt az adatot például relációs és objektumorientált technológiával is kezelhetjük.

Más szempontok alapján az adatbázisokat osztályozhatjuk strukturáltságuk szerint is. E szerint megkülönböztetjük az azonos és a változó attribútumszámú adatbázisokat. A változó attribútumszámú adatbázisok létjogosultságát az adja, hogy bizonyos információk jóval tömörebben és egyszerűbben fejezhetők ki, mint rögzített attribútumszám esetén. Példának okáért, ha valaki azt szeretné tárolni, hogy Gipsz Jakab telefonszámai +361234567 és +362345678, akkor a rögzített és a változó attribútumszámú adatbázisok az alábbi módon tárolnák az információt:

  • Rögzített esetben: (Gipsz Jakab | +361234567), (Gipsz Jakab | +362345678), ahol '|' az attribútumhatároló karakter jelen esetben.
  • Váltózó esetben: (Gipsz Jakab | +36123467 | +362345678)

Míg rögzített esetben minden azonos névhez tartozó telefonszámhoz új rekordot vennénk fel, addig a változó esetben mindig egyetlen rekordot bővítünk egy plusz elemmel.

Az adatbázis logikai szerkezetének kialakítása nem triviális feladat – még ha annak is tűnik. Sok szempontot kell figyelembe venni a tervezéskor, például pontosan azonosítani kell, hogy milyen adatok tárolását kívánjuk megvalósítani, azok összetettségéről, felbonthatóságáról, más adatokhoz fűződő viszonyairól kell határoznunk, de figyelni kell arra is, hogy az adatbázis hosszú távú használatából származó működési rendellenségeket már szerkezeti szinten is elkerüljük, illetve arra is, hogy minél kevesebb tárhelyet kelljen foglalni az adattároláshoz. Az adatbázisok kialakításának kérdéseivel adatbázis-tervezés foglalkozik.

Fenntartási költségek[szerkesztés | forrásszöveg szerkesztése]

Ma az adatbázisok üzemeltetése nagy összegekbe kerül. Az IDC piackutató cég adatai szerint csak az Egyesült Államokban lévő 6500 nagy számítóközpont energiaigénye megegyezik Utah államéval. Ehhez 30 nagy erőművet kell üzemben tartani, s az elfogyasztott energia több, mint az USA-ban működtetett több mint 300 millió tévékészüléké.[1]

A világ legnagyobb adatbázisai[szerkesztés | forrásszöveg szerkesztése]

Az alábbi 2007-es lista egy becslésen alapul, és nem csupán a tárolt rekordok, fájlok számát vagy összméretét veszi figyelembe, hanem az információk hasznosságát. Például a Wikipédia elsősorban szöveges információkat tárol, ezért mérete sokkal kisebb, mint a videofájlokat tartalmazó YouTube-é.

A listára nem került föl Japán, Oroszország és Kína, valószínűleg ezekben az országokban is vannak hasonló nagyságrendű adatbázisok.[2]

Sorszám Név Ország Felhasználási cél
1. Klímaadatok Világközpontja (WDCC) – a Max Planck Intézet tartja fenn Németország Tudományos kutatás
2. Az USA Nemzeti Energiakutató Tudományos Számítóközpontja (NERSC) USA Tudományos kutatás
3. AT&T USA Távközlési szolgáltató
4. Google USA Internetes kereső
5. Sprint USA Távközlési szolgáltató
6 ChoicePoint USA Kormányzati, közösségi és üzleti jellegű információk megosztása
7. YouTube USA Videomegosztás
8. Amazon USA Kiskereskedelem
9. CIA – az USA központi hírszerző ügynöksége USA Titkosszolgálat
10. USA Kongresszusi Könyvtár USA Nemzeti Könyvtár

Kapcsolódó oldalak[szerkesztés | forrásszöveg szerkesztése]

Jegyzetek[szerkesztés | forrásszöveg szerkesztése]

  1. Forrás: A világ tíz legnagyobb adatbázisa – HVG Online-cikk
  2. Forrás: A világ tíz legnagyobb adatbázisa – HVG Online-cikk.