Korpusz

A Wikipédiából, a szabad enciklopédiából

A korpusz nyelvészeti szakkifejezés, jelentése egy adott nyelv adott időpontban használt változatára vonatkozó szövegek összessége.

A szó a latin corpus (test) szóból ered, és a "nyelvi test", nyelvi összesség értelemben használt.

A nyelvi korpusz felhasználásaira lehet példa szótárak létrehozása, nyelv jellegzetességeinek elemzése.

Létrehozásakor fontos szempont, hogy lehetőség szerint ne keveredjen benne az adott nyelv eltérő időszakokban használt (új, és régies) formája.

Az informatika terjedésével egyre könnyebb igen nagy mennyiségű, természetes szöveget tartalmazó korpuszok létrehozása, ilyen célra használhatóak például a digitalizált lexikonok, a Wikipédia, de például az internetes weblapok egy adott köre is (pl. sajtó).

Lásd még a Wikipédiában[szerkesztés | forrásszöveg szerkesztése]

Felhasznált források[szerkesztés | forrásszöveg szerkesztése]

Kiegészítő irodalom[szerkesztés | forrásszöveg szerkesztése]

  • Mit nevezünk korpusznak?, Magyar Nemzeti Szövegtár. Magyar Tudományos Akadémia Nyelvtudományi Intézet (2006. december 18.). Hozzáférés ideje: 2010. május 2. 

További kiegészítések[szerkesztés | forrásszöveg szerkesztése]