Ugrás a tartalomhoz

Korpusz

A Wikipédiából, a szabad enciklopédiából
A lap aktuális változatát látod, az utolsó szerkesztést FoBeBot (vitalap | szerkesztései) végezte 2020. június 30., 21:36-kor. Ezen a webcímen mindig ezt a változatot fogod látni. (Bot: Felhasznált irodalom és Felhasznált források szakaszcímek cseréje erre: Források (WP:BÜ#Források))
(eltér) ← Régebbi változat | Aktuális változat (eltér) | Újabb változat→ (eltér)

A korpusz nyelvészeti szakkifejezés, jelentése egy adott nyelv adott időpontban használt változatára vonatkozó szövegek összessége.

A szó a latin corpus (test) szóból ered, és a "nyelvi test", nyelvi összesség értelemben használt.

A nyelvi korpusz felhasználásaira lehet példa szótárak létrehozása, nyelv jellegzetességeinek elemzése.

Létrehozásakor fontos szempont, hogy lehetőség szerint ne keveredjen benne az adott nyelv eltérő időszakokban használt (új, és régies) formája.

Az informatika terjedésével egyre könnyebb igen nagy mennyiségű, természetes szöveget tartalmazó korpuszok létrehozása, ilyen célra használhatóak például a digitalizált lexikonok, a Wikipédia, de például az internetes weblapok egy adott köre is (pl. sajtó).

Lásd még a Wikipédiában

[szerkesztés]

Források

[szerkesztés]

Kiegészítő irodalom

[szerkesztés]

További kiegészítések

[szerkesztés]