Szerkesztő:Pallor/Segédletek/Statisztikák a Wikidatából

A Wikipédiából, a szabad enciklopédiából
Tudnivalók

A Wikidatában tárolt adatokból különféle statisztikákat lehet készíteni. Pontosan számszerűsíthetünk addig csak elnagyoltan emlegetett adatokat, vagy a legkülönbözőbb szempontok szerint szelektálhatjuk, sorbarendezhetjük azokat. Lentebb néhány engem érdeklő összesítés található. A lekérdezések egyszeriek, nem, vagy csak alkalmomszerűen frissülnek, de közzéteszem azokat a lekérdezéseket, amikkel készültek, így bármikor csinálhatsz friss statisztikát, vagy a lekérdezés paramétereinek a módosításával akár más összetételű adathalmazt is vizsgálhatsz.

Fontos szem előtt tartani, hogy a közismert statisztikáktól eltérően a Wikidatában a történelmi Magyarország, sőt, a világ írott történetének kezdete óta ismert (és a Wikidatába felvitt) adataiból készülnek a statisztikák. Tehát pl. míg azt arra a kérdésre, hogy hány magyar állampolgár van, általában a kérdés feltételének időpillanatában élő személyek adatait szokás vizsgálni, a Wikidatában a magyar államiság kezdetétől magyarként számontartott személyekről beszélünk, így például a magyar történészek, görög csillagászok, arab matematikusok stb. szűréséhez további finomítások szükségesek (pl. születési-halálozási paraméterek megadása). Ebből adódóan előfordul, hogy a statisztika nem szolgáltat érdemi adatot semmiféle hipotézishez, csupán azt tükrözi, hogy az adatfelvitel egyenetlenségei milyen torzuláshoz vezetnek a Wikidatán.

Hány magyar van a Wikidatában?[szerkesztés]

Magyarokról többféle vonatkozásban beszélhetünk:

  • magyar nemzetiségűek - erről nem lehet információkat nyerni, mert a Wikidata nem tárol adatot a nemzetiségről
  • magyar állampolgárságúak - erről találsz információt a lenti táblázatban (magyar állampolgárság = az állampolgárság (P27) tulajdonságnál az alábbi három entitás valamelyike szerepel: Magyarország (Q28), Erdélyi Fejedelemség (Q655621), Magyar Királyság (Q171150)
  • magyar anyanyelvűek - ezt az adatot lehetőség lenne felvinni, de nagyon ritkán élünk vele, ezért igen csalóka számok mutatkoznak

2021. január 21-én

állampolgárság szerint
országok 2021 január
Magyarország (Q28) 37 136
Oroszország (Q159) 67 995
Amerikai Egyesült Államok (Q30) 430 787
Finnország (Q33) 46 295
Holland Királyság (Q29999) 70 837
Románia (Q218) 24 482
Kína (Q148) 35 284
anyanyelv szerint
nyelvek 2021 január
magyar (Q9067) 670
orosz (Q7737) 11583
angol (Q1860) 4730
finn (Q1412) 215
holland (Q7411) 2464
román (Q7913) 95
sztenderd mandarin (Q727694) (kínai (Q7850)) 25 (224)
Érdemes megfigyelni az anyanyelv szerinti adatok torz voltát. Nyilvánvalóan nem két és félszer annyian beszélnek a Földön oroszul, mint angolul, egyszerűen csak arról van szó, hogy az orosz Wikidata-szerkesztők következetesebben viszik fel az anyanyelvre vonatkozó adatokat, mint más nemzetiségű társaik.


Akinek magyar az anyanyelve, milyen nyelvet beszél még?[szerkesztés]

nyelv beszélők száma
magyar (Q9067) 585
angol (Q1860) 241
német (Q188) 194
francia (Q150) 107
orosz (Q7737) 71
latin (Q397) 55
román (Q7913) 51
eszperantó (Q143) 45
olasz (Q652) 38
spanyol (Q1321) 24
szlovák (Q9058) 23
héber (Q9288) 21
török (Q256) 13
lengyel (Q809) 11
cseh (Q9056) 10
szerb (Q9299) 9
finn (Q1412) 9
ógörög (Q35497) 9
holland (Q7411) 8
horvát (Q6654) 8
görög (Q9129) 7
bolgár (Q7918) 7
svéd (Q9027) 7
japán (Q5287) 7
kínai (Q7850) 6
ukrán (Q8798) 5
portugál (Q5146) 4
oszmán-török (Q36730) 4
arab (Q13955) 4
perzsa (Q9168) 3
dán (Q9035) 3
norvég (Q9043) 3
volapük (Q36986) 3
jiddis (Q8641) 3
szerbhorvát (Q9301) 3
örmény (Q8785) 3
szlovén (Q9063) 2
ruszin (Q26245) 2
arámi (Q28602) 2
koreai (Q9176) 2
katalán (Q7026) 2
albán (Q8748) 2
bosnyák (Q9303) 1
középfelnémet (Q837985) 1
mordvin (Q627313) 1
csagatáj (Q36831) 1
lett (Q9078) 1
sumer (Q36790) 1
akkád (Q35518) 1
brazíliai portugál (Q750553) 1
thai (Q9217) 1
szuahéli (Q7838) 1
kazak (Q9252) 1
baszk (Q8752) 1
szogd (Q205979) 1
középperzsa (Q32063) 1
kanadai francia (Q1450506) 1
tibeti (Q34271) 1
montenegrói (Q8821) 1
ír (Q9142) 1
prákrit nyelvek (Q192170) 1
óperzsa (Q35225) 1
avesztai (Q29572) 1
szanszkrit (Q11059) 1
számi nyelvek (Q56463) 1
észt (Q9072) 1
bunyevác nyelvjárás (Q33185) 1
besenyő (Q877881) 1
grúz (Q8108) 1
asszír újarámi (Q29440) 1
óegyházi szláv (Q35499) 1
dalmát (Q35527) 1
cigány nyelv (Q13201) 1
vend (Q129431) 1
szír (Q33538) 1
kongói szuahéli (Q10961696) 1
svájci irodalmi német (Q1366643) 1
osztrák német (Q306626) 1
komi (Q36126) 1
manysi (Q33759) 1
hanti (Q33563) 1
indonéz (Q9240) 1

Látható, hogy annyira kevés az elemszám, hogy érdemi statisztika nem készíthető. Egyes esetekben ha csak két újabb valamilyen nyelven beszélő kerül a Wikidatába, már megváltozik a sorrend, holott ennél sokkal nagyobb számú idegen nyelven beszélő személyről van adatunk. Látszik egy adatfelviteli hiba is: a640 magyar anyanyelvű személyből csak 585-en beszélnek ténylegesen magyarul - a Wikidata adatai szerint. Nyilvánvaló, hogy az adatfelvitelnél kell jobban odafigyelni. Érdemes átgondolni, hogy hány diplomatánk, műfordítónk, valamilyen idegen nyelv és kultúra művelője az, akiknek van szócikkük, de a Wikidatába a beszélt nyelveik nem kerülnek be adatként.€

Eszperantóul beszélők anyanyelve[szerkesztés]

Fordítsuk meg a fenti lekérdezést, és nézzük meg, hogy akiknél a beszélt nyelvek egyike az eszperantó (Q143), annak mi az anyanyelve?

nyelv beszélők száma
magyar (Q9067) 62
cseh (Q9056) 56
francia (Q150) 52
eszperantó (Q143) 49
német (Q188) 42
angol (Q1860) 33
holland (Q7411) 30
orosz (Q7737) 23
lengyel (Q809) 17
svéd (Q9027) 12
spanyol (Q1321) 12
japán (Q5287) 10
szlovák (Q9058) 9
olasz (Q652) 8
portugál (Q5146) 7
bolgár (Q7918) 4
brazíliai portugál (Q750553) 3
dán (Q9035) 3
finn (Q1412) 3
norvég (Q9043) 3
koreai (Q9176) 3
szlovén (Q9063) 3
vietnámi (Q9199) 2
észt (Q9072) 2
görög (Q9129) 2
katalán (Q7026) 2
horvát (Q6654) 2
jiddis (Q8641) 2
udmurt (Q13238) 1
román (Q7913) 1
német jelnyelv (Q33282) 1
gilaki (Q33657) 1
galiciai (Q9307) 1
litván (Q9083) 1
albán (Q8748) 1
sztenderd mandarin (Q727694) 1
ukrán (Q8798) 1
héber (Q9288) 1
török (Q256) 1
kínai (Q7850) 1
izlandi (Q294) 1
bangla (Q9610) 1
brit angol (Q7979) 1
grúz (Q8108) 1

Itt még inkább a kevés elemszám okozta torzulás figyelhető meg: tudható, hogy nem a magyarok közül beszélik a világon a legtöbben az eszperantót, hanem a kínai anyanyelvűek. Ez a lista nem tükröz mást, minthogy a magyaroknál alaposabban jelölve vannak az anyanyelv és beszélt nyelvek tulajdonságok.