Wikipédia:Jelölt lapváltozatok/Statisztikák

A Wikipédiából, a szabad enciklopédiából

Az oldal egy statisztikai elemzést tartalmaz a jelölt lapváltozat és annak beállításaival kapcsolatosan: milyen hatással járt annak bevezetése és módosítása a szerkesztők számára és aktivitására. (A statisztika nem tudja különválasztani a különböző hatásokat, így nem lehet kijelenteni, hogy a változások a jelölt lapváltozatok bevezetésének vagy módosításának következményei, de nagyon valószínű, hogy jelentős szerepet játszik, különösen az anonok próbálkozásainak számára és a kevés szerkesztéssel rendelkező szerkesztőkre, lásd alább.)

A grafikonok a Wikimédia Alapítvány által a magyar Wikipédiára vonatkozóan szolgáltatott havi statisztikai adatok és a JDemetra+ program 2.2.2 verziója segítségével készültek. (Ezt a programot a Belga Nemzeti Bank az Eurostat részére készítette az amerikai statisztikai hivatal által a szezonális és naptárhatások kiszűrésére alkalmazott X-13-ARIMA és a Spanyol Nemzeti Bank által kidolgozott TRAMO-SEATS algoritmusok kombinálásával.)

Az alábbi ábrákon a rózsaszín háttér a jelölt lapváltozatok azon (2008. november és 2018. március közötti) időszakát jelöli, amikor a változtatások csak az ellenőrzést követően jelentek meg a nem bejelentkezett felhasználók számára, míg a világoskék háttér azt az (2018. április és 2019. április közötti) időszakot jelöli, amikor a változtatások egyből (már az ellenőrzést megelőzően) megjelentek az olvasók és szerkesztők számára. A 2019. május és 2020. április közötti időszakra megjelölt értékek a jövőre vonatkozó statisztikai előrejelzés eredményei.

Az aktív regisztrált szerkesztők száma[szerkesztés]

A szerkesztők számának változása 2003. június és 2020. április között
A szerkesztők számának változása 2017. március és 2020. április között
A szerkesztők számának (szezonális hatástól megtisztított) változása 2004. január és 2019. április között


Az aktív regisztrált szerkesztők számának emelkedést követő stagnálása látszólag már valamivel a jelölt lapváltozatok 2009. júniusi bevezetését megelőzően megkezdődött, a határozott csökkenése pedig csak 2010 tavaszán kezdődött, így a szerkesztőszám alakulása alapján az összefüggés nem egyértelmű a csökkenés megindulását illetően, a beállítások 2018. áprilisi módosítása azonban teljesen egybeesik a korábban 1600–1650 szerkesztős tartományban stagnáló (2015 óta talán minimálisan emelkedő) grafikon 1700–1750 szerkesztőre való emelkedésével. Ez a kb. 100 szerkesztőnyi (6–7%-os) növekmény ezen grafikon alapján akár következhetne a korábban kezdődött pozitív folyamatok felgyorsulásából is, de későbbi grafikonok alapján valószínűsíthető, hogy legalább részben éppen a módosításnak köszönhető.

Az adott hónapban 1-4 szerkesztést végző szerkesztők száma[szerkesztés]

A havi 1-4 szerkesztést végző szerkesztők számának változása 2003. június és 2020. április között
A havi 1-4 szerkesztést végző szerkesztők számának változása 2017. március és 2020. április között
A havi 1-4 szerkesztést végző szerkesztők számának (szezonális hatástól megtisztított) változása 2004. január és 2019. április között


A grafikon szerint a 2008-ban megindult visszaesés 1-1,5 évvel korábban kezdődött, mint a jelölt lapváltozatok bevezetése. A folyamatosan csökkenő trend egészen 2015 tavaszáig tartott, amikor egy határozott irányváltással emelkedésbe váltott. Ez az növekedés 2016 végén hullámzó stagnálásba, majd a jelölt lapváltozatok beállításának módosításával teljesen egybeesve intenzív növekedésbe váltott át, ami a szoftvermódosítás óta eltelt egyéves időszak alatt közel 1000 plusz alkalmi közreműködőt jelentett.

Az adott hónapban 5-24 szerkesztést végző szerkesztők száma[szerkesztés]

A havi 5-24 szerkesztést végző szerkesztők számának változása 2003. június és 2020. április között
A havi 5-24 szerkesztést végző szerkesztők számának változása 2016. május és 2020. április között
A havi 5-24 szerkesztést végző szerkesztők számának (szezonális hatástól megtisztított) változása 2004. január és 2019. április között


A jelölt lapváltozatok bevezetése és beállításának módosítása és a szerkesztőszám közötti vélhető összefüggés leginkább a havi 5–24 szerkesztéssel rendelkező szerkesztői csoporton figyelhető meg. Ez logikusan következhet abból a hatásból, hogy az 1-4 szerkesztést végző csoport részben éppen azokból állt, akik korábban nem tértek vissza azt látva, hogy a módosításaik nem jelentek meg a cikkben, míg az 5–24 szerkesztéssel rendelkező csoportba azok az alkalmi szerkesztők tartoznak, akik a sikeres módosításon fellelkesülve még többször visszatértek és módosítgatták a kiválasztott cikket vagy cikkeket. A grafikonokat elemezve az látszik, hogy a 2008 elejéig tartó gyors emelkedő szakaszt egy 2009 első feléig tartó stagnáló időszak követte, majd a jelölt lapváltozatok bevezetésével nagyjából egybeeső időszaktól kezdve ez fokozatos csökkenésbe váltott 2014 második feléig, amikortól nagyjából stabilizálódott (minimálisan csökkenő trenddel), és ez váltott határozottan és élesen emelkedésbe a beállítások módosításával 2018 áprilisában, egy év alatt 200-250 közreműködővel növelve ezen szerkesztői csoport létszámát.

Az adott hónapban 25-99 szerkesztést végző szerkesztők száma[szerkesztés]

A havi 25-99 szerkesztést végző szerkesztők számának változása 2003. június és 2020. április között
A havi 25-99 szerkesztést végző szerkesztők számának változása 2016. május és 2020. április között
A havi 25-99 szerkesztést végző szerkesztők számának (szezonális hatástól megtisztított) változása 2004. január és 2019. április között


Ebben a szerkesztői csoportban a szerkesztőszám lendületes emelkedése már 2007 júliusában megtört, de a lendület még 2009 végéig, valamivel a jelölt lapváltozatok bevezetését követően kitartott. A csökkenés 2007 januárjában meglepő hirtelenséggel, egy kb. 50 szerkesztős (kb. 25%-os) eséssel kezdődött, ami kevésbé gyorsan, de egészen 2015 közepéig kitartott, amit egy mai napig tartó stagnáló, minimálisan emelkedő trend követett. Az elmúlt egy évben 5-10%-os növekedés figyelhető meg, amivel a grafikon a 120-145 közötti tartományból átment a 135-155 közötti tartományba.

Az adott hónapban legalább 100 szerkesztést végző szerkesztők száma[szerkesztés]

A havi legalább 100 szerkesztést végző szerkesztők számának változása 2003. június és 2020. április között
A havi legalább 100 szerkesztést végző szerkesztők számának változása 2016. május és 2020. április között
A havi legalább 100 szerkesztést végző szerkesztők számának (szezonális hatástól megtisztított) változása 2004. január és 2019. április között


A havi 100 szerkesztésnél többet végző (ún. törzsszerkesztők) számának gyors növekedése hirtelen, 2008 nyarán váltott át csökkenésbe. Ez a törés kb. 1 évvel a jelölt változatok bevezetését megelőzően volt, így legfeljebb a későbbi csökkenésre lehetett (valószínűleg indirekt) hatással. Érdekes módon ez a folyamatos csökkenés 2013 első felében hirtelen felgyorsult, majd egy évvel később stagnálásba váltott. Azóta kissé emelkedő, majd újabb csökkenő hullámok követik egymást, ahol az utóbbi egy évben újra a csökkenő trend erősödött fel (kb. 10 szerkesztővel, 6-7%-kal csökkent a szám ezalatt), azaz a törzsszerkesztők nem tudtak eddig profitálni az alkalmi szerkesztők számának növekedéséből.

A különböző aktivitási szintű szerkesztők számának összehasonlítása[szerkesztés]

Az alábbi adatsorok az összehasonlíthatóság érdekében azok maximális értékével normalizáltak, így a függőleges tengely a csúcsértékhez képest egy százalékos értéket mutat.

A különböző aktivitási szintű szerkesztők számának (szezonális hatástól megtisztított) relatív változása 2003. június és 2020. április között
A különböző aktivitási szintű szerkesztők számának (trendjeinek) relatív változása 2003. június és 2020. április között


A különböző szerkesztői csoportok grafikonjait együtt nézve megállapítható, hogy a 2005 elején felgyorsult szerkesztőszám-növekedés a különböző csoportokban kicsit eltérő időpontokban, de 2008 első fele és 2009 második fele között váltott át előbb stagnálásba, majd csökkenésbe. Ez 2014 közepe és 2015 közepe között érte el a mélypontját, ahonnan egy alapvetően stagnáló (a különböző csoportoknál enyhén emelkedő vagy enyhén csökkenő) jellegű volt 2018 elejéig. A szoftvermódosítás óta eltelt egy évben az alkalmi (1–4 és 5–24 szerkesztéssel rendelkező) szerkesztői csoportok tagjainak száma intenzíven (kb. 25%-kal, illetve 50%-kal) növekedett, míg a 25–99 szerkesztéssel rendelkező csoport tagjainak száma egészen minimálisan (talán 5 szerkesztővel) növekedett, míg a 100+-os szerkesztők száma minimálisan (kb. 10 szerkesztővel) csökkent. 2019 áprilisában az 1–4 szerkesztéses csoport nagyjából a korábbi csúcsértéke 80%-át, az 5–24 szerkesztéses csoport nagyjából a korábbi csúcsértéke 70%-át, a 25–99 szerkesztéses csoport a 60-65%-át, míg a 100+ szerkesztéses csoport kb. a 60%-át érte el.

A szerkesztők számának változásának szezonális és naptári komponense[szerkesztés]

Az alábbi adatsorok az összehasonlíthatóság érdekében azok maximális értékével normalizáltak, így a függőleges tengely a csúcsértékhez képest egy százalékos értéket mutat.

A szerkesztők számának változásának szezonális és naptári komponense 2003. július és 2020. április között


A fenti grafikon alapján a szerkesztők számában a június–szeptember időszakban van a mélypont (az utóbbi években ezen belül is kiugróan szeptemberben), míg a január–május időszakban van a pozitív eltérés (ezen belül is januári kiugró értékkel).

A havi 1-4 szerkesztést végző szerkesztők számának változásának szezonális és naptári komponense 2003. július és 2020. április között


Az alkalmi (döntően nem regisztrált) szerkesztők esetén az összes szerkesztőknél látotthoz hasonló következtetést lehet levonni, kisebb eltérésekkel: a szerkesztők számában a június–augusztus időszakban van a mélypont (ezen belül a csúcs július–augusztusban, a nyári tanítási szünet idején található), míg a január–május időszakban van a legnagyobb pozitív eltérés (ezen belül is januári kiugró értékkel).

A havi legalább 100 szerkesztést végző szerkesztők számának változásának szezonális és naptári komponense 2003. július és 2020. április között


A nagyon aktív (törzs-) szerkesztők esetén nem ennyire egyértelmű és jellegzetes a szezonális hatás. Két mélypont figyelhető meg az ilyen szerkesztők számában, egy az április-június időszakban, és egy az október–november időszakban. A lokális maximumok többsége az alkalmi szerkesztőkhöz hasonlóan januárra (alkalmanként márciusra vagy márciusra is) esik, és megfigyelhető egy nyárközepi, augusztusi csúcs is.

A havi 1-4 és a havi legalább 100 szerkesztést végző szerkesztők számának változásának szezonális és naptári komponense 2003. július és 2020. április között


A két grafikont egymásra illetve megfigyelhetőek az alkalmi és a törzsszerkesztők számának szezonális ingadozásainak hasonlóságai és különbségei is: a jellemzően egybeeső januári csúcsok és az érdekes módon ellentétes csúcsokat mutató nyári (augusztusi) időszakok.

A havi regisztrációk száma[szerkesztés]

Megjegyzés: 2006. tavaszig nem mértük a regisztrációkat.

A havi regisztrációk számának változása 2003. június és 2020. április között
A havi regisztrációk számának változása 2016. május és 2020. április között
A havi regisztrációk számának (szezonális hatástól megtisztított) változása 2004. január és 2019. április között


A havi új regisztrációs száma 2007-ben ugrásszerűen növekedett egészen a havi több mint 4000 új regisztrációig, majd 2008 elejétől 2011 végéig fokozatosan csökkent. Ezután 1000–1200-as értékre állt be, ami nagyjából megfelel a 2006 végi értékeknek, és azóta jelentős változás nem tapasztalható. Kivétel ez alól a 2014 második fele és 2015 első fele közötti időszak, ahol lokálisan megugrottak a regisztrációk – érdemes lenne utánanézni, mi történt ekkor. Némi képzelőerővel azonban 2011 második fele és a 2018 áprilisa közötti időszakot egy lassan csökkenő trend jellemezte (az évek alatt az 1200–1250-es sávból lassan a 950–1000-es sávba csúsztak vissza az értékek), míg az elmúlt évben a havi új regisztrációk száma visszatért az 1000–1100 közötti tartományba, tehát lehet némi pozitív hatása a jelölt lapváltozatok beállításának módosításának (és ezzel a nem regisztrált szerkesztők és szerkesztéseik számának megugrásának) a regisztrációk és így az új szerkesztők számára.

A nem regiszrált (anon) szerkesztők szerkesztései[szerkesztés]

A nem regisztrált szerkesztők szerkesztéseinek változása 2003. június és 2020. április között
A nem regisztrált szerkesztők szerkesztéseinek változása 2016. május és 2020. április között
A nem regisztrált szerkesztők szerkesztéseinek (szezonális hatástól megtisztított) változása 2004. január és 2019. április között


A nem regisztrált szerkesztők szerkesztéseinek száma 2008 elején érte el a csúcsát, majd 2010 közepéig kb. felére visszaesett. Ezután a csökkenés lassabban, de továbbra is folytatódott, egészen 2017 második feléig. Azóta határozottan, lendületes nő az anonszerkesztések száma. A csúcsérték, és a csökkenő trend kezdete több mint egy évvel a jelölt lapváltozatok bevezetését megelőzően volt, a trendforduló, az újabb emelkedő periódus pedig kb. fél évvel volt a szoftvermódosítás előtt, így ezekkel való összefüggése kérdéses.

A regisztrált szerkesztők szerkesztései[szerkesztés]

A regisztrált szerkesztők nem tartalmazzák a botjoggal rendelkező szerkesztőket, és azokat a szerkesztőket, akiknek szerepel a nevében a bot szó.

A regisztrált szerkesztők szerkesztéseinek változása 2003. június és 2020. április között
A regisztrált szerkesztők szerkesztéseinek változása 2017. március és 2020. április között
A regisztrált szerkesztők szerkesztéseinek (szezonális hatástól megtisztított) változása 2004. január és 2019. április között


A regisztrált szerkesztők szerkesztéseinek száma a jelölt lapváltozatok bevezetésével nagyjából egyidőben, 2009 júniusa és augusztusa között érte el a maximumát, majd 2014 tavaszáig kb. 40%-kal csökkent. Ennek lehet oka a jelölt lapváltozatokkal járó járőri feladatokkal való leterheltség, különösen a bevezetést követő időszakban. 2014 második fele óta egy alapvetően stagnáló, talán minimálisan emelkedő trend látható. A jelölt lapváltozatok beállításainak hatása nem egyértelmű, bár az pozitív, hogy a korábban 60 és 80 ezer közötti tartomány a 70 és 80 ezer szerkesztés közötti tartományban stabilizálódott az elmúlt évben.

A nem regisztrált és a regisztrált szerkesztők és szerkesztéseik száma[szerkesztés]

A regisztrált szerkesztők nem tartalmazzák a botjoggal rendelkező szerkesztőket, és azokat a szerkesztőket, akiknek szerepel a nevében a bot szó.

A nem regisztrált és a regisztrált szerkesztők számának aránya 2003. június és 2019. április között


A jelölt lapváltozatok beállítása kapcsán fontos vizsgálni a nem regisztrált (anonim) és az adott hónapban aktív regisztrált szerkesztők és szerkesztéseik arányát. A szerkesztőszámok aránya alapján a kezdeti (2003-as) 1,0-1,5 körüli arány 2005-re 4 köré növekedett (négyszer annyi nem regisztrált szerkesztő szerkesztett, mint regisztrált), majd 2009 második felére 1,3-1,4-es értékre csökkent. Az arány ezután 2014 végéig stagnált, majd 2015-től lassan emelkedni kezdett. Ez az emelkedő trend kb. a szoftvermódosítás idején felgyorsult, és 2019. áprilisra 2,2 körüli értékre emelkedett (2,2-szer annyi anonim szerkesztő szerkeszti a magyar Wikipédiát, mint ahány bejelentkezett).

A nem regisztrált és a regisztrált szerkesztők szerkesztéseinek aránya 2003. július és 2019. április között
A regisztrált és a nem regisztrált szerkesztők szerkesztéseinek aránya 2003. július és 2019. április között


A szerkesztések számát tekintve a kezdeti bizonytalan értékeket követően a 2005-től 2007 közepéig a 0,11 körüli érték volt jellemző (a regisztrált szerkesztők 9-szer annyi szerkesztést végeztek az adott hónapban, mint az anonok). Ekkortól 2010 végéig csökkenő trend jellemezte a szerkesztések arányának alakulását, majd 2018 közepéig az arány trendje a 0,07-0,08, maga az arány pedig a 0,06-0,1 tartományban tartózkodott (hullámozva stagnált). Ekkor átlagosan kb. 13-szor annyi szerkesztés kapcsolódott regisztrált szerkesztőkhöz, mint anonokhoz. Az arány a 2018. áprilisi szoftvermódosítást követően határozottan növekedni kezdett, és 2019. áprilisra elérte a 0,12-es értéket (kb. nyolcszor annyi szerkesztést végeznek a bejelentkezett szerkesztők, mint az anonok).

Elemzés az ORES modellje alapján[szerkesztés]

Az ORES egy osztályozó algoritmus, amit a magyar Wikipédia szerkesztői betanítottak a problémás és/vagy rosszindulatú szerkesztések felismerésére; a friss változtatások modern felületén a "Szinte biztosan jó" / "Problémák lehetnek" / "Valószínűleg problémák vannak" / "Szinte biztosan problémák vannak" illetve a "Szinte biztosan jóhiszemű" / "Rosszhiszemű lehet" / "Valószínűleg rosszhiszemű" / "Szinte biztosan rosszhiszemű" szűrők tartoznak hozzá. Az ezen szűrők által a jelölt változtatások működésének átállítása előtti és utáni egy-egy évben felcímkézett szerkesztések gyakorisága azt mutatja, hogy a vandalizmusok és jószándékú, de nem hasznos szerkesztések száma nőtt, de csak viszonylag elhanyagolható mértékben (2-3%-ot):

A "Valószínűleg problémák vannak" (kék) és "Szinte biztosan problémák vannak" (piros) szűrők által megjelölt szerkesztések aránya az összes anonim szerkesztés között. (Pontozottan az egy évvel korábbi számok.)
A "Valószínűleg problémák vannak" (kék) és "Szinte biztosan problémák vannak" (piros) szűrők által megjelölt szerkesztések aránya az összes anonim szerkesztés között. (Pontozottan az egy évvel korábbi számok.)
A "Szinte biztosan jóhiszemű" (zöld) / "Rosszhiszemű lehet" (kék) / "Valószínűleg rosszhiszemű" (piros) / "Szinte biztosan rosszhiszemű" (sárga) szűrők által megjelölt szerkesztések aránya az összes anonim szerkesztés között. (Pontozottan az egy évvel korábbi számok.)
A "Szinte biztosan jóhiszemű" (zöld) / "Rosszhiszemű lehet" (kék) / "Valószínűleg rosszhiszemű" (piros) / "Szinte biztosan rosszhiszemű" (sárga) szűrők által megjelölt szerkesztések aránya az összes anonim szerkesztés között. (Pontozottan az egy évvel korábbi számok.)
A "Problémák lehetnek" szűrő által megjelölt szerkesztések aránya az összes bejelentkezett szerkesztés között.
A "Problémák lehetnek" szűrő által megjelölt szerkesztések aránya az összes bejelentkezett szerkesztés között.
nyers adatok; részletek: T209224

Az ORES "Valószínűleg rosszhiszemű" és "Valószínűleg problémák vannak" szűrői a megjelölt szerkesztések mennyiségét nézve nagyjából jól illenek a kézi vizsgálattal beazonosított vandalizmushoz ill. (nem feltétlenül rosszindulatú, de) problémás szerkesztéshez. Ez alapján, és azt is figyelembe véve, hogy az anonim szerkesztések száma mintegy haramadával nőtt a váltás után, azt mondhatjuk, hogy a jelölt változatok átállításának hatására a vandalizmusok száma havonta körülbelül 500-zal, a jószándékú, de problémás szerkesztések száma 800-zal nőtt; a hasznos szerkesztések száma mintegy 2000-rel.

(A bejelentkezett szerkesztések között valamivel nagyobb arányban nőttek a valószínűleg rosszhiszemű vagy problémás szerkesztések, de még így is olyan kevés van belőlük - havi 20-30 helyett havi 30-40, - hogy a járőrök terhelésére csak elhanyagolható hatással vannak.)

Összefoglalás[szerkesztés]

A jelölt lapváltozatok bevezetésének hatása egyértelműen nem kimutatható ezekből a grafikonokból. Az intenzív növekedés már kb. egy évvel korábban megtört (más, külső és belső hatások együttesének eredményeként), a csökkenés is valamivel korábban kezdődött, bár valószínűleg volt negatív hatása a csökkenés felgyorsulására. Ezzel szemben a 2018. tavaszi szoftvermódosítás egyértelmű növekedést eredményezett a nem regisztrált és alkalmi szerkesztők esetén (a havi 1–4 szerkesztéssel rendelkező szerkesztők száma 50%-kal, a havi 5–24 szerkesztéssel rendelkező szerkesztők száma 25%-kal növekedett egy év alatt). Ugyanezen időszakban a regisztrációk és az aktívabb szerkesztők száma nagyjából stagnált, a legaktívabb törzsszerkesztők száma pedig kismértékben csökkent is. Ebből az látszik, hogy a magyar Wikipédia-közösség nem tudja elérni, bekapcsolni, bevonni, és hasznos, tartósan aktív közreműködővé tenni az alkalmi szerkesztőket, így ezen a ponton szükséges javítani a növekedés érdekében.