Wikipédia:Osztályozás/Mi ez?

A Wikipédiából, a szabad enciklopédiából

Wikipédia:Osztályozás      Főoldal Mi ez? Kampányok Dokumentáció Résztvevők Járőrözés Hibák

Labels logo
Labels logo

Az osztályozás (az angol wikin wiki labels) célja szócikk-szerkesztések egy osztályozott gyűjteményének előállítása.

Az osztályozott szerkesztés egy olyan szerkesztés, amihez valaki kézzel hozzárendelt különféle jellemzőket (például: „vandalizmus”, „hasznos szerkesztés”, „helyesírási javítás”). Ha kellő számú ilyen szerkesztést gyűjtünk össze, az számos különböző célra nagyon hasznos lehet:

  • a Wikipédiát vizsgáló kutatók számára, akik azt keresik, hogy milyen statisztikai jellemzők alapján lehet például megkülönböztetni a jó szerkesztéseket a rossztól, vagy felismerni a másolmányokat (például a Rise and Decline,[1] az egyik legtöbbet hivatkozott Wikipédia-kutatás, ami először vizsgálta a szerkesztői közösség csökkenésének okait, egy ilyen szerkesztésgyűjteményből dolgozott)
  • automata eszközök betanítására, amik képesek felismerni a rossz szerkesztéseket (például User:ClueBot NG és WP:STiki) vagy a szerkesztő habitusának megfelelő feladatokat ajánlani
  • elemzések, vizualizációk készítésére (például a szerkesztők egymással való kapcsolatáról[2])

Az ilyen tevékenységekhez szükséges osztályozott szerkesztésgyűjtemények összeállítása (a hand-coding, ahogy a társadalomtudományokban hívják) sok időt és energiát igénylő feladat, ami sok potenciális kutatót vagy programozót visszatart attól, hogy a Wikipédiával kapcsolatos projektbe kezdjen. Ezt a problémát oldja meg a Wikipédia:Osztályozás rendszere, ami lehetővé teszi, hogy a feladatot számos önkéntes bevonásával, kis adagokban végezzük el, ezzel megkönnyítve a kutatók és fejlesztők munkáját, és végső soron a hasznos segédeszközök és elemzések születését. Ha szeretnél segíteni, feliratkozhatsz a résztvevők listájára. Ha valamilyen még nem létező adathalmazra lenne szükséged, vedd fel a kapcsolatot a fejlesztőkkel az angol vitalapon. A meglévő (vagy osztályozásra váró) adathalmazokat a kampányok listájában találod.

Hogyan segíthetek?[szerkesztés]

Ha szeretnél segíteni, az alábbi feladatokból választhatsz:

Osztályozás
A célunk a Wikipédia-szerkesztések automatikus osztályozása, ehhez szükség van egy nagyméretű, kézzel osztályozott referencia-adathalmazra, amit gépi tanulásra lehet használni. Ezt a munkát próbáljuk elosztani sok résztvevő között. Ha szeretnél bekapcsolódni, iratkozz fel a résztvevők közé!
Fejlesztés
Hibák javítása, új funkciók fejlesztése és a rendszer teljesítményének javítása. Pull requesteket köszönettel veszünk! A forráskódot itt találod.

Kapcsolódó projektek[szerkesztés]

Lapváltozatok pontozása (ORES)[szerkesztés]

Lapváltozatok pontozása logó
Lapváltozatok pontozása logó

Néhány kiemelkedően hasznos, a Wikipédia-szerkesztők által használt segédeszköz a szerkesztések minőségének gépi osztályozásán alapul. A lapváltozat-pontozó projekt célja egy nyilvános API működtetése, amin át lekérdezhetőek az egyes szerkesztések automatikusan generált osztályozásai. Úgy gondoljuk, hogy egy ilyen szolgáltatás nagyban megkönnyíteni a hasznos és sokat tudó wiki-segédeszközök fejlesztését, és a meglévő eszközök új wikikre való kiterjesztését. Ahhoz, hogy jól működő automata osztályozórendszereket fejlesszünk, szükségünk van egy jó minőségű kézzel osztályozott szerkesztésgyűjteményre, amin az automata betanítható. Itt jön a képbe a Wikipédia:Osztályozás.

ORES logó
ORES logó

Az ORES (Objective revision evaluation service – objektív lapváltozat-kiértékelő szolgáltatás) egy REST-alapú webszolgáltatás, amin keresztül az egyes lapváltozatok pontszámai lekérdezhetőek. Ez az osztályozási projekt elsődleges hozzáférési pontja a wikieszköz-fejlesztők számára. A pontszámok tipikusan az egyes osztályozásoknak az ORES által tippelt valószínűségei. Például a http://ores.wmflabs.org/scores/enwiki?revids=34854258&models=reverted azt mondja meg, milyen valószínűnek tartja az ORES, hogy az angol Wikipédia #34854258 számú szerkesztése a „reverted” osztályban van (vagyis egy adott időn belül vissza lesz állítva).

Hivatkozások[szerkesztés]

  1. Halfaker, A., Geiger, R. S., Morgan, J. T., & Riedl, J. (2012). The rise and decline of an open collaboration system: How Wikipedia’s reaction to popularity is causing its decline. American Behavioral Scientist, 0002764212469365. summary full paper
  2. m:Grants:IEG/Editor_Interaction_Data_Extraction_and_Visualization