Wikipédia:A CSVLoader használata

A Wikipédiából, a szabad enciklopédiából
Ugrás a navigációhoz Ugrás a kereséshez

Ez a szócikk a CSVLoader használatát mutatja be egy egyszerű példán keresztül. A példában szereplő képernyőmentések egy régebbi verzióval készültek, így elképzelhető, hogy bizonyos párbeszédablakok máshogy néznek ki. De az eltérés általában csak további, itt nem részletezett funkciók megjelenését jelenti. Ettől eltekintve a leírás használható az újabb verziókhoz is.

A képek kattintással nagyíthatók!

Új CSV fájl készítése[szerkesztés]

WPCSV 0.JPG

Először is készítenünk kell egy szöveges fájlt a CSVLoader számára. A fájl tartalmazza a szócikkek neveit külön sorokban, mellette pedig a használni kívánt adatok szerepeljenek egyértelmű elválasztással (pl. simán vesszővel, de csak akkor, ha a se az adatok, se a szócikkek címei nem tartalmaznak vesszőt). A példában szereplő fájl három szócikk nevét tartalmazza (banana, apple, grape), szócikkenként három tulajdonsággal, vesszővel elválasztva.

A fájlnak nem szabad tartalmaznia az oszlopok neveit, ezt később kell majd beírnunk.

Ha a szócikkek nevei és az adatok nem csak latin betűket és számokat tartalmaznak, akkor a fájlt UTF-8 formátumba kell elmenteni. Ennek mikéntjét az alkalmazott szövegszerkesztőben kell megkeresni, de általában elég egy Mentés másként..., majd a formátumnál az UTF-8 kiválasztása.

A csv plugin másolása[szerkesztés]

Töltsük le a csvsplugint, majd a kapott .zip fájl tartalmát csomagoljuk ki az autowikibrowser.exe fájl mellé, az AutoWikiBrowser könyvtárába. Az új fájl automatikusan meg fog jelenni az AutoWikiBrowser Plugins menüjében.

A csv plugin megnyitása[szerkesztés]

WPCSV 1.JPG

Indítsuk el az AutoWikiBrowsert (a továbbiakban csak röviden AWB-t) és jelentkezzünk be.

WPCSV 4.JPG

Válasszuk ki a CSV Plugint a Plugins menüben.

WPCSV 2.JPG

A kiválasztás után egy Megnyitás párbeszédablak fog megnyílni. Ebben válasszuk ki a korábban létrehozott szöveges fájlt. Ha minden helyes benne, a fájl szócikkeinek a nevét az AWB automatikusan be fogja tölteni.

A plugin beállításai[szerkesztés]

WPCSV 5.JPG

A szócikkek neveinek betöltése után egy újabb párbeszédablak nyílik.

Ellenőrizzük, hogy fent a Skip when no changes modelegyen bepipálva, lent pedig az Append.

A Separeted by mezőbe a szövegfájlban használt mezőelválasztó karakter legyen (példánkban a vessző).

A Column Headers sorba az adatoszlopok neveit írjuk be vesszővel elválasztva. Minden egyes nevet két speciális karakterrel kezdjük és zárjuk. Olyat válasszunk, amely a szövegben kettőzve biztosan nem fog előfordulni. Példánkban ez a kettőskereszt (#) kétszer. Később ezekre a nevekre fogunk hivatkozni.

Az alsó nagyobb szövegbeviteli mezőbe gépeljük be a szócikkek szövegét. Ahol a CSV fájl adataira lesz szükség, ott használjuk a Colombs headers mezőben megadott paraméterneveket kettős speciális karakterrel (példánkban a kettőskereszt) kezdve és lezárva.

Kattintsunk az OK-ra.


WPCSV 3.JPG

Ezután az AWB kezelőfelületén találjuk magunkat, oldalt pedig már betöltve várnak a fájlban található cikknevek.

Végső beállítások és indítás[szerkesztés]

WPCSV 6.JPG

A főképernyőn kattintsunk a Skip fülre.

Legalul válasszuk ki az Exists rádió gombot.

Erre azért van szükség, hogy már létező lapot ne írjunk felül, a létező lapokat a program automatikusan át fog ugorni.

WPCSV 7.JPG

Kattintsunk a Start fülre.

Töltsük ki a szerkesztési összefoglalót (edit summary).

WPCSV 8.JPG

Kattintsunk a Start gombra. Az első szócikket már láthatjuk is kódnézetben az ablak felső részén.

WPCSV 9.JPG

Ha mindent rendben látunk, kattintsunk a Save gombra.

WPCSV 10.JPG

A következő szócikk ezután mindig automatikusan be fog töltődni, egészen addig, míg el nem fogynak az elemek a listából.

WPCSV 11.JPG

Ezután csak ismételgetni kell.

WPCSV 12.JPG

Ha el szeretnénk menteni a beállításokat, akkor válasszuk a Save Settings opciót a File menüből.

WPCSV 13.JPG

Írjuk be a fájl nevét, majd Save (Mentés).

WPCSV 14.JPG

Egyéb cserékhez az Options fül normal settings gombjára kattintsunk.

WPCSV 15.JPG

Ebben az ablakban soronként egy cserét tudunk beírni, a jelölőnégyzetekkel azt tudjuk befolyásolni, hogy érzékeny legyen-e a kis/nagybetűkre, a cserét engedélyezzük-e, de megadhatunk már itt szerkesztési összefoglalót is (comment).

Gyakorlati példák[szerkesztés]

Új szócikk(ek) létrehozása[szerkesztés]

Új szócikk példaszöveg[szerkesztés]

{{Magyar település infobox
|név=##City##
|megye=##District##
|ország=##State##
}}

'''##City##''' egy város [[##State##]]on, [[##District## megye|##District## megyében]].

{{Csonk-##District##}}

[[Kategória:##District## megye települései]]

Oszlop fejléc[szerkesztés]

##City##,##State##,##District##

Adatfájl[szerkesztés]

Kecskemét,Magyarország,Bács-Kiskun
Szeged,Magyarország,Csongrád
Budapest,Magyarország,Pest

Eredménye[szerkesztés]

{{Magyar település infobox
|név=Kecskemét
|megye = Bács-Kiskun
|ország=Magyarország
}}
'''Kecskemét''' egy város [[Magyarország]]on, [[Bács-Kiskun megye|Bács-Kiskun megyében]]. 

{{Csonk-Bács-Kiskun}}

[[Kategória:Bács-Kiskun megye települései]]

Megjelenés[szerkesztés]

Kecskemét
Közigazgatás
Ország Magyarország
MegyeBács-Kiskun
Népesség
Teljes népességismeretlen
Földrajzi adatok
Időzóna CET, UTC+1

Kecskemét egy város Magyarországon, Bács-Kiskun megyében.


Települések népességi alsablonjainak frissítése[szerkesztés]

A plugint a „Replace” módba kell állítani.

Sablon példaszöveg[szerkesztés]

{{népesség|##lakos-2015##|2015-01-01|
{{CitWeb
 |url=http://www.ksh.hu/apps/shop.kiadvany?p_kiadvany_id=81322&p_temakor_kod=KSH&p_session_id=907226109571601&p_lang=HU
 |szerző=[[Központi Statisztikai Hivatal]]
 |cím=Magyarország közigazgatási helynévkönyve, 2015. január 1.
 |weblap=ksh.hu
 |dátum=2015-01-01
 |elér=2015-09-06
 }}
|##település##
|{{{1}}}}}

Oszlop fejléc[szerkesztés]

##file##,##település##,##lakos-2015##

Adatfájl[szerkesztés]

Sablon:Népesség/Aba (Magyarország),Aba (Magyarország),4426
Sablon:Népesség/Abádszalók,Abádszalók,4279
Sablon:Népesség/Abaliget,Abaliget,650
Sablon:Népesség/Abasár,Abasár,2538

Eredménye[szerkesztés]

{{népesség|4426|2015-01-01|
{{CitWeb 
 |url=http://www.ksh.hu/apps/shop.kiadvany?p_kiadvany_id=81322&p_temakor_kod=KSH&p_session_id=907226109571601&p_lang=HU
 |szerző=[[Központi Statisztikai Hivatal]]
 |cím=Magyarország közigazgatási helynévkönyve, 2015. január 1.
 |weblap=ksh.hu
 |dátum=2015-01-01
 |elér=2015-09-06
 }}
|Aba (Magyarország)
|{{{1}}}}}

Megjelenés[szerkesztés]

# Aba (Magyarország) népességi adatai
1 népesség 4426 fő
A számot mindenféle tagolás és a szó nélkül kell megadni, a formázás a {{szám}}(?) sablonnal történik.
2 népességi adat éve (2015. jan 1.)
A számot linkelés nélkül kell megadni, egyszerű évszámként, a wikilink automatikusan elkészül.
3 népesség forrása Központi Statisztikai Hivatal: Magyarország közigazgatási helynévkönyve, 2015. január 1. ksh.hu (2015. jan. 1.) (Hozzáférés: 2015. szept. 6.)
A forrást <ref> nélkül kell megadni, lehetőleg a {{cite web}}(?) sablonnal.


Infoboxok bővítése teljesen hiányzó sorok esetén[szerkesztés]

Cserélendő kód[szerkesztés]

Először az AWB egyszerű csere (Options/Normal settings) ablakában a cserélendő kódot adjuk meg. A számok infoboxa esetében, ha ott pl. az osztók összege már meg van adva, de az euler-függvény, möbius-függvény és a mertens-függvény sora még hiányzik, akkor:

  • a cserélendő kód:
(\|\s*?osztók\sösszege\s*?=.*?)(\n)
  • amire cserélni kell:
$1$2| euler-függvény = ##euler##$2| möbius-függvény = ##mobius##$2| mertens-függvény = ##mertens##$2

A regex jelölőnégyzetbe rakjunk pipát.

Sablon példaszöveg[szerkesztés]

A CSVLoader Settings ablakában a cserélendő szöveg mezejét üresen hagyjuk. A "Find and replace" checkboxba pipát teszünk, és az "Append/Prepend/Replace" lehetőségek közül kiválasztjuk az "Append" opciót. A "Field separator" ebben az esetben pontosvessző (;).

Oszlop fejléc[szerkesztés]

##file##;##euler##;##mobius##;##mertens##

Adatfájl[szerkesztés]

1 (szám);1;1;1
2 (szám);1;-1;0
3 (szám);2;-1;-1
4 (szám);2;0;-1
5 (szám);4;-1;-2
...
300 (szám);80;0;-5
301 (szám);252;1;-4
302 (szám);150;1;-3
303 (szám);200;1;-2
304 (szám);144;0;-2
305 (szám);240;1;-1
306 (szám);96;0;-1
307 (szám);306;-1;-2
308 (szám);120;0;-2
309 (szám);204;1;-1
310 (szám);120;-1;-2

Eredménye[szerkesztés]

A bővítés után az infobox így néz ki:

{{Szám infobox
| szám = 301
| kanonikus alak = 7<sup>1</sup>&nbsp&nbsp;43<sup>1</sup>
| osztók = 1, 7, 43, 301
| osztók száma = 4
| osztók összege = 352
| euler-függvény = 252
| möbius-függvény = 1
| mertens-függvény = -4
| római szám = CCCI
| bináris alak = 100101101
| oktális alak = 455
| hexadecimális alak = 12D
}}

Infoboxok bővítése kitöltetlen sorok esetén[szerkesztés]

Az eljárás nagyon hasonló a fenti teljesen hiányzó sorokhoz. A különbség a cserélendő kódban van.

Cserélendő kód[szerkesztés]

Először az AWB egyszerű csere (Options/Normal settings) ablakában a cserélendő kódot adjuk meg. A számok infoboxa esetében, ha ott pl. a möbius-függvény sora még nincs kitöltve, (az egyenlőségjel és az új sor között csak legfeljebb szóközök vannak) akkor:

  • a cserélendő kód:
(\|\s*?möbius-függvény\s*?=)\s*?(\n)
  • amire cserélni kell:
$1 ##mobius##$2

Fontos a $1 és a ##mobius## közötti szóköz, különben az első reguláris változó értékét a martens-értékkel a bot egybeolvassa és így azt megzavarja.

A regex jelölőnégyzetbe rakjunk pipát.

Polgármesterek hozzáadása[szerkesztés]

Ezzel a példával településekhez tudunk hiányzó polgármestereket hozzáadni.

Cserélendő kód[szerkesztés]

Először az AWB egyszerű csere (Options/Normal settings) ablakában a cserélendő kódot adjuk meg:

  • a cserélendő kód:
(\|\s*?polgármester\s*?=\s*?)(\n)
  • Erre:
$1##polg##$2

A regex jelölőnégyzetbe rakjunk pipát.

Sablon példaszöveg[szerkesztés]

A CSVLoader Settings ablakában a cserélendő szöveg mezejét üresen hagyjuk. A "Find and replace" checkboxba pipát teszünk, és az "Append/Prepend/Replace" lehetőségek közül kiválasztjuk az "Append" opciót. A "Field separator" ebben az esetben pontosvessző (;).

Oszlop fejléc[szerkesztés]

##file##;##polgarmester##

Adatfájl[szerkesztés]

Bergères;Florence Petit
Bergères-lès-Vertus;Gervais Perrot
Bergères-sous-Montmirail;Delphine Gohin
Berhet;Catherine Lucas
Berjou;Didier Vieceli
...

Eredménye[szerkesztés]

A bővítés után az infobox így néz ki:

{{Francia település infobox
| név = Berjou
| polgármester = Didier Vieceli
}}

További információk[szerkesztés]

Lehetséges hibák[szerkesztés]

  • Ha a CSV fájl egy sorában több az adat és az adatokat elválasztó határoló, akkor az AutoWikiBrowser hibát fog jelezni. A hibakeresést segíti, hogy a hibaüzenet tartalmazza a hibás elem nevét is, így könnyedén meg lehet találni a baj forrását;
  • A fájlban és a CSV plugin beállító ablakában az oszlophatárolók azonosak legyenek;
  • Ügyeljünk rá, hogy a Skip fülön a non-exist legyen bepipálva;
  • A Modulok ne legyenek engedélyezve;
  • A beolvasott szövegfájl ne tartalmazzon Wikipédia jelölő elemeket;
  • A szócikkek címei a fájlban nagybetűsek legyenek;
  • Az AWB List menüpontjában ne legyen beállítva sem a „Keep alphabetized”, sem a „Remove duplicates” opció, különben (pl. az ékezetek miatt) eltérő sorrendű lista és adatfájl miatt a program kihagyhatja a sorokat;

Lásd még[szerkesztés]

Külső hivatkozások[szerkesztés]