„Szerkesztővita:Gyimbot/Összegképlet robot” változatai közötti eltérés

Az oldal más nyelven nem érhető el.
Új téma nyitása
A Wikipédiából, a szabad enciklopédiából
Tartalom törölve Tartalom hozzáadva
Gyimhu (vitalap | szerkesztései)
Gyimhu átnevezte a(z) Szerkesztővita:Gyimbot/Összegképlet robot lapot a következő névre: Szerkesztővita:Gyimbot/Összegképlet robot/1. változat: Archívum. Mindjárt feltöltöm a 2. változat leírását.
Címke: Új átirányítás
 
Gyimhu (vitalap | szerkesztései)
Az összegképlet robot 2. változatának leírása
Címke: Megszüntetett átirányítás
 
1. sor: 1. sor:
A magyar Wikipédia adatait használó alkalmazás. Összegyűjti a kémiai lapokat, kigyűjti belőlük az összegképleteket, és továbbítja az összegképlet-kereső alkalmazásnak. Külső wikire listát készít a vegyületekről és néhány statisztikát a kémiai lapok keletkezéséről.
#ÁTIRÁNYÍTÁS [[Szerkesztővita:Gyimbot/Összegképlet robot/1. változat]]

Az eredmények helye:
* [https://www.gyimesilaszlo.hu/vegykeres.htm összegképlet kereső]
* [https://www.gyimesilaszlo.hu/politika/wiki/index.php/Segítség:Huwiki_vegyületek a vegyületek és összegképletek listája a létrehozási és utolsó módosítás dátumával]
* [https://www.gyimesilaszlo.hu/politika/wiki/index.php/Segítség:Vegyület_statisztikák statisztikák]

A bot nyílt forrású, [[GPL]]v2 licensszel. {{anchor|csomag}} A forrásprogram és az AMD64-es bináris egy [http://www.gyimesilaszlo.hu/readme.htm debian repository-ból] érhető el. Maga a bot egy [[C]]-programból, több [[Lua (programozási nyelv)|lua]]-programból és shell-szkriptből áll.

A bot [[raspberry pi]]-n fut, [[raspbian]] disztribúcióban, az előbb már említett debian repositoryból forrásból letöltött debian-csomagokkal, pillanatnyilag<ref>2019. május 31.</ref> naponta háromszor: 6, 14 és 20 óra után pár perccel. Mivel a szócikkek különbségét tölti csak le, és azok ritkán változnak, a futási idő általában egy percen belül marad.

== Újdonságok az előző verzióhoz képest ==
{{lásd még|Szerkesztő:Gyimbot/Összegképlet robot/1. változat}}
* A bot csak az előző lekérdezés óta megváltozott szócikkeket kérdezi le újra, a régebbieket az előző futás eredményéből veszi. Ez nagyságrenddel csökkentette a hálózati forgalmat és ennek következtében a futási időt.
* A vegyület kémiai nevét az eddigi DISPLAYTITLE helyett az infoboxbeli névből veszi. (A szócikk neve és a DISPLAYTITLE is technikai megkötéseket alkalmaz a névbeli karakterekre és formázásukra.) A vegyületnév első nem helyjel betűjét nagybetűre változtatja (ezek sokhelyütt helytelenül szerepelnek az infoboxban is), és a vegyületneveket a kémiai rendezés szabályai szerint teszi sorrendbe. Az összes vegyület napra kész sorrendezett listája [https://www.gyimesilaszlo.hu/cgi-bin/okepl.cgi itt található].
* Az infoboxból kigyűjti a SMILES-okat is, bár egyelőre nem dolgozza fel őket.
* Kódrevízió, algoritmus egyszerűsítés.

== Működés ==
Lépések:
# A bot lekérdezi a szócikk névtérből a kémiai sablonokra hivatkozó lapokat és azok utolsó módosítási idejét. Kémiai sablonok:
#* {{sl|Chembox}}
#* {{sl|Chembox_new}}
#* {{sl|Chembox új}}
#* {{sl|Drugbox}}
#* {{sl|Gyógyszeresdoboz}}
#* {{sl|Vegyület_infobox}}
# Az előző lekérdezéshez képest módosult szócikkeket lekérdezi a Wikipédiából, és az infoboxból kinyeri a molekula nevét, összegképletét, SMILES-szát és időadatait. A nem módosult szócikkek adatait az előző lekérdezésből veszi. Időadatok: a szócikk létrehozási és utolsó módosítási ideje és szerkesztője.
# Az összegképleteket korrigálja a kézi listával, majd rendezi a kémiai (helyjelek nélküli) rendezés szabályai szerint.
# Az összegképleteket és vegyületneveket feltölti az összegképletkeresőt futtató webszerverre.
# A létrehozási és módosítási időkből [https://www.gyimesilaszlo.hu/politika/wiki/index.php/Segítség:Huwiki_vegyületek wikilapot] állít elő. Egy [https://www.gyimesilaszlo.hu/politika/wiki/index.php/Segítség:Vegyület_statisztikák másik wikilapra] statisztikákat készít a Wikipédia szócikkek létrehozásáról. A két wikilapot feltölti egy külső wikire.

Bővebb információ: <code>man 1 kemiabot</code> (a <kbd>kemiabot</kbd> [[#csomag|debian-csomag]] telepítése után).

== Előzmények ==
A bot első változata a wikidump-ból, mysql adatbázisból dolgozott. A következő átdolgozáskor a mysql-t online lekérdezésre változtattam, amikor pedig elvették a megerősített szerkesztői jogomat, a bot két wikilapját átköltöztettem a saját szerveremre.
{{bővebben|Szerkesztő:Gyimbot/Összegképlet robot/1. változat}}

== Továbbfejlesztési tervek ==
# A bot átalakítása az angol Wikipédia vegyületeire is. Azt remélem, hogy 2019 őszére készen leszek. (Meglévő adatokra fejlesztéskor az adatellenőrzés és -javítás a nagy munka.)
# Az összegképlet-kereső továbbfejlesztése a vegyület szerkezete szerinti keresésre. Valamikor 2020-ra becslem az indulást. (A SMILES-ok várhatóan az összegképleteknél is rosszabb állapotban lesznek, és itt új programokat is kell írni a SMILES-okból számolt összegképletek összehasonlításán kívül.)

== Hiányosságok ==
Az összegképletek gyűjtéskor figyelmen kívül maradnak a polimerek és ionok (amelyek összegképletében betűvel adott az előfordulásszám, ill. amelyekben a töltést jelző előjel szerepel), valamint a kristályvizet tartalmazó vegyületek.

Ugyancsak kimaradnak a szabálytalan alakú összegképletek, amelyekben szabad szöveg, több képlet, vagy rosszul párosított HTML-elemek vannak, ill. amelyek a {{sl|chem}} sablonnal adottak, és zárójelet tartalmaznak.

== Jegyzetek ==
<references/>

== További információk ==
* [https://www.gyimesilaszlo.hu/vegykeres.htm külső összegképlet kereső]

== Kapcsolódó lapok ==
* [[Sablon:Kembox/Chembox new]] (a kémiai sablonok dokumentációja)
* [[Wikipédia:Kémiaműhely]]
* [[Szerkesztő:Gyimbot/Összegképlet robot/1. változat]]
* [[Szerkesztő:Gyimbot/Sablonparszer|sablonparszer]]

[[Kategória:Wikipédia-botok]]

A lap jelenlegi, 2019. június 1., 01:07-kori változata

A magyar Wikipédia adatait használó alkalmazás. Összegyűjti a kémiai lapokat, kigyűjti belőlük az összegképleteket, és továbbítja az összegképlet-kereső alkalmazásnak. Külső wikire listát készít a vegyületekről és néhány statisztikát a kémiai lapok keletkezéséről.

Az eredmények helye:

A bot nyílt forrású, GPLv2 licensszel. A forrásprogram és az AMD64-es bináris egy debian repository-ból érhető el. Maga a bot egy C-programból, több lua-programból és shell-szkriptből áll.

A bot raspberry pi-n fut, raspbian disztribúcióban, az előbb már említett debian repositoryból forrásból letöltött debian-csomagokkal, pillanatnyilag[1] naponta háromszor: 6, 14 és 20 óra után pár perccel. Mivel a szócikkek különbségét tölti csak le, és azok ritkán változnak, a futási idő általában egy percen belül marad.

Újdonságok az előző verzióhoz képest[szerkesztés]

  • A bot csak az előző lekérdezés óta megváltozott szócikkeket kérdezi le újra, a régebbieket az előző futás eredményéből veszi. Ez nagyságrenddel csökkentette a hálózati forgalmat és ennek következtében a futási időt.
  • A vegyület kémiai nevét az eddigi DISPLAYTITLE helyett az infoboxbeli névből veszi. (A szócikk neve és a DISPLAYTITLE is technikai megkötéseket alkalmaz a névbeli karakterekre és formázásukra.) A vegyületnév első nem helyjel betűjét nagybetűre változtatja (ezek sokhelyütt helytelenül szerepelnek az infoboxban is), és a vegyületneveket a kémiai rendezés szabályai szerint teszi sorrendbe. Az összes vegyület napra kész sorrendezett listája itt található.
  • Az infoboxból kigyűjti a SMILES-okat is, bár egyelőre nem dolgozza fel őket.
  • Kódrevízió, algoritmus egyszerűsítés.

Működés[szerkesztés]

Lépések:

  1. A bot lekérdezi a szócikk névtérből a kémiai sablonokra hivatkozó lapokat és azok utolsó módosítási idejét. Kémiai sablonok:
  2. Az előző lekérdezéshez képest módosult szócikkeket lekérdezi a Wikipédiából, és az infoboxból kinyeri a molekula nevét, összegképletét, SMILES-szát és időadatait. A nem módosult szócikkek adatait az előző lekérdezésből veszi. Időadatok: a szócikk létrehozási és utolsó módosítási ideje és szerkesztője.
  3. Az összegképleteket korrigálja a kézi listával, majd rendezi a kémiai (helyjelek nélküli) rendezés szabályai szerint.
  4. Az összegképleteket és vegyületneveket feltölti az összegképletkeresőt futtató webszerverre.
  5. A létrehozási és módosítási időkből wikilapot állít elő. Egy másik wikilapra statisztikákat készít a Wikipédia szócikkek létrehozásáról. A két wikilapot feltölti egy külső wikire.

Bővebb információ: man 1 kemiabot (a kemiabot debian-csomag telepítése után).

Előzmények[szerkesztés]

A bot első változata a wikidump-ból, mysql adatbázisból dolgozott. A következő átdolgozáskor a mysql-t online lekérdezésre változtattam, amikor pedig elvették a megerősített szerkesztői jogomat, a bot két wikilapját átköltöztettem a saját szerveremre.

Továbbfejlesztési tervek[szerkesztés]

  1. A bot átalakítása az angol Wikipédia vegyületeire is. Azt remélem, hogy 2019 őszére készen leszek. (Meglévő adatokra fejlesztéskor az adatellenőrzés és -javítás a nagy munka.)
  2. Az összegképlet-kereső továbbfejlesztése a vegyület szerkezete szerinti keresésre. Valamikor 2020-ra becslem az indulást. (A SMILES-ok várhatóan az összegképleteknél is rosszabb állapotban lesznek, és itt új programokat is kell írni a SMILES-okból számolt összegképletek összehasonlításán kívül.)

Hiányosságok[szerkesztés]

Az összegképletek gyűjtéskor figyelmen kívül maradnak a polimerek és ionok (amelyek összegképletében betűvel adott az előfordulásszám, ill. amelyekben a töltést jelző előjel szerepel), valamint a kristályvizet tartalmazó vegyületek.

Ugyancsak kimaradnak a szabálytalan alakú összegképletek, amelyekben szabad szöveg, több képlet, vagy rosszul párosított HTML-elemek vannak, ill. amelyek a {{chem}}(?) sablonnal adottak, és zárójelet tartalmaznak.

Jegyzetek[szerkesztés]

  1. 2019. május 31.

További információk[szerkesztés]

Kapcsolódó lapok[szerkesztés]