ChatGPT és Wikipédia

A Wikipédiából, a szabad enciklopédiából
ChatGPT

A ChatGPT és a Wikipédia két hatalmas, egyetemes, egymástól nem független tudásforrás. Egymásrautaltságukból adódó együttműködésük rövid időn belül, több területen is kialakult.[1]

Wikipédia

A ChatGPT betanításához létfontosságú, működéséhez, fejlesztéséhez elengedhetetlen a Wikipédia,[1] kifejlődött partnerségük, egyre szorosabbá és interaktívabbá vált kapcsolatuk.[2] Ugyanakkor a ChatGPT használatának lehetőségeit és korlátait a Wikipédia bővítésére, és a cikkek szerkesztésére nemzetközi szinten eddig nem határozták meg, még mindig vita tárgyát képezik a Wikipédia közösségében.[3]

A Wikipédia mint ősforrás[szerkesztés]

A ChatGPT (Generative Pre-trained Transformer)[4] mesterséges intelligenciamodellként az emberéhez hasonló szöveget generál. A Harvard Business Review a ChatGPT színrelépését a mesterséges intelligencia (MI) új korszaka nyitányaként éltette.[5] Amikor a felhasználó beír egy kérdést, parancsot vagy megjegyzést a ChatGPT motorjának párbeszédpanelébe, a rendszer szinte azonnal szöveges választ ad ugyanazon a nyelven.[6][7]

Ennek titka az, hogy a ChatGPT egy olyan mesterséges intelligenciával működő chatbot, amely a fejlett természetes nyelvi feldolgozást (natural language processing, NLP) használja motorjaként, hogy valósághű beszélgetéseket folytasson az emberekkel.[8] Bevezetésekor az különböztette meg a többi chatbottól, hogy ultrarealisztikus társalgási készségekkel rendelkezett, beleértve a nyomon követő kérdések feltevésének, a hibák beismerésének és a témákkal kapcsolatos árnyalatok kiemelésének képességét. A nyelvtani és szintaktikai hibák ritkák, az írásbeli szerkezetek logikusak és érthetőek voltak.[5]

A chatbotot kétféle, úgynevezett megerősítő tanulási módszerrel tanították be, az RLHF-fel (Reinforcement Learning from Human Feedback)[9][10] és a PPO-val (Proximal Policy Optimisation).[11][12] A szöveg beviteléhez (input) és kimenetéhez (output) a GPT-3.5 AI algoritmust használták (a GPT a Generative Pre-trained Transformer rövidítése, ez szerepel a chatbot nevében).[13] A GPT-3.5 a GPT-3 továbbfejlesztett változata, amely az OpenAI fejlesztése, és a megerősítő tanulás mellett a felügyelt tanulás módszerét is alkalmazza.[5]

A modell betanításának alapját nagy mennyiségű, emberek által létrehozott szöveg képezte, többnyire internetes szövegtartalmak, melyek széles skáláját használták fel a betanításhoz.[14] Az NLP nem tud konkrétumokat arról, hogy mely dokumentumok, milyen súllyal szerepeltek a képzésében és nem ismeri az egyes adatforrások sajátosságait sem.[15]

A tréningek során ebben a chatbotbetanítási fázisban vált egyértelművé a Wikipédia kitüntetett szerepe,[16] ugyanis a Wikipédia nyílt forráskódú online enciklopédiaként az emberi tudás különböző területeinek olyan átfogó gyűjteménye, mely számos nyelven, bárki számára szabadon hozzáférhető.[17] A tudását gyarapító ChatGPT számára is. A Wikipédia által kínált tartalom mind mennyiségében, mind minőségében kulcsfontosságú szerepet játszott a mesterséges intelligenciamodell "intelligenciájának" megteremtésében.[18] A ChatGPT képzési és tanulási folyamata nem fejeződött be a 2022 novemberi debütálásával, azóta is folyamatos, s ez természetes, hisz például premierjekor a 2021-et követő eseményekről még csak elvétve tudott, tudhatott.[19]

Ahogy az adat (data) egyre inkább meghatározó hatalmi tényezővé (dataizmus, Big data) vált,[20][21] a Wikipédia egyre inkább a nagy platformok által prioritásként kezelt adattá alakított tények rangos forrásává lett. Az Apple Siri, a Microsoft Bing, a Google Search és Home, valamint az Amazon Alexa egyaránt így tekintettek rá. A Google 2012-ben olyan újítással jelentkezett, amely még inkább felértékelte a Wikipédiát, annak információit és rendezett adathalmazát.[22] A Knowledge graph, a Google agyközpontja, mely egy hatalmas, több milliárd adatot tartalmazó, főként a Wikipédiából kinyert adatbázist rejtett magába.[23]

A Wikipédia legfontosabb alapvetései egyike, hogy nem az első közlés helye, szócikkei csak másodlagos forrásokon alapulhatnak. Mivel nem tartja magát akadémikus forrásnak, a saját szócikkei készítéséhez sem fogadja el a Wikipédia-forrásokat szerkesztőitől.[24] Ezzel együtt a ChatGPT betanítása során a Wikipédia kiemelt, megkülönböztetett szerepét az indokolta, hogy összehasonlítva az egyéb, képzéséhez használt nyers szövegforrásokkal, azoknál tudományos szempontból meghatározóan strukturáltabb, ellenőrzöttebb, pontosabb és komplexebb információkat nyújtott, magasabb minőséget hordozott.[1] Ez magától értetődő, mert a Wikipédia szócikkei folyamatos és többszintű belső ellenőrzésen esnek át. Háromszázat meghaladó számú nyelven lehet hozzájuk férni;[25] tartalma sokszínű és egyedülállóan kiterjedt. Később, mind a mai napig, a ChatGPT "naprakészsége" szempontjából jelentős szerepet játszott, hogy Wikipédia-forrása időben folyamatosan, dinamikusan frissül; ideális platformot biztosít ahhoz, hogy nagy mennyiségű és sokrétű adatból képezze tovább magát.[26] A Wikipédia infoboxaiban megadott információknak kiemelt, stratégiai jelentősége van, ezeket input prioritásként kezeli a ChatGPT csakúgy, mint a Google, a Bing vagy a Yahoo a személyekről, cégekről, helyekről, eseményekről a tudástáblájában vagy ténydobozában.[27][28]

A ChatGPT egyik legfontosabb erőforrásaként használja a Wikipédiát, vannak azonban korlátok, melyeket figyelembe kell vennie. A Wikipedia tényszerűsége magas szintet képvisel, de nem tökéletes.[29] A ChatGPT-nek ezért meg kell tanulnia kezelni a következetlenségeket, félinformációkat és elfogultságokat.[30] Mindazonáltal Wikipédiából „csak egy van”, ezért minden mesterséges intelligencia-eszköz megkerülhetetlenül csak a Wikipédiát prioritásként kezelő betanítási elvek mentén képezheti ki "magát", majd működhet.[31] Ez a tény idővel egyre továbberősíti és felértékeli a Wikipédia nyílt forráskódú, közösségvezérelt modelljének fontosságát és jelentőségét.[32]

A Wikipédia mint napi forrás[szerkesztés]

Wikipedia ChatGPT plugin a Wikipédiát adja meg a ChatGPT által generált válaszok forrásaként

Az OpenAI a ChatGPT funkcionális továbbfejlesztését bővítmények, pluginok beiktatása segítségével oldja meg. A felhasználók számára ez a plugin-rendszer teszi lehetővé a mesterséges intelligencia személyre szabott funkcionális bővítését.[33]

Azon túl, hogy a ChatGPT kifejlesztésében a Wikipédiának a fentiek szerint stratégiai jelentősége volt , az OpenAI által létrehozott Wikipedia ChatGPT Plugin egy olyan bővítmény, amely operatív szinten teszi lehetővé a ChatGPT számára, hogy általános ismeretekre vonatkozó kérdésekre válaszolva, azok alapjaként keresse meg és foglalja össze a legfrissebb információkat a Wikipédiából.[34]

A Wikipedia ChatGPT Plugin a Wikipédiából származó naprakész információkkal bővíti a ChatGPT-vel való interakciókat, az információk gyors és hatékony elérésének eszközeként funkcionál, mintegy mini enciklopédiaként működve. A bővítmény a szélesebb körű ChatGPT ökoszisztéma része, amely magában foglalja a fő ChatGPT szolgáltatást és annak prémium változatát, a ChatGPT Plus-t is. A bővítmény kiegészíti a ChatGPT tudásszolgáltatását, lehetővé teszi a felhasználók számára, hogy közvetlenül a mesterséges intelligenciával rendelkező chatbottal folytatott beszélgetéseik során férjenek hozzá a Wikipédia tartalmakhoz.[35]

A Wikipedia ChatGPT Plugin a meglévő kereső API-t használja az információhoz kulcsfontosságú Wikipédia-cikkek megtalálásához. Ezt követően a 4 legfontosabb releváns cikkből idézi a 12 legfontosabb szövegrészletet. A plugin megadja a cikkekre mutató forráslinkeket és igazolja az információk felhasználásának jogtisztaságát is.[36]

A ChatGPT mint forrás[szerkesztés]

Az egymásrautaltság idővel egyre erősebbé válik,[21] a ChatGPT is hatalmas lehetőségeket kínál a Wikipédia fejlesztésére.[37] A mesterséges intelligencia olyan feladatokban segíthet, mint a vandalizmus felderítése, szerkesztési javaslatok, vagy akár a csonkcikkek kiegészítése. Ezek a példák is igazolják, hogy a kapcsolat idővel valóban egyre inkább szimbiózissá alakulhat.[27]

A ChatGPT a meglévő Wikipédia szócikkek alapján új tartalmak létrehozásában is segíthet, képes lehet összetett szócikkek egyszerűsített változatát létrehozni, hatékonyan növelve az információk hozzáférhetőségét és elérhetőségét.[38] Javíthatja a Wikipédia megbízhatóságát és pontosságát, használható az információk tényszerűségének ellenőrzésére, az elfogultságok azonosítására és korrigálására, valamint elősegítheti a szócikkek semleges nézőpontjának (NPOV) magvalósulását.[39] A tartalom minőségének javításával a ChatGPT hozzájárulhat a Wikipédia hitelességének és ezáltal jelentőségének növeléséhez.[31]

A ChatGPT növelheti a Wikipédia hozzáférhetőségét azáltal, hogy fordításokat kínál, összefoglalókat készít a gyors megértés érdekében, vagy hangos változatot kínál a szócikkekből.[40] Minél könnyebb a felhasználók számára a Wikipédia tartalmának elérése és megértése, annál fontosabbá és népszerűbbé válik általánosan a Wikipédia mint tudásforrás. A fentiek hozzájárulnak a Wikipédia népszerűsítéséhez.[41]

A Wikipédia-közösség és a ChatGPT[szerkesztés]

A ChatGPT megjelenése óta heves vita folyik a Wikipédia-közösségen belül arról, hogy a konkrét Wikipédia szerkesztés során lehessen-e, s ha igen, akkor miként lehessen használni a mesterséges intelligenciát.[42] Még nem dolgoztak ki olyan ajánlásokat, amelyek kifejezetten a ChatGPT-vel való szerkesztésre vonatkoznának, bár a plágiumot tiltó és ellenőrzést előíró belső irányelvek értelemszerűen tiltják az MI által generált szövegek vakon történő beillesztését.[43] Egyes wikipédisták szerint a ChatGPT-t teljesen be kellene tiltani, még akkor is, ha az így szerkesztett cikkeket később hús-vér szerkesztők ellenőrzik.[44] Szerintük a mesterséges intelligencia túlságosan is képes hihető valótlanságokat állítani.[45] Az a veszély is fennáll, hogy a Wikipédia szerkesztői nehezebben tudják ellenőrizni a közzétett tartalmakat.[46]

Ugyanakkor már jóval korábban, 2002-ben egy Ram-Man néven szerkesztő wikipédista rambot névre keresztelt önműködő eszközével elkezdte automatikusan generálni az amerikai városok Wikipédia-szócikkeit az amerikai népszámlálási adatokra támaszkodva . Ezzel egy korábban teljesen szokatlan, új szerkesztési gyakorlatot honosított meg.[3] Az újítás praktikus előnyeit felismerve a Wikipédia-közösség még ugyanabban az évben elfogadta, hogy bizonyos esetekben lehessen használni chatbotokat szerkesztésre.[47] Így széles körben elfogadottá, és több mint két évtizede világszerte használttá váltak azok a botok, amelyek automatikusan felismerik a vandalizmust és kiszűrik a vulgáris szövegeket éppúgy, mint a káromkodásokat.[47]

Andrew Lih, a washingtoni Smithsonian Institution wikimédiás munkatársa, aki 2003 óta önkéntes Wikipédia-szerkesztő, azt állítja, hogy a ChatGPT-ben rejlő lehetőség egy wikipédista számára a kezdeti tehetetlenség leküzdésében és az "aktivációs energia" megtalálásában segíthet.[3] Úgy tekint a ChatGPT-re, mint a wiki szoftver készítőjéről és fejlesztőjéről, Ward Cunninghamről elnevezett Cunningham-törvény megvalósíthatóságának újszerű lehetőségére.[48] Cunningham törvénye szerint a legjobb módja annak, hogy helyes válaszhoz jussunk az interneten nem az, hogy felteszünk egy kérdést, hanem az, hogyha közzéteszünk egy rossz választ. Az analógia szerint mostantól a legegyszerűbb módja annak, hogy egy jó szócikk készüljön az, ha egy meglehetősen rossz, de nem teljesen rossz, ChatGPT által generált változatot tesznek közzé továbbszerkesztésre.[48]

Az első ChatGPT közreműködésével készült Wikipédia szócikket 2022. december 6-án tette közzé – máig megtekinthető módon, az angol nyelvű Wikipédiában – Richard Knipel, egy régóta Pharos néven szerkesztő wikipédiás, Artwork title címmel.[49] Szerkesztői összefoglalójában azt írta, hogy ez csak egy ChatGPT-vel készített vázlat, amelyet később módosít.[50] A ChatGPT egy átlagos, nyelvtanilag hibátlan verziót készített a tárgyban. A Knipelhez hasonló wikipédisták úgy vélik, hogy a ChatGPT-t eszközként lehet használni a Wikipédián belül anélkül, hogy az emberi szerep leértékelődne.[51] A chatbot által generált nyers szöveg hasznos kiindulópontként vagy vázlatként szolgálhat, amelyet aztán a szerkesztő ellenőrizhet és kidolgozhat.[48] Knipel kijelentette: "Mindig tökéletlen információkkal rendelkezünk, és aztán kijavítjuk őket. Ha azt mondják, hogy a ChatGPT használata eredendő bűn, nos akkor erre azt válaszolom, hogy én nem hiszek az eredendő bűnben".[3]

Jegyzetek[szerkesztés]

  1. a b c Dwivedi, Yogesh K., Laurie (2023. augusztus 1.). „Opinion Paper: “So what if ChatGPT wrote it?” Multidisciplinary perspectives on opportunities, challenges and implications of generative conversational AI for research, practice and policy” (angol nyelven). International Journal of Information Management 71, 102642. o. DOI:10.1016/j.ijinfomgt.2023.102642. ISSN 0268-4012.  
  2. Naughton, John. „Wikipedia isn't perfect, but as a model it's as good as it gets”, The Guardian, 2014. augusztus 10. (Hozzáférés: 2023. június 30.) (brit angol nyelvű) 
  3. a b c d Harrison, Stephen. „Should ChatGPT Be Used to Write Wikipedia Articles?”, Slate, 2023. január 12. (Hozzáférés: 2023. június 24.) (amerikai angol nyelvű) 
  4. Roose, Kevin. „The Brilliance and Weirdness of ChatGPT”, The New York Times, 2022. december 5. (Hozzáférés: 2023. június 24.) (amerikai angol nyelvű) 
  5. a b c Greengard, Samuel: ChatGPT: Understanding the ChatGPT AI Chatbot (amerikai angol nyelven). eWEEK, 2022. december 29. (Hozzáférés: 2023. június 24.)
  6. Lock, Samantha. „What is AI chatbot phenomenon ChatGPT and could it replace humans?”, The Guardian, 2022. december 5. (Hozzáférés: 2023. június 27.) (brit angol nyelvű) 
  7. News, A. B. C.: What is ChatGPT, the artificial intelligence text bot that went viral? (angol nyelven). ABC News. (Hozzáférés: 2023. június 27.)
  8. McFadden, Christopher: ChatGPT: 30 incredible ways to use the AI-powered chatbot (amerikai angol nyelven). interestingengineering.com, 2023. február 1. (Hozzáférés: 2023. június 27.)
  9. Learning from human preferences (amerikai angol nyelven). openai.com. (Hozzáférés: 2023. június 24.)
  10. Christiano, Paul; Tom B.: Deep reinforcement learning from human preferences (angol nyelven). arXiv.org, 2017. június 12. (Hozzáférés: 2023. június 24.)
  11. Proximal Policy Optimization (amerikai angol nyelven). openai.com. (Hozzáférés: 2023. június 24.)
  12. Schulman, John; Prafulla: Proximal Policy Optimization Algorithms (angol nyelven). arXiv.org, 2017. július 20. (Hozzáférés: 2023. június 24.)
  13. What is ChatGPT, DALL-E, and generative AI? | McKinsey. www.mckinsey.com. (Hozzáférés: 2023. június 27.)
  14. How ChatGPT and similar AI will disrupt education (amerikai angol nyelven), 2023. április 12. (Hozzáférés: 2023. június 27.)
  15. Machine learning, explained | MIT Sloan (angol nyelven). mitsloan.mit.edu, 2023. június 20. (Hozzáférés: 2023. június 24.)
  16. The inside story of ChatGPT: How OpenAI founder Sam Altman built the world’s hottest technology with billions from Microsoft (angol nyelven). Fortune. (Hozzáférés: 2023. június 27.)
  17. An AI Helped Write This Play. It May Contain Racism (angol nyelven). Time, 2021. augusztus 23. (Hozzáférés: 2023. június 27.)
  18. Montti, Roger: ChatGPT For Content and SEO? (angol nyelven). Search Engine Journal, 2022. december 12. (Hozzáférés: 2023. június 24.)
  19. Could a chatbot answer Prime Minister's Questions?”, BBC News, 2022. december 27. (Hozzáférés: 2023. június 24.) (brit angol nyelvű) 
  20. Adams, Tim. „Homo Deus: A Brief History of Tomorrow by Yuval Noah Harari review – chilling”, The Observer, 2016. szeptember 11. (Hozzáférés: 2023. június 27.) (brit angol nyelvű) 
  21. a b Harari, Yuval Noah. „Yuval Noah Harari on big data, Google and the end of free will”, Financial Times, 2016. augusztus 26. (Hozzáférés: 2023. június 27.) 
  22. entercomgroup.hu: Google Knowledge Graph, Google Tudásgráf | EnterCom (magyar nyelven). Google Knowledge Graph, Google Tudásgráf | EnterCom. (Hozzáférés: 2023. június 24.)
  23. MEGKAPJA A GOOGLE KÉPKERESŐ IS A TUDÁS GRÁFOT iPon - 2020.07.10. 9:44 https://ipon.hu/magazin/cikk/megkapja-a-google-kepkereso-is-a-tudas-grafot
  24. Wikipédia szövegírás, SEO Wikipédia készítés és tanácsadás (magyar nyelven). Tartalomkeszites.hu. (Hozzáférés: 2023. június 24.)
  25. Babbel.com: Language On Wikipedia: How The Website Deals With The World’s Many Languages (angol nyelven). Babbel Magazine. (Hozzáférés: 2023. június 30.)
  26. Perez, Sarah: Wikipedia gets its first makeover in over a decade... and it's fairly subtle (amerikai angol nyelven). TechCrunch, 2023. január 18. (Hozzáférés: 2023. június 27.)
  27. a b Ford, Heather: Writing the Revolution: Wikipedia and the Survival of Facts in the Digital Age (amerikai angol nyelven). Next Big Idea Club. (Hozzáférés: 2023. június 24.)
  28. Daily, Investor's Business: ChatGPT Is Just The 'Tip Of The Iceberg' In Content-Creating AI (amerikai angol nyelven). Investor's Business Daily, 2023. február 6. (Hozzáférés: 2023. június 24.)
  29. Wikipedia's 20, but how credible is it? – DW – 01/14/2021 (angol nyelven). dw.com. (Hozzáférés: 2023. június 27.)
  30. Wikipedia's 20, but how credible is it? – DW – 01/14/2021 (angol nyelven). dw.com. (Hozzáférés: 2023. június 27.)
  31. a b Saad, Nichole: For educators, is ChatGPT the new Wikipedia? (angol nyelven). Medium, 2023. január 19. (Hozzáférés: 2023. június 24.)
  32. Naughton, John. „Wikipedia isn't perfect, but as a model it's as good as it gets”, The Guardian, 2014. augusztus 10. (Hozzáférés: 2023. június 27.) (brit angol nyelvű) 
  33. ChatGPT Plugin - Wikipedia (amerikai angol nyelven). GPTStore.AI. (Hozzáférés: 2024. március 13.)
  34. Editor: A quick guide to accessing and integrating plugins seamlessly into ChatGPT (amerikai angol nyelven). chatgptguide.ai, 2023. május 20. (Hozzáférés: 2024. március 13.)
  35. Wikipedia ChatGPT plugin experiment summary https://upload.wikimedia.org/wikipedia/commons/3/34/Wikipedia_ChatGPT_plugin_experiment_summary.pdf
  36. Wikipedia & ChatGPT plugins for Web Content Access Like Wikipedia (angol nyelven). www.whatplugin.ai. (Hozzáférés: 2024. március 13.)
  37. Jones, Eric: Council Post: The Strategic Opportunities Of Advanced AI: A Focus On ChatGPT (angol nyelven). Forbes. (Hozzáférés: 2023. június 27.)
  38. 9 Ways That ChatGPT Can Help Content Creators (angol nyelven). MUO, 2023. június 20. (Hozzáférés: 2023. június 27.)
  39. What is ChatGPT? Everything you need to know about chatbot from OpenAI (angol nyelven). Washington Post, 2022. december 6. (Hozzáférés: 2023. június 27.)
  40. Croft, Lauren: ChatGPT is ‘no different to Wikipedia’, lawyers warned (brit angol nyelven). www.lawyersweekly.com.au, 2023. február 7. (Hozzáférés: 2023. június 24.)
  41. ChatGPT use cases: 12 examples to use AI effectively (angol nyelven). Dexerto. (Hozzáférés: 2023. június 24.)
  42. Saad, Nichole: For educators, is ChatGPT the new Wikipedia? (angol nyelven). Medium, 2023. január 19. (Hozzáférés: 2023. június 27.)
  43. Wikipedia Uses iThenticate to Ensure Content Quality (amerikai angol nyelven). www.turnitin.com, 2019. május 14. (Hozzáférés: 2023. június 27.)
  44. Wikipedia Uses iThenticate to Ensure Content Quality (amerikai angol nyelven). www.turnitin.com, 2019. május 14. (Hozzáférés: 2023. június 30.)
  45. Ford, Heather: Writing the Revolution: Wikipedia and the Survival of Facts in the Digital Age (amerikai angol nyelven). Next Big Idea Club. (Hozzáférés: 2023. június 30.)
  46. Saad, Nichole: For educators, is ChatGPT the new Wikipedia? (angol nyelven). Medium, 2023. január 19. (Hozzáférés: 2023. június 30.)
  47. a b Vandalism Detection in Wikipedia: a Bag-of-Words Classifier Approach --- Amit Belani --- ab422@cornell.edu November 11, 2009 https://arxiv.org/ftp/arxiv/papers/1001/1001.0700.pdf
  48. a b c What 'Cunningham's Law' Really Tells Us About How We Interact Online (angol nyelven). Lifehacker, 2022. április 1. (Hozzáférés: 2023. június 27.)
  49. Harrison, Stephen. „Should ChatGPT Be Used to Write Wikipedia Articles?”, Slate, 2023. január 12. (Hozzáférés: 2023. június 30.) (amerikai angol nyelvű) 
  50. Artwork title: Revision history - Wikipedia (angol nyelven). en.wikipedia.org. (Hozzáférés: 2023. június 30.)
  51. Cunningham’s Law – Brian.Carnell.Com. brian.carnell.com. (Hozzáférés: 2023. június 30.)