Google Fordító

A Wikipédiából, a szabad enciklopédiából

A Google Fordító (Google Translate) a Google internetes cég 2007-ben bevezetett gépi fordítási szolgáltatása. A Google Fordító, ellentétben a többi fordítóval, nem nyelvtani, hanem statisztikai elemzést alkalmaz. Ehhez nagy mennyiségű, kétnyelvű szöveg szükséges. Kezdetben a Google a SYSTRAN-t használta fordításra[1], ami a Babel Fish, AOL és a Yahoo fordítási szolgáltatásának alapját képezte. Mikor saját fordítási szoftverével lecserélte a SYSTRAN-t, elsőnek a Google az ENSZ dokumentumait dolgozta fel, melyek elérhetőek voltak az ENSZ összes hivatalos nyelvén (arab, kínai, angol, francia, orosz, spanyol). A program algoritmusa öntanuló. Továbbá a felhasználók is segíthetik a fordítást, fordítási javaslatokat adhatnak, melyek bekerülnek a következő változatba. Így a fordítás minőségének javulására számíthatunk. 2009. november 19-én lépett ki a béta státusból.

Képességek és korlátok[szerkesztés | forrásszöveg szerkesztése]

A szolgáltatás korlátozza az egyszerre lefordítható bekezdések számát. Lehetséges a forrásnyelven keresést megadni oly módon, hogy a keresőkifejezést először lefordítsa a célnyelvre, majd a keresési találatokat visszafordítsa az eredeti nyelvre, ily módon értelmezhetővé téve az idegen nyelvű találatokat.[2] Egyes nyelveknél lehetőség van alternatív fordítások kiválasztására. Lehetőség van a „nyelvfelismerés” használatával a forrásszöveg nyelvének gépi felismertetésére is.

A Google fordítójának, más gépi fordítóeszközökhöz hasonlóan, korlátozottak a képességei. Bár alkalmas arra, hogy az olvasó képet alkosson egy idegen nyelvű szöveg körülbelüli tartalmáról, általában nem képes pontos fordítást adni. Bizonyos nyelvpárokkal jobban működik a fordítás, mint másokkal, például 2010-ben a franciáról angolra fordítás minősége igen jónak volt mondható;[3] a szabályalapú gépi fordítás azonban jobban teljesít, ha a fordítandó szöveg rövid; ez különösen meglátszik a kínairól angolra fordítás minőségén.[3]

A görög, dévanágari, cirill és arab írásrendszerű szövegeket a Google Fordító képes automatikusan átírni a latin írásrendszerű fonetikus megfelelőikből.

Böngészőintegráció[szerkesztés | forrásszöveg szerkesztése]

Több, a Google Fordítóhoz kapcsolódó Firefox-kiegészítő létezik, melyek jobb egérkattintással elérhetővé teszik a fordítási szolgáltatást. [4]

A Google Chrome böngészőhöz is létezett ilyen célú bővítmény;[5] 2010 februárjában integrálták a böngészőbe.[6][7]

Android-verzió[szerkesztés | forrásszöveg szerkesztése]

A Google Fordító ingyenesen letölthető alkalmazásként hozzáférhető az Android okostelefon-operációsrendszerhez. Az első verzió 2010 januárjában jelent meg, az még a böngészőben futó változattal megegyezően működött. A mobilos változat sajátosságai közé tartozik az SMS-fordítás és a fordítások előzményeinek tárolása. Egy fejlettebb verziót jelentettek meg 2011. január 12-én.[8] Ebben alfaverziójú képességként jelen van a „Conversation Mode”, azaz beszélgetés-üzemmód támogatása az angol-spanyol nyelvpáros között, lehetővé téve egy közelben lévő, más anyanyelvű beszélővel a folyékony kommunikációt. Az alkalmazás 53 nyelvet támogat, a beszédbevitel 15 nyelv esetén működik. Az Android Marketről telepíthető, az Android 2.1-es és afölötti verziókra.

iPhone-verzió[szerkesztés | forrásszöveg szerkesztése]

A Google 2008 augusztusában mutatta be az iPhone-hoz készült Google Translate HTML5-ös webalkalmazást. A hivatalos iPhone appot 2011. február 8-án tették elérhetővé. Beszédinputként 15 nyelvet fogad el, több mint 50 nyelvre képes fordítani. A fordításokat 23 nyelven ki is képes mondani.[9]

Támogatott nyelvek és szolgáltatások[szerkesztés | forrásszöveg szerkesztése]

Alább olvasható a támogatott nyelvek és funkciók listája a szolgáltatás különböző szakaszaiban.

Induláskor[szerkesztés | forrásszöveg szerkesztése]

2. szakasz[szerkesztés | forrásszöveg szerkesztése]

3. szakasz[szerkesztés | forrásszöveg szerkesztése]

  • Angol-olasz
  • Olasz-angol

4. szakasz[szerkesztés | forrásszöveg szerkesztése]

  • Angol-kínai (egyszerűsített)
  • Angol-japán
  • Angol-koreai
  • Kínai (egyszerűsített)-angol
  • Japán-angol
  • Koreai-angol

5. szakasz (indult 2006. április)[szerkesztés | forrásszöveg szerkesztése]

  • Angol-arab
  • Arab-angol

6. szakasz (indult: 2006. december)[szerkesztés | forrásszöveg szerkesztése]

  • Angol-orosz
  • Orosz-angol

7. szakasz (indult 2007. február)[szerkesztés | forrásszöveg szerkesztése]

  • Angol-kínai (hagyományos)
  • Kínai (hagyományos)-angol
  • Kínai (egyszerűsített hagyományos)
  • Kínai (hagyományos egyszerűsített)

8. szakasz (indult: 2007. október)[szerkesztés | forrásszöveg szerkesztése]

  • Mind a 25 nyelvpárt használja a Google gépi fordítási rendszere

9. szakasz[szerkesztés | forrásszöveg szerkesztése]

  • Angol-hindi
  • Hindi-angol

10. szakasz (indult: 2008. május)[szerkesztés | forrásszöveg szerkesztése]

Ettől a szakasztól kezdve a fordítás bármely lehetséges nyelvpáros között működik. Ha szükséges, az angol nyelvet közbeiktatja a fordításnál.

11. szakasz (indult: 2008. szeptember 25.)[szerkesztés | forrásszöveg szerkesztése]

12. szakasz (indult: 2009. január 30.)[szerkesztés | forrásszöveg szerkesztése]

13. szakasz (indult: 2009. június 19.)[szerkesztés | forrásszöveg szerkesztése]

14. szakasz (indult: 2009. augusztus 24.)[szerkesztés | forrásszöveg szerkesztése]

15. szakasz (indult: 2009. november 19.)[szerkesztés | forrásszöveg szerkesztése]

A Google Translate már nem béta, stabil verzió lett. A felhasználók választhatják a nem latin betűs nyelvek közül a kínai, japán, koreai, orosz, ukrán, belarusz, bolgár, görög, hindi és thai esetében, hogy latinizálva jelenjen meg a szöveg. Az arab, perzsa és hindi nyelvek esetében arra is képes a rendszer, hogy a felhasználó latin betűkkel beírt transzliterált szövegét átfordítsa a nyelvhez tartozó saját írásrendszerre. Egyes nyelvekhez szövegfelolvasó (text-to-speech) szolgáltatást is indítottak, ezek az angol, olasz, francia és német nyelvek.

16. szakasz (indult: 2010. január 30.)[szerkesztés | forrásszöveg szerkesztése]

17. szakasz (indult: 2010. április)[szerkesztés | forrásszöveg szerkesztése]

  • A szövegfelolvasás működik hindi és spanyol nyelven is.

18. szakasz (indult: 2010. május 5.)[szerkesztés | forrásszöveg szerkesztése]

  • A szövegfelolvasás működik afrikánsz, albán, katalán, kínai (mandarin), horvát, cseh, dán, holland, finn, görög, magyar, izlandi, indonéz, lett, macedón, norvég, lengyel, portugál, román, orosz, szerb, szlovák, szuahéli, török, vietnami és walesi nyelveken (a felolvasás az eSpeakre épül).[10]

19. szakasz (indult: 2010. május 13.[11])[szerkesztés | forrásszöveg szerkesztése]

20. szakasz (indult: 2010. június)[szerkesztés | forrásszöveg szerkesztése]

Latinizáció az arab nyelvhez is.

21. szakasz (indult: 2010. szeptember)[szerkesztés | forrásszöveg szerkesztése]

Fonetikus szövegbevitel az arab, görög, hindi, perzsa, orosz, szerb és urdu nyelvekhez.

22. szakasz (indult: 2010. december)[szerkesztés | forrásszöveg szerkesztése]

  • Az arab nyelv latinizációját eltávolították.
  • Helyesírás-ellenőrzés bevezetése.
  • Lecserélték húsz nyelv esetében a szövegfelolvasó szolgáltatást az eSpeak technológiájáról a SVOX-éra[13] (kínai, cseh, dán, holland, finn, görög, magyar, norvég, lengyel, portugál, orosz, svéd, török és még néhány). A latin nyelv ugyanazt a beszédszintetizátort használja, mint az olasz.
  • Elindul a szövegolvasó szolgáltatás az arab, japán és koreai nyelvekhez.

23. szakasz (indult: 2011. január)[szerkesztés | forrásszöveg szerkesztése]

Választani lehet egy szó különböző fordításai között.

24. szakasz (indult: 2011. június)[szerkesztés | forrásszöveg szerkesztése]

5 új indiai nyelv (alfaverzió), és egy új transzliterációs beviteli módszer hozzájuk[14]:

Fordítási módszer[szerkesztés | forrásszöveg szerkesztése]

A Google Translate a fordítás során nem a hagyományos, nyelvtani szabály-alapú analízist alkalmazza, algoritmusai a szöveg statisztikai elemzésén alapulnak. A rendszer eredeti kifejlesztője, Franz Josef Och már korábban kritizálta a szabály-alapú megközelítést, az empirikus módszert javasolva.[15] A Google Fordító a statisztikai gépi fordítás elvén működik, konkrétabban a 2003-as, gyors gépi fordítási DARPA versenyt megnyerő Och által kifejlesztett módszeren. Jelenleg Och a Google gépi fordítási csoportjának vezetője.[16]

Och szerint egy új nyelvpárhoz használható statisztikai gépi fordítási rendszer előállításához több mint egymillió szóból álló kétnyelvű szövegkorpusz (vagy párhuzamos szöveg) szükséges, továbbá több mint egymilliárd szónyi egynyelvű szöveg.[15] Ezután a szövegből kinyert statisztikai modellek már használhatók a két nyelv közötti fordításhoz.

A hatalmas nyelvi adatmennyiség begyűjtésére a Google ENSZ-dokumentumokat használt.[17] Az ENSZ dokumentumait általában az ENSZ mind a hat hivatalos nyelvén publikálják, így meglehetősen nagy hatnyelvű korpuszt hozva létre.

A Google képviselői szerepet vállaltak japán nyelvi konferenciákon, ahol a kutatóktól kétnyelvű adatokra tettek szert.[18]

Fordítási hibák és furcsaságok[szerkesztés | forrásszöveg szerkesztése]

A Google Fordítóban alkalmazott statisztikai módszertan miatt a lefordított szöveg gyakran értelmetlenségeket, az emberi szem számára azonnal nyilvánvaló hibákat tartalmaz,[19] gyakran felcserélődnek hasonló, de nem azonos jelentésű kifejezések,[20] vagy a teljes mondat jelentése az ellenkezőjére fordul.[21]

Példa a fordítás minőségére[szerkesztés | forrásszöveg szerkesztése]

Az itt található szövegrészlet az angol szócikk 2009. február 4-i változatának első bekezdésének fordítása:

Eredeti szöveg:

Google Translate is as of January 2009 [update] a beta service provided by Google Inc. to translate a section of text, or a webpage, into another language, with limits to the number of paragraphs, or range of technical terms, translated. For some languages, users are asked for alternate translations such as for technical terms, to be included for future updates to the translation process.

2009. február 4-i fordítás:

Google Translate a januári 2009 [update] a béta szolgáltatást a Google Inc. lefordítani egy része a szöveg, vagy egy weboldal, egy másik nyelvet, amely korlátozza, hogy hány pont, vagy különböző technikai értelemben fordították. Az egyes nyelvek felhasználók a felkért póttagjának fordítások, mint például a technikai feltételek, fel kell venni a jövőbeli frissítések a fordítási folyamatot.

2011. február 12-i fordítás:

A Google Translate az 2009 januárjában [update] a béta szolgáltatást a Google Inc. lefordítani egy része a szöveg, vagy egy weboldal, egy másik nyelvre, és korlátozza a száma, bekezdések, vagy azoknak a technikai feltételek, le van fordítva. Egyes nyelvek, a felhasználók kértek alternatív fordítások, mint például a technikai feltételeket, fel kell venni a jövőbeli frissítések a fordítási folyamat.

Jegyzetek[szerkesztés | forrásszöveg szerkesztése]

  1. Google Translate Drops Systran For Home Brewed Translation 23/12/2007 , Barry Schwartz , searchengineland.com
  2. Google Translate. Google. (Hozzáférés: 2009. január 24.)
  3. ^ a b Comparison of online machine translation tools 6/2010 , Ethan Shen , www.tcworld.info
  4. Search Add-ons :: Add-ons for Firefox. Mozilla. (Hozzáférés: 2009. augusztus 7.)
  5. Google Translate by chrome.translate.extension chrome.google.com
  6. Google Translate Integrated In Google Chrome 5
  7. Google Chrome 5 features an integrated Google Translate service 15/2/2010 , stuff.techwhack.com
  8. A new look for Google Translate for Android, Awaneesh Verma, Google Translate blog, January 12, 2011
  9. Introducing the Google Translate app for iPhone, Wenzhang Zhu, Google Translate blog, February 8, 2011
  10. http://googleblog.blogspot.com/2010/05/giving-voice-to-more-languages-on.html
  11. http://googletranslate.blogspot.com/2010/05/five-more-languages-on.html
  12. http://googleblog.blogspot.com/2010/09/veni-vidi-verba-verti.html
  13. http://www.svox.com/News-Items-Google-picks-SVOX-for-Translate-and-Dictionary-services-.aspx
  14. Google Translate Blog: Google Translate welcomes you to the Indic web
  15. ^ a b Och, Franz Josef (2005-09-12), "Statistical Machine Translation: Foundations and Recent Advances", The Tenth Machine Translation Summit, Phuket, Thailand
  16. Franz Josef Och. Google. (Hozzáférés: 2010. december 19.) „"Franz Josef Och joined Google in 2004 as a research scientist, where he leads the machine translation group."”
  17. Google seeks world of instant translations (Reuters)
  18. A Google az évente tartott „Számítógépi Nyelvészet Japánban”-konferencia („Gengoshorigakkai”) hivatalos szponzora volt 2007-ben. A Google elküldte delegáltjait a Japán Számítógépes Nyelvészeti Társaság 2005. márciusi találkozójára is, pénzbeli támogatást ígérve a kutatóknak, akik hajlandók korpuszaik megosztására.
  19. Google Translate Tangles With Computer Learning Lee Gomes , Forbes Magazine , 9/8/2010
  20. Google Translates Ivan the Terrible as “Abraham Lincoln” google.blognewschannel.com
  21. Google Lost in Translation 28/01/2010 , Alyona Topolyanskaya , www.mn.ru

Külső hivatkozások[szerkesztés | forrásszöveg szerkesztése]