Vita:Azonos helyesírású nemzetközi szavak listája a magyar és más nyelvek között

Az oldal más nyelven nem érhető el.
Új téma nyitása
A Wikipédiából, a szabad enciklopédiából
Legutóbb hozzászólt Szipucsu 8 évvel ezelőtt a(z) Automatikus szógyűjtés témában

bocs, de nem értem az értelmét ennek a listának, hiszen ezen szavak többsége a másik nyelvben is idegen eredetű (latin, görög, angol, német, jiddis stb.) na mármost hasonló alakú idegen eredetű szavakból még ennél is több van... a listának akkor lenne értelme ha az egyik nyelv idegen szava ihlette a szavat a másikban (tehát átvétel) nem pedig pl. a francia (?) randevút vette át a magyar és a szlovák is a véletlen folytán ugyanabban a helyesirási alakban... gondolok itt olyan szavakra mint a széna-seno (szlovák) ill. archaizmusokra, melyek lassan kikopnak egyes szomszédos nyelvekből ill. a magyarból Taz vita 2008. október 10., 17:36 (CEST)Válasz

Ha jól látom, ez a nemzetközi szavak listája a magyarból és egy másik nyelvből vett párok szerint. Jó lenne jelölni, hogy itt erről van szó. Továbbá azt is megfontolnám, hogy a lista inkább szavanként legyen, ne nyelvenként, pl. a golf csak egyszer szerepelne az egész listában, de fel lenne sorolva mellette, hogy ez az alábbi tizenöt nyelvben szerepel még ugyanezzel az írásmóddal ugyanebben a jelentésben. Ádám 2008. október 28., 21:10 (CET)Válasz

Szerintem nem jól értitek a lista célját. Itt nem a szavak eredetéről van szó (természetesen Taznak abban igaza van, hogy ezek csak átvett idegen vagy jövevényszavak lehetnek), hanem arról, hogy azonos helyesírású. Amint a kategóriában is látjátok, ez inkább egy nyelvi játékféleség, nem kell halál komolyan venni. Viszont ritka ugyan, de akadhat olyan eset (véletlen egybeesés), amikor még csak etimológiailag sem átvett szóról van szó, hanem teljesen véletlenről. A legjobb példa a spanyol más szó: az ég világon semmi köze a magyar „más”, még csak etimológiailag sem (a spanyol szó a latin MAGIS-ból származik), mégis bizonyos jelentésekben így fordítjuk, pl. nada más (semmi más), nadie más (senki más) stb. – Mex plática 2008. október 28., 21:26 (CET)Válasz

A lista nagy részét kitevő nemzetközi szavaknál nem csoda, hogy egybeesnek: hiszen épp ezért mondjuk őket nemzetközi szavaknak. A többi, ritka kivétel (mint a spanyol más) viszont annál inkább érdekes, de ezek szerintem a hamis barát témakörébe tartoznak, ott kéne mindezekről megemlékezni (ilyen egyébként a kínai és a magyar esete is, ami még eszembe jut, bár ott az írásmód nyilván egész más). Én tehát különválasztanám a lista 95%-át kitevő nemzetközi szavakat a hamis barátoktól, mert mind a kettő más miatt és más módon érdekes. Mint írtam fentebb, inkább maguk a szavak szerint rendezném a listát, nem pedig nyelvek szerint, mert így irgalmatlanul nagy lesz az átfedés (mint a golf tizenvalahány előfordulásán már most is látható). Ez nem volna járható út?

Van, ahol egyébként pont az az érdekes, hogy valamit a nemzetközi gyakorlattól eltérően írnak, pl. Írországban a taxit állítólag így: TACSI. :-) Ádám 2008. október 28., 22:50 (CET)Válasz

Én jó ötletnek tartom a szavankénti rendezést (logikusabb is), de akkor ezt valaki vállalja be :) – Mex plática 2008. október 29., 11:33 (CET)Válasz

Automatikus szógyűjtés[szerkesztés]

Én nem értek a botok témaköréhez, vagy hogy hogy kellene olyat csinálni, de az biztos, hogy egy bot gyorsan és hatékonyan összegyűjtené azokat a szavakat amelyekhez már tartozik szó a Wikipédián és azonosak más nyelvekben is. Ehhez csak szimplán össze kell hasonlítani a két szót (és még csak be se kell tölteni másik oldalt, mert az interwiki linkekből kinyerhető), és ha egyezik akkor jöhet a listába. Ami talán nehézség, hogy nyilván a tulajdonneveket ki akarjuk ebből hagyni, mert az szinte minden nyelven azonos. De ezeket kézzel kitörölni is sokkal egyszerűbb, mint minden létező szót minden nyelvből egyenként végignézni és beírni. Szóval ha valaki tudna ilyen botot csinálni az nagy haladás lenne ebben a cikkben. Előre is köszi! – Kun vita 2008. december 4., 16:50 (CET)Válasz

Az ötlet jó, a probléma az, hogy a robot nem mesterséges intelligencia, így honnan tudná azt megállapítani, hogy a másik szó egyáltalán eltérő nyelven van. Arról nem beszélve, hogy más nyelvű wikipédiákban is lehetnek (és vannak is) szavak nem azon a nyelven, ami méginkább bonyolítja a dolgot. Ez pont egy olyan eset, amikor az emberi észre és a nyelvtudásra szükség van, ezt pedig robottal nem lehet pótolni. – Mex plática 2008. december 4., 20:32 (CET)Válasz
  • Gyanítom vagy én nem értelek téged, vagy te engem. A következőre gondolok én, egy példán keresztül:

1. Választunk egy szót pl hogy Film, és rámegyünk a wikin a Film nevű cikkre. 2. A Film nevű cikk interwikijeit végignézve azt fogjuk látni, hogy egy csomó nyelven a filmet szintén filmnek hívják 3. ezeket a nyelveket összeszedjük és berakjuk az így kapott listát ebbe a cikkbe.

Namost ezt nem csak a 'Film're kell lefuttatni, hanem minden létező wiki cikkre. Ekkor megkapjuk azon cikkek listáját amelyekhez tartozó más nyelvű cikknek betűre pontosen ugyanaz a címe. Ebből ha (kézzel) kiszűrjük a tulajdonneveket, akkor gyakorlatilag azokat a szavakat kapjuk amelyek több nyelvben is azonosak. Szerintem ebben semmi mesterséges intelligencia és nyelvészkedés nem szükséges. De kézzel felülbírálni még akkor is könnyebb a kigyűjtötteket, mint 0-ról kézzel összeválogatni és beírogatni.

Ráadásul ez az algoritmus betehető lenne egy interwikiket gyűjtögető/belinkelő bot-ba, mert azok úgyis pont ezeket nézik végig, tehát még olyan túl sok extra terhet sem jelentene.– Kun vita 2008. december 5., 13:22 (CET)Válasz

Így már értem mire gondolsz, de ebben az esetben is előkerül néhány probléma: a legtöbb szó, ami az ilyen listákon szerepel, általában olyan triviális dolog, amiről nem szoktunk lexikoncikket írni (mint pl. cédula). Így ha megvalósítható is az ötlet, csak nagyon minimális szót lehetne így hozzáadni a listához. A másik, ha már éppen a filmet hoztad fel példának, lehetségez az, hogy adott nyelven idegen szó, és alapvetően másik szót használnak ugyanarra, s az idegen szóról csak átirányítás van: ilyenkor viszont a robot szintén hamis eredményeket generálna. Spanyolul pl. létezik a film szó, igenám, de csak mint az angolból átvett idegen szó, amit nem is tudnak olyan könnyen kiejteni, viszont a valódi mindennapos szavuk rá a película. Ilyenekkel is számolni kell ám. Üdv, – Mex plática 2008. december 5., 13:44 (CET)Válasz
  • Ez utóbbiban igazad van. Abban viszont nem értek egyet, hogy csak minimális szót lehet ehhez a listához hozzáadni, véleményem szerint legalább 100-as nagyságrendben lennének ilyen szavak. Ha csak annyit megcsinálnánk, hogy ami már ki van gyűjtve most szó, azokat kikeresnénk így az interwikivel, máris lehetne bővíteni a listát, hogy mely nyelvekben szerepel. Az átirányítást szerintem a bot tudja figyelni ha jól van megcsinálva, bár én sajna nem értek hozzá. – Kun vita 2008. december 5., 14:02 (CET)Válasz
  • Netes szótárakhoz lehetne írni egy szkriptet, amivel kilistázná a szótárban lévő olyan szavakat, melyek a két nyelvben azonosak. Pl. a www.dict.cc szótár elég sok nyelv között működik, erre (is) érdemes lenne szkriptet írni. Ehhez a szótárt üzemeltető weboldalak tulajdonosait kellene felkeresni, ők megcsináltathatnák a szkriptet az informatikusokkal, ami persze némi pénzbe is kerülhet. --Szipucsu vita 2015. december 27., 00:48 (CET)Válasz

A német nyelv is számít, a főnevek nagy kezdőbetűiben az eltérés miatt?[szerkesztés]

A "menü" szó mellett szerepel a német nyelv (németül Menü), de pl. a rekord, hotel szónál nem. Ez abból a megfontolásból van, hogy a nagy kezdőbetűs helyesírás miatt végül is nem egyezik meg a két szó írásképe, vagy csak még nem ismerték fel, hogy más szavak is azonosak a németben és a magyarban? --Szipucsu vita 2015. december 27., 00:36 (CET)Válasz