Szerkesztővita:Karmela/Javaslat a keresés jobbítására

Az oldal más nyelven nem érhető el.
Új téma nyitása
A Wikipédiából, a szabad enciklopédiából
Legutóbb hozzászólt Tgr 17 évvel ezelőtt a(z) ötlettörredék témában

Köszönettel várom kiegészítéseidet.[szerkesztés]

--Karmela 2006. december 11., 12:06 (CET)Válasz

A kocsmafali kérdésedre: igen, a MySQL és a pgSQL tud regexpek alapján keresni. Viszont az ilyen keresés lassú. Egy normális keresés úgy működik, hogy egy indexet készítenek, amiben felsorolnak minden egyes szót, ami címben (vagy szövegben, attól függően, hol akarunk keresni) előfordul, és minden szóhoz felsorolják, hogy mely cikkek címében/szövegében szerepel. Ez jó közelítéssel konstans idejű művelet. A regexp keresés ezzel szemben a legjobb esetben is lineáris a keresendő szöveg hosszában (és itt ugye milliós nagyságrendről van szó). Nem hiszem, hogy ez működőképes lenne, amikor még a sima keresés is viszonylag lassú.

Ami működőképes lenne, az az indexelési időben történő javítás (pl. az "ora" szóhoz felvesszük az "óra" cikket is, csak kisebb súllyal), az viszont csak akkor működik, ha egy szóhoz csak viszonylag kevés alakváltozatot társítasz. Ékezettelenítés talán még belefér, de a tetszőleges elütések elkapáa biztosan nem.

Az ismert elírásoknál pedig a legegyszerűbb redirektet létrehozni a hibás alakról a helyesre.

--Tgr 2006. december 12., 10:36 (CET)Válasz

A redirekt nemigen látszik népszerűnek...
A többi témát lásd lejjebb.--Karmela 2006. december 12., 13:53 (CET)Válasz

Alapvetően nem értek valamit. A wiki szoftvert, ha jól gondolom nem mi írjuk. És nem is nagyon tudjuk írni. Ez egy elég komoly változtatás, ami nem csak a magyar, hanem az egyéb wikiket is érintené. (Gondolom közös motorral járnak.) Tehát nem világos számomra, hogy mi is ennek a dolognak a célja. Talán az, hogy ez alapján javaslatot teszünk a fejlesztőkenk, hogy így kéne csinálni?

Én is azt gondolom, hogy egyelőre nem elég jók a hardverek egy ilyen típusú keresés végrehajtására annyi idő alatt, amennyit egy átlagfelhasználó tolerál. Szerintem az észszerű redirektek sokkal hatékonyabbak, mint ez a megoldási irány. De ha rosszul látok valamit, akkor szívesen gondolkozom a kérdésen. Péter 2006. december 12., 12:07 (CET)Válasz

Én is attól félek, nehezen megoldható, de nekem az tetszik legjobban, amit a Google csinál, tehát ha elütök 1 betűt, akkor rákérdez, hogy „arra gondoltál, hogy…?” – Alensha üzi 2006. december 12., 14:50 (CET)Válasz

Elgondolkodtató problémákat neveztetek meg:

Megváltoztatható-e a wiki szoftverben a keresési algoritmus úgy, hogy tekintetbe vegye a magyar sajátossátokat?[szerkesztés]

Ez volt a feltételezésem, de nem tudom. Remélem.
Talán lesz hozzászólónk, aki tudja? --Karmela 2006. december 12., 13:53 (CET)Válasz

Válaszidő a felhasználó szemszögéből[szerkesztés]

Kis ügyeskedéssel türelmesebbé lehet tenni a felhasználót.
Ha az első, közvetlen keresés nem hoz eredményt, akkor visszaküldhetünk egy választ, ami arról tájékoztatja, hogy a hasonlósági keresés folyik.
Amig a felhasználó a választ olvassa, és a hozzá mellékelt mozgó képecskét nézegeti, addig is telik az idő. --Karmela 2006. december 12., 13:53 (CET)Válasz

A keresés meggyorsításának lehetőségei[szerkesztés]

Ötletek:

  1. Tovább finomítani Tgr ötleteit fennt.
  2. Ha az első betű mássalhangzó, akkor eleve jónak tekinteni. Listák létrehozása az első betű szerint.


Talán kapunk még további ötleteket? --Karmela 2006. december 12., 13:53 (CET)Válasz

Átirányítások[szerkesztés]

Az ésszerű redirectek behatárolása nem könnyű feladat.
Nyomozásaim szerint az eddigi eszmecserék eddig nem vezettek egyetértéshez.
Komoly hátulütője az átirányításoknak, hogy állandó karbantartást igényelnek.
Ezért próbálok meg itt egy másik úton elindulni. --Karmela 2006. december 12., 14:02 (CET)Válasz

Az átirányítás a legegyszerűbb megoldás, egy hátrányáról tudok (eltekintve az ideológiai alapú elítélését, mely elítélést én elítélek :)), ha a keresés helyett valaki a menjre kattint, amikor egy listát szeretne a találatokról valamiért, akkor ha van átírányatás, maga az átírányított oldal jön be. Itt jegyzem meg, bár talán a kocsmafalra való hír lehetne (amíg meg nem jelenik a wikizine-ben), hogy most már egy szócikk adott szakaszára is lehet átírányítani (pl:a [Hermione]-t át lehet irányítani a [Harry Potter szereplők#Hermione] -ra) ezzel is segítve/kikerülve a keresőt...--Dami reci 2006. december 12., 14:41 (CET)Válasz

Kösz, jó tudni, de:
A gond, amit célbavettem, nem a szerkesztőké, hanem a naiv olvasó esete, aki meg szeretne valamit tudni, és bead valamit a Keresésbe:
  • Esetleg nem tudja előre még azt sem, hogy egybe, külön vagy kötőjellel írják-e a keresett szót; lehet, hogy bizonytalan a helyesírása.
  • Elüthet valamit.
  • Esetleg egy olyan billentyűzet elött ül, amelyiken nincs meg minden magyar ékezet.
A jelenlegi helyzet: „Magára vessen, aki nem ír tökéletesen”.
Ez azokat riasztja vissza, akiknek a leginkább lenne szükségük a tájékoztatásra.--Karmela 2006. december 12., 16:04 (CET)Válasz


A karbantartási igénynél a dupla átírányításokra gondolsz?--Dami reci 2006. december 12., 14:47 (CET)Válasz
Nem csak arra.
Állandó ellenőrzést kívánnának:
  • Ha van egy új átirányítás, akkor ellenőrizni kellene, megfelel-e az aktuális irányelveknek?
  • Ha van egy új szócikk, ellenőrizni kellene, elkészült-e minden szükséges átirányítás hozzá?
Ha csak az ékezetes betűk gondját veszem: babramunka. Ezt lehetne ugyan automatizálni, de akkor meg iszonyatos mennyiségű átirányítás keletkezne.--Karmela 2006. december 12., 16:04 (CET)Válasz

ötlettörredék[szerkesztés]

Ez nem tudom mennyire valósítható meg, de talán javascripttel, vagy felhasználó-oldali trükközéseel (Greasemonkey, plugin, böngészőváltás :) valahogy integrálhatnánk egy szabad helyesírási szótárat. Gondolok itt a Firefox 2-höz letölthető Aspell-re, ami nem biztos, hogy javítja az inputboxok(kereső) beírt szövegét, csak a nagyobb beviteli mezőkét (textarea), de ennek utána kéne nézni. Szerintem ha egy ilyen helyesírás ellenőrzőt ráveszünk, hogy mnűködjön a keresés oldalon, akkor esetleg a "szabad" lexikon jegyében noszogathatjuk a felhasználót a "szabad" helyesírással tudó "szabad" böngésző (FF2) felé... --Dami reci 2006. december 12., 14:46 (CET)Válasz

Érdekes ötletnek tartom.
Nem gondoltam erre, mert ez nem egy olyan sarka az informatikának, ahol otthonos lennék, a reguláris kifejezésekkel viszont szívesen elbabrálok.
Remélhetőleg jelentkeznek majd itt olyanok, akik a helyesírási szótárak integrálásához értenek. --Karmela 2006. december 12., 16:20 (CET)Válasz
Ehhez adalék, hogy a Firefox jobb felső sarki keresője nekem úgy tűnik, mintha a Wikipédia esetében már magától javasolná a keresendő szavakat pár betű és egy kis türelem bírása uán.
Másrészt, az Aspell akkor lenne igazán jó, ha a szótára az összes Wikipédia szócikk címéből állna, és abból javasolna, de valószínűleg egy ekkora szótár (45000+ szó) már lassabban töltődne be, mint amennyi idő kijavítani az elírást.
Egyébként a hibás kifejezéseknél felajánl egy Google keresést, ahol, ha van megfelelő "erre gondolt?" tulajdonság. Megfontolandó lenne a kiírt szöveg átfogalmazása (javaslatok?), hogy segítőkészebb legyen (beleértve, a változtatást, hogy csak a Wikipédián belüli keresésre legyen link, bár ez nem a legsegítőkészebb megoldás...), és ne tántorítsa el a keresőket az első kudarc után.
Üdv--Dami reci 2006. december 12., 16:15 (CET)Válasz
A Google nagyon jó, csak sajnos éppen a magyaros gondoknál nem az igazi.
Kipróbáltam a Google „ hu.wikipedia.org”-belüli keresését, mit szól ahhoz,
ha Kiskőrös helyett Kiskörös-t adok be. Néma csönd.
Persze ez dícséret is a magyar wikiseknek :-)) , hiszen azt jelenti, hogy a szó minden előfordulása helyesen van írva
Amit viszont érdekesnek találok, hogy a Petőfi-Petöfi elírást jól megoldja.
Valószínűleg tanulékony a gugli. --Karmela 2006. december 12., 17:12 (CET)Válasz

Régen a gugli alapértelmezésben egyáltalán nem különböztette meg az azonos alapú ékezetes betűket. Újabban úgy látszik igen, de elég következetlenül (pl. e' és é nincs megkülönböztetve, ö és ő igen). --Tgr 2006. december 14., 19:06 (CET)Válasz

Hm, mindenesetre ha ékezetek nélkül keresel, az működik: google:kiskoros. --Tgr 2006. december 14., 22:23 (CET)Válasz

apró ötlet 2[szerkesztés]

Másik dolog, ami talán segíthet az angol wikin látható: keresésnél fent a keresett szó mellett megjelenik egy [inde] felirat, ami behozza az adott szóval kezdődő cikkeket. Ez félig megoldás lenne a szóvégi regexre, de a felső sarok nem biztos, hogy a legjobb hely neki. Másrészt ha nincs találat, most is felajánlja az adott szóval kezdődő szócikkeket, csak mint említettem nem biztos, hogy a képi és szövegi kinézet olyan, hogy csábítja az olvasót a linkre kattintásra..--Dami reci 2006. december 12., 19:48 (CET)Válasz