Apache Lucene
| Lucene | |
| Fejlesztő | Apache Software Foundation |
| Legfrissebb stabil kiadás | 10.4.0 (stabil verzió, 2026. február 25.)[1] |
| Programozási nyelv | Java |
| Operációs rendszer | multi-platform |
| Platform | Java virtuális gép |
| Állapot | Aktív |
| Kategória | keresés és index |
| Licenc | Apache Licenc 2.0 |
| Kódtár | https://github.com/apache/lucene |
| A Lucene weboldala | |
Az Apache Lucene egy szabad/nyílt forráskódú információ lekérő szoftver könyvtár, amelyet eredetileg Doug Cutting készített java nyelven. Támogatást az Apache Software Foundation nyújt hozzá Apache Licenc alatt.
Lucene-t más programozási nyelvekre is portolták, többek közt a következőkre: Delphi, Perl, C#, C++, Python, Ruby és PHP.[2]
Története
[szerkesztés | forrásszöveg szerkesztése]A Lucene-t eredetileg Doug Cutting írta 1999-ben,[3] és a SourceForge webhelyéről volt letölthető. Később csatlakozott az Apache Software Foundation nyílt forráskódú Jakarta termékcsaládjához 2001 szeptemberében és 2005 februárjában vált az Apache felső szintű projektjévé. Egészen mostanáig számos alprojektje jött létre: Lucene Java, Droids, Lucene.Net, Lucy, Mahout, Solr, Nutch, Open Relevance Project, PyLucene és Tika. A Solr-t összefésülték magával a Lucene projekttel, továbbá a Mahoutot, a Nutchot és a Tikát kiemelték független felső szintű projektekbe.
Funkciók és általános felhasználás
[szerkesztés | forrásszöveg szerkesztése]Habár illeszthető bármely alkalmazáshoz – mely teljes szöveg indexelési és keresési képességeket igényel -, Lucene széles körben ismert[4][5] az Internetes- és lokális keresőmotorok, valamint webhely keresések implementációit segítő eszközeiről.
A Lucene logikai architektúrájának magját az az elgondolás alkotja, hogy egy dokumentum kizárólag szövegmezőkből áll. Ez a rugalmasság biztosítja, hogy a Lucene API független legyen a fájlformátumtól. A szöveg jöhet a PDFekből, HTMLből, Microsoft Word-, és OpenDocument dokumentumokból, és még sok másból is (kivéve a képek). Mindezek indexelhetők mindaddig, amíg a szöveges információ kinyerhető az adott formátumból.
Lucene alapú projektek
[szerkesztés | forrásszöveg szerkesztése]A Lucene maga csak egy indexelő és kereső könyvtár és nem tartalmaz crawling és HTML elemzési funkcionalitást. Számos projekt létezik, amely kiterjeszti a Lucene képességeit:
- Apache Nutch – biztosít web crawling-ot és HTML elemzést
- Apache Solr – egy vállalati kereső szerver
- ElasticSearch – egy vállalati kereső szerver
- Compass – egy Java keresőmotor keretrendszer
Felhasználók
[szerkesztés | forrásszöveg szerkesztése]Azon cégek listáját, melyek használják a Lucene-t, lásd a Lucene 'Power By' oldalát.[6] Többek közt a Twitter is használja a Lucene-t a valós idejű keresésekhez.[7]
Kapcsolódó szócikkek
[szerkesztés | forrásszöveg szerkesztése]Jegyzetek
[szerkesztés | forrásszöveg szerkesztése]- ↑ "Release 10.4.0". 2026. február 25. Hozzáférés: 2026. április 1..
- ↑ Lucene implementációk
- ↑ "Better Search with Apache Lucene and Solr" (PDF). November 19 2007. 2012-01-31 dátummal az eredeti (PDF) címről archiválva. Hozzáférés: 2012-04-27.
{{cite web}}: Check date values in:|date=(súgó) - ↑ Perner, Petra (2007). Machine Learning and Data Mining in Pattern Recognition: 5th International Conference. Springer. 387. o. ISBN 978-3-540-73498-7.
{{cite book}}: Cite has empty unknown parameter:|coauthors=(súgó) - ↑ "GNU/Linux Semantic Storage System" (PDF). 2010. június 1. dátummal az eredeti (PDF) címről archiválva. Hozzáférés: 2010. május 15..
- ↑ PoweredBy
- ↑ Twitter uses Lucene
Irodalom
[szerkesztés | forrásszöveg szerkesztése]- Gospodnetic, Otis (2009. június 28.). Lucene in Action (2nd ed.). Manning Publications. 475. o. ISBN 1-933988-17-7.
{{cite book}}: Unknown parameter|coauthors=ignored (|author=suggested) (súgó) - Gospodnetic, Otis (2004. december 1.). Lucene in Action (1st ed.). Manning Publications. 456. o. ISBN 978-1-932394-28-3.
{{cite book}}: Unknown parameter|coauthors=ignored (|author=suggested) (súgó)
Külső hivatkozások
[szerkesztés | forrásszöveg szerkesztése]- List of Lucene Ports (or Implementations) in Other Languages on the Apache wiki
- Introductory article with Java code for search (This page is on Internet Archive) on Wikipedia data
- Lucene FAQ
- Luke (Lucene Index Toolbox)
- LuSql High performance JDBC-to-Lucene index builder
- ElasticSearch – A Distributed, Highly Available, RESTful Search Engine
Fordítás
[szerkesztés | forrásszöveg szerkesztése]Ez a szócikk részben vagy egészben a Lucene című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.