Apache Lucene

	Lucene
Fejlesztő	Apache Software Foundation
Legfrissebb stabil kiadás	9.10.0 (stabil verzió, 2024. február 20.)
Programozási nyelv	Java
Operációs rendszer	multi-platform
Platform	Java virtuális gép
Állapot	Aktív
Kategória	keresés és index
Licenc	Apache Licenc 2.0
	A Lucene weboldala

Az Apache Lucene egy szabad/nyílt forráskódú információ lekérő szoftver könyvtár, amelyet eredetileg Doug Cutting készített java nyelven. Támogatást az Apache Software Foundation nyújt hozzá Apache Licenc alatt.

Lucene-t más programozási nyelvekre is portolták, többek közt a következőkre: Delphi, Perl, C#, C++, Python, Ruby és PHP.^[2]

Története[szerkesztés]

A Lucene-t eredetileg Doug Cutting írta 1999-ben,^[3] és a SourceForge webhelyéről volt letölthető. Később csatlakozott az Apache Software Foundation nyílt forráskódú Jakarta termékcsaládjához 2001 szeptemberében és 2005 februárjában vált az Apache felső szintű projektévé. Egészen mostanáig számos alprojektje jött létre: Lucene Java, Droids, Lucene.Net, Lucy, Mahout, Solr, Nutch, Open Relevance Project, PyLucene és Tika. A Solr-t összefésülték magával a Lucene projekttel, továbbá a Mahoutot, a Nutchot és a Tikát kiemelték független felső szintű projektekbe.

Funkciók és általános felhasználás[szerkesztés]

Habár illeszthető bármely alkalmazáshoz - mely teljes szöveg indexelési és keresési képességeket igényel -, Lucene széles körben ismert^[4]^[5] az Internetes- és lokális keresőmotorok, valamint webhely keresések implementációit segítő eszközeiről.

A Lucene logikai architektúrájának magját az az elgondolás alkotja, hogy egy dokumentum kizárólag szövegmezőkből áll. Ez a rugalmasság biztosítja, hogy a Lucene API független legyen a fájlformátumtól. A szöveg jöhet a PDFekből, HTMLből, Microsoft Word-, és OpenDocument dokumentumokból, és még sok másból is (kivéve a képek). Mindezek indexelhetők mindaddig, amíg a szöveges információ kinyerhető az adott formátumból.

Lucene alapú projektek[szerkesztés]

A Lucene maga csak egy indexelő és kereső könyvtár és nem tartalmaz crawling és HTML elemzési funkcionalitást. Számos projekt létezik, amely kiterjeszti a Lucene képességeit:

Apache Nutch - biztosít web crawling-ot és HTML elemzést
Apache Solr – egy vállalati kereső szerver
ElasticSearch – egy vállalati kereső szerver
Compass – egy Java keresőmotor keretrendszer

Felhasználók[szerkesztés]

Azon cégek listáját, melyek használják a Lucene-t, lásd a Lucene 'Power By' oldalát.^[6] Többek közt a Twitter is használja a Lucene-t a valós idejű keresésekhez.^[7]

Kapcsolódó szócikkek[szerkesztés]

Jegyzetek[szerkesztés]

↑ Release 9.10.0, 2024. február 20. (Hozzáférés: 2024. március 19.)
↑ Lucene implementációk
↑ Better Search with Apache Lucene and Solr, 2007. november 19. [2012. január 31-i dátummal az eredetiből archiválva]. (Hozzáférés: 2012. április 27.)
↑ Perner, Petra. Machine Learning and Data Mining in Pattern Recognition: 5th International Conference. Springer, 387. o. (2007). ISBN 978-3-540-73498-7
↑ GNU/Linux Semantic Storage System. [2010. június 1-i dátummal az eredetiből archiválva]. (Hozzáférés: 2010. május 15.)
↑ PoweredBy
↑ Twitter uses Lucene

Irodalom[szerkesztés]

Gospodnetic, Otis, Erik Hatcher, Michael McCandless. Lucene in Action, 2nd, Manning Publications, 475. o. (2009. június 28.). ISBN 1-933988-17-7
Gospodnetic, Otis, Erik Hatcher. Lucene in Action, 1st, Manning Publications, 456. o. (2004. december 1.). ISBN 978-1-932394-28-3

Külső hivatkozások[szerkesztés]

List of Lucene Ports (or Implementations) in Other Languages on the Apache wiki
Introductory article with Java code for search (This page is on Internet Archive) on Wikipedia data
Lucene FAQ
Luke (Lucene Index Toolbox)
LuSql High performance JDBC-to-Lucene index builder
ElasticSearch – A Distributed, Highly Available, RESTful Search Engine

Fordítás[szerkesztés]

Ez a szócikk részben vagy egészben a Lucene című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.

Informatikai portál • összefoglaló, színes tartalomajánló lap

[69f7efe59c4c00c5fc19ca5c67be35dadb3ac226-1] Release 9.10.0, 2024. február 20. (Hozzáférés: 2024. március 19.)

[port-2] Lucene implementációk

[3] Better Search with Apache Lucene and Solr, 2007. november 19. [2012. január 31-i dátummal az eredetiből archiválva]. (Hozzáférés: 2012. április 27.)

[4] Perner, Petra. Machine Learning and Data Mining in Pattern Recognition: 5th International Conference. Springer, 387. o. (2007). ISBN 978-3-540-73498-7

[5] GNU/Linux Semantic Storage System. [2010. június 1-i dátummal az eredetiből archiválva]. (Hozzáférés: 2010. május 15.)

[6] PoweredBy

[twitter-7] Twitter uses Lucene

[1]

[2]

[3]

[4]

[5]

[6]

[7]

Sablon:Apache m v sz Apache Software Foundation
Felső szintű projektek	Abdera · Accumulo · ActiveMQ · Ambari · Ant · Aries · Apache HTTP Server · APR · Avro · Axis · Axis2 · Bloodhound · Buildr · Camel · Cassandra · Cayenne · Chemistry · Click · CloudStack · Cocoon · Continuum · Cordova · CouchDB · cTAKES · CXF · Deltacloud · Derby · Directory · Empire-db · Felix · Flex · Forrest · Geronimo · Gora · Gump · Hadoop · Hama · HBase · Hive · HBase · Isis · Jackrabbit · James · JMeter · Karaf · Lenya · Mahout · Marmotta · Maven · MINA · mod_perl · MyFaces · ODE · OFBiz · OpenEJB · OpenJPA · OpenNLP · OpenOffice · PDFBox · Phoenix · POI · Pivot · Qpid · River · Roller · Samza · ServiceMix · Shindig · Shiro · Sling · Spark · Stanbol · Storm · SpamAssassin · Struts · Subversion · Sqoop · Tapestry · Tcl · Thrift · Tiles · Tomcat · Trafficserver · Turbine · Tuscany · UIMA · Velocity · Wave · Wicket · Wink · Xalan · Xerces · XMLBeans
Commons projektek	BCEL · BSF · Daemon · Jelly
Lucene projektek	Lucene Java · Lucene.Net · Nutch · Solr
Hadoop projektek	HDFS · HBase · Hive · Pig · Spark · ZooKeeper
Egyéb projektek	Chainsaw · Batik · FOP · Log4j · XAP · Log4Net · Ivy
Incubator projektek	ACE · Composer · JSPWiki · XAP
Nyugdíjazott projektek	AxKit · Beehive · Bluesky · Cactus · Excalibur · Jakarta · Harmony · HiveMind · Slide · Shale · stdcxx · iBATIS · Jakarta
Licenc sztenderdek	Apache Licenc
Apache weboldala · Kategória · Commons