Lucene

Da Wikipedia, l'enciclopedia libera.
Lucene
Logo
Sviluppatore Apache Software Foundation
Ultima versione 4.1 (22 gennaio 2013)
Sistema operativo Multipiattaforma
Linguaggio Java
Genere Application programming interface (non in lista)
Licenza Apache License 2.0
(Licenza libera)
Sito web lucene.apache.org

Lucene è una API gratuita ed open source per il reperimento di informazioni inizialmente implementata in Java da Doug Cutting. È supportata dall'Apache Software Foundation ed è resa disponibile con l'Apache License. Lucene è stata successivamente reimplementata in Perl, C#, C++, Python, Ruby e PHP.

Sebbene concepita per realizzare applicazioni che necessitano di funzionalità di indicizzazione e ricerca full text, Lucene è molto nota ed usata per la realizzazione di motori di ricerca sia sul World wide web che sulle intranet private. Questo ha portato all'affermazione di una percezione del prodotto come di un motore di ricerca dotato di web spider e parser HTML. In realtà, l'utilizzo di Lucene richiede che tali moduli siano forniti esternamente.

I dati gestiti da Lucene sono rappresentati come documenti (document) dotati di campi (fields) testuali. Questa genericità consente di realizzare, con le API di Lucene, prodotti indipendenti dal formato dei file: possono essere indicizzati con Lucene testi in PDF, HTML, Microsoft Word così come ogni in altro tipo di file dal quale sia possibile estrarre informazioni.

Software che utilizzano Lucene[modifica | modifica sorgente]

  • Wikipedia usa Lucene per le ricerche full-text.
  • Beagle usa come indicizzatore una versione di Lucene riscritta in linguaggio C# chiamata Lucene.Net.
  • Docco (homepage) usa Lucene per il desktop search.
  • DSpace (homepage) usa Lucene.
  • CNET usa Lucene per le ricerche nelle sue categorie di prodotti.
  • LjFind usa Lucene per le ricerche su 110 000 000 post LiveJournal.
  • Nutch è un motore di ricerca completo che usa Lucene.
  • Red-Piranha è un altro motore di ricerca basato su Lucene. È pronto all'uso, utilizzabile tramite interfaccia grafica, riga di comando o web application Tomcat, e può "imparare" le richieste dell'utente.
  • The Flock web browser uses Clucene, a C++ version, to do a full text search of browser history.
  • KnowledgeBase - A service focused CRM platform which uses the Lucene search engine
  • Zimbra groupware incorporates Lucene.
  • ANts P2P is using Lucene for the search option, within this anonymous file sharing program.
  • Solr is a Lucene based open-source search server with XML/HTTP and JSON APIs, caching, replication, faceted search, highlighting, and a web admin interface.
  • MMBase has an expansion that uses Lucene for indexing its data.
  • Alfresco, an open source Entrerprise Content Management system
  • Strigi [1] uses CLucene, a C++ version, to index and search the desktop.
  • SubEthaMail A sophisticated mailing list manager. Used for searching the mailing list archives.
  • Midgard uses Lucene for its indexing and full-text search
  • La Repubblica utilizza Lucene (tramite Solr) per le ricerche full-text e il faceted/browsing nel servizio annunci [2]
  • Digitelematica utilizza Lucene per le ricerche full-text
  • Netspin Search Appliance utilizza Regain, un progetto basato su Lucene.
  • IFile (Project) framework user-friendly scritto in PHP 5, si basa sulla piattaforma “Zend Framework“ utilizzandone le librerie di Zend_Search_Lucene
  • LogicalDOC è un software per la gestione dei documenti open source; utilizza Lucene per la indicizzazione dei documenti e la ricerca full-text in lingua.

Una lista più esaustiva di software che usano Lucene è presente nella pagina PoweredBy della wiki di Lucene.

Implementazioni[modifica | modifica sorgente]

Lucene è già stato re-implementato (o è in corso di re-implementazione) anche in:

Voci correlate[modifica | modifica sorgente]

Collegamenti esterni[modifica | modifica sorgente]