Lucene

Da Wikipedia, l'enciclopedia libera.
Lucene
Logo
Sviluppatore Apache Software Foundation
Ultima versione 4.1 (22 gennaio 2013)
Sistema operativo Multipiattaforma
Linguaggio Java
Genere Application programming interface (non in lista)
Licenza Apache License 2.0
(Licenza libera)
Sito web lucene.apache.org

Lucene è una API gratuita ed open source per il reperimento di informazioni inizialmente implementata in Java da Doug Cutting. È supportata dall'Apache Software Foundation ed è resa disponibile con l'Apache License. Lucene è stata successivamente reimplementata in Perl, C#, C++, Python, Ruby e PHP.

Sebbene concepita per realizzare applicazioni che necessitano di funzionalità di indicizzazione e ricerca full text, Lucene è molto nota ed usata per la realizzazione di motori di ricerca sia sul World Wide Web che sulle Intranet private. Questo ha portato all'affermazione di una percezione del prodotto come di un motore di ricerca dotato di web spider e parser HTML. In realtà l'utilizzo di Lucene richiede che tali moduli siano forniti esternamente.

I dati gestiti da Lucene sono rappresentati come documenti (document) dotati di campi (fields) testuali. Questa genericità consente di realizzare, con le API di Lucene, prodotti indipendenti dal formato dei file: possono essere indicizzati con Lucene testi in PDF, HTML, Microsoft Word così come ogni in altro tipo di file dal quale sia possibile estrarre informazioni.

Lucene è stato re-implementato (o è in corso di re-implementazione) anche in, C, C++, Delphi, C#/.NET, Perl, Ruby, PHP e Common Lisp.

Software che utilizzano Lucene[modifica | modifica wikitesto]

  • Wikipedia usa Lucene per le ricerche full-text.
  • Beagle usa come indicizzatore una versione di Lucene riscritta in linguaggio C# chiamata Lucene.net.
  • DSpace usa Lucene.
  • CNET usa Lucene per le ricerche nelle sue categorie di prodotti.
  • Nutch è un motore di ricerca completo che usa Lucene.
  • Zimbra groupware incorpora Lucene.
  • ANts P2P usa Lucene per l'opzione "cerca".
  • Alfresco, CMS aziendale opensource.
  • La Repubblica utilizza Lucene (tramite Solr) per le ricerche full-text e il faceted/browsing nel servizio annunci.

Una lista più esaustiva di software che usano Lucene è presente nella pagina PoweredBy della wiki di Lucene.


Voci correlate[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]

Controllo di autorità GND: 4800725-0