Lucene
| Lucene |
|
|---|---|
| Sviluppatore | Apache Software Foundation |
| Ultima versione | 2.4.1 (9 marzo 2009) |
| S.O. | Multipiattaforma |
| Linguaggio | Java |
| Genere | Algoritmo di ricerca e indicizzazione |
| Licenza | Apache License 2.0 (Licenza libera) |
| Sito web | lucene.apache.org |
Lucene è una API gratuita ed open source per il reperimento di informazioni inizialmente implementata in Java da Doug Cutting. È supportata dall'Apache Software Foundation ed è resa disponibile con l'Apache License. Lucene è stata successivamente reimplementata in Perl, C#, C++, Python, Ruby e PHP.
Sebbene concepita per realizzare applicazioni che necessitano di funzionalità di indicizzazione e ricerca full text, Lucene è molto nota ed usata per la realizzazione di motori di ricerca sia sul World wide web che sulle intranet private. Questo ha portato all'affermazione di una percezione del prodotto come di un motore di ricerca dotato di web spider e parser HTML. In realtà, l'utilizzo di Lucene richiede che tali moduli siano forniti esternamente.
I dati gestiti da Lucene sono rappresentati come documenti (document) dotati di campi (fields) testuali. Questa genericità consente di realizzare, con le API di Lucene, prodotti indipendenti dal formato dei file: possono essere indicizzati con Lucene testi in PDF, HTML, Microsoft Word così come ogni in altro tipo di file dal quale sia possibile estrarre informazioni.
Indice |
[modifica] Software che utilizzano Lucene
- Wikipedia usa Lucene per le ricerche full-text.
- Beagle usa come indicizzatore una versione di Lucene riscritta in linguaggio C# chiamata Lucene.Net.
- Docco (homepage) usa Lucene per il desktop search.
- DSpace (homepage) usa Lucene.
- CNET usa Lucene per le ricerche nelle sue categorie di prodotti.
- LjFind usa Lucene per le ricerche su 110,000,000 post LiveJournal.
- Nutch è un motore di ricerca completo che usa Lucene.
- Red-Piranha è un altro motore di ricerca basato su Lucene. È pronto all'uso, utilizzabile tramite interfaccia grafica, riga di comando o web application Tomcat, e può "imparare" le richieste dell'utente.
- The Flock web browser uses Clucene, a C++ version, to do a full text search of browser history.
- KnowledgeBase - A service focused CRM platform which uses the Lucene search engine
- Zimbra groupware incorporates Lucene.
- Ants P2P is using Lucene for the search option, within this anonymous file sharing program.
- Solr is a Lucene based open-source search server with XML/HTTP and JSON APIs, caching, replication, faceted search, highlighting, and a web admin interface.
- MMBase has an expansion that uses Lucene for indexing its data.
- Alfresco, an open source Entrerprise Content Management system
- Strigi [1] uses CLucene, a C++ version, to index and search the desktop.
- SubEthaMail A sophisticated mailing list manager. Used for searching the mailing list archives.
- Midgard uses Lucene for its indexing and full-text search
- La Repubblica utilizza Lucene (tramite Solr) per le ricerche full-text e il faceted/browsing nel servizio annunci [2]
- Digitelematica utilizza Lucene per le ricerche full-text
- Netspin Search Appliance utilizza Regain, un progetto basato su Lucene.
A more extensive list of software that uses Lucene is in the PoweredBy page of Lucene's wiki.
- IFile (Project) framework user-friendly scritto in PHP 5, si basa sulla piattaforma “Zend Framework“ utilizzandone le librerie di Zend_Search_Lucene
[modifica] Implementazioni
Lucene è già stato re-implementato (o è in corso di re-implementazione) anche in:
- Lucene4c - C
- CLucene - C++
- MUTIS - Delphi
- Lucene.Net - a straight C#/.NET port of Lucene by the Apache Software Foundation, fully compatible with it.
- Plucene - Perl
- Kinosearch - Perl
- Pylucene - Lucene interfaced with a Python front-end
- Ferret and RubyLucene - Ruby
- Zend Framework (Search) - PHP
- Montezuma - Common Lisp
[modifica] Voci correlate
[modifica] Collegamenti esterni
- Lucene homepage
- Lucene in Action
- Article "Behind the Scenes of the SourceForge.net Search System" by Chris Conrad
- Lucene Wikipedia indexer — introductory article with Java code for search on Wikipedia data
- Simple Lucene Examples