Neue Versionen von Lucene 4.0 und Solr 4.0 veröffentlicht

Suchen leichtgemacht: Apache veröffentlicht Lucene 4.0 und Solr 4.0

Die neueste Version der Suchfunktionsbibliothek Lucene und des Suchservers Solr der Lucene als Basis nutzt, wurde kürzlich von der Apache Software Foundation veröffentlicht. Die Version 4․0 von Lucene/Solr bietet eine Vielzahl von neuen Features & Verbesserungen.


Die Lucene-Bibliothek ist in Java geschrieben und verbindet Indizier- und Suchfunktionen mit Rechtschreibkorrektur & Methoden zur Analyse und Tokenisierung von Daten. Mit Solr hingegen lassen sich Volltext-Web-Suchmaschinen aufbauen die ebenfalls Formate wie .doc und.pdf indizieren und durchsuchen können sollen.

Die größten Neuerungen in Solr 4․0 sind die Funktionen aus dem SolrCloud-Projekt. Mit ihnen können unter anderem Indexierungsaufgaben auf mehrere Server verteilt werden (Distributed Indexing). So wird die Geschwindigkeit des Prozesses bei großen Datenmengen merklich erhöht. Solr kann nun innerhalb eines Clusters erkennen welche Server zu- oder abgeschaltet werden und seine Handlungen identisch anpassen. Hierbei hilft Apaches Cluster-Konfigurations-Software ZooKeeper. Um als NoSQL-Speicher dienen zu können, ergänzen Solr nun außerdem Funktionen wie Echtzeit-Get & Atomic Updates. Lucene 4․0 wurde in puncto Speicherverwaltung, Abfragegeschwindigkeit und Indizierungsgenauigkeit verbessert.

Lucene 4․0 und Solr 4․0 können von den jeweiligen Apache-Projektseiten bezogen werden, beide sind unter der Apache-2.0-Lizenz zu haben.

Siehe dazu auch:

  • Die Neuerungen von Apache Solr 4․0, Artikel auf heise Developer

Zuletzt aktualisiert am Uhr





Kommentare


Anzeige