Solr – Die bewährte Such-Plattform von Apache

Enterprise Such-Plattform von Apache

Anwendungen mit umfangreichem Datenbestand sind ohne Suchfunktion undenkbar. Für die Suche in großen Datenmengen sind passende Verfahren und Algorithmen entscheidend. Solr von der Apache Software Foundation bietet diese Funktionalität. Es handelt sich hierbei um einen cross-plattform Enterprise Search Server basierend auf der bewährten Suchbibliothek von Apache Lucene.

Taktsoft setzt diese Lösung bei eigens entwickelten Projekten ein. Wir sorgen dafür Solr fachgerecht aufzusetzen und zu konfigurieren. Aus unserer Software wird der Index-Aufbau zielgerichtet Mit solr integriert Taktsoft eine umfassende Suche in Ihre Individualsoftware. und Ressourcen-schonend gesteuert, die Suchanfragen der Benutzer werden in die Anwendung integriert. Gerne beraten wir sie aber auch bei der Konfiguration und Integration von Solr in Ihre Anwendung. Die unter der Apache License 2.0 lizensierte Open Source Lösung ist dank der großen Community an Entwicklern zu einer sehr guten Alternative zu kommerziellen Enterprise Search Lösungen geworden. Solr ist damit ein weiteres Beispiel für die professionelle Integration von Open Source Software in den Technologie-Stack von Taktsoft.

Suche als Service

Konfigurieren statt programmieren

Während Lucene ein Framework zur Entwicklung von Suchmaschinen darstellt, ist Solr eine Server-Software, welche die Suche und Indizierung als Service bereitstellt. Das heißt, dass Dinge welche in Lucene programmiert werden müssen, in Solr nur noch eine Sache der entsprechenden Konfiguration sind. Solche Konfigurationsmöglichkeiten sind z.B. dafür einsetzbar Solr ressourcenschonend arbeiten zu lassen. So lässt sich unter anderem einstellen, ob Solr FilterQueries im Cache gespeichert werden sollen. Dies bietet die Möglichkeit den Cache nicht mit selten genutzten Suchfiltern zu belasten. Auch lässt sich in Solr die Reihenfolge der Filter konfigurieren. So lassen sich Ressourcen-teure Operation, wie z.B. die Geo-Suche, erst auf bereits vorgefilterte Suchergebnisse anwenden.

Solr Cloud

Seit dem Release 4.0 bietet Solr zahlreiche neue Features, welche den Funktionsumfang von Solr weiter ergänzen. Diese sind unter dem Begriff Solr Cloud zusammengefasst.
Automatic Failover sorgt dafür, dass im Falle eines Ausfalls eines Indizierungsservers ein anderer Server der Cloud einspringt. Dies gilt sowohl für Lese- und Schreibvorgänge.
Darüber hinaus bietet Solr bei der Indizierung eine automatische Dokumentenverteilung. Innerhalb eines Clusters erkennt Solr jetzt Server die zu- oder abgeschaltet wurden und passt seine Lastverteilung entsprechend an. Sollten die zugeschalteten Server neue Knoten in der Cloud darstellen, werden diese automatisch synchronisiert. Das weitreichende Handling verschiedener Dokumentformate ist eine Stärke von Solr. Von XML und JSON über MS Office bis hin zu PDF kann Solr alles verarbeiten.

Distributed Indexing

High Performance Indizierung

Distributed Indexing verteilt Indexierungsaufgaben auf mehrere Server, wodurch die Prozessgeschwindigkeit gesteigert wird.
Das RealTime Get von Solr macht Indexupdates sofort verfügbar ohne den üblicherweise nötigen und Ressourcen-hungrigen commit. Dies ist vor allem dann ein Vorteil, wenn Solr auch als NoSQL Datenspeicher und nicht nur als reiner Suchindex genutzt wird.
NearRealTime, die Suche nahe an der Echtzeit, ist eine neue SoftCommit-Strategie, mit welcher neu hinzugefügte Dokumente nahezu direkt mit einer Suche gefunden werden können.
Dank eines Transaction Logs gehen Änderungen, welche noch nicht transaktioniert wurden, bei Ausfall nicht verloren, da dieser sämtliche Änderungen erfasst. Somit ist auch eine Update-Sicherheit in Solr gewährleistet.

Weitere Informationen zu Apache Solr finden Sie unter: http://lucene.apache.org/solr/.