Apache Lucene i Solr 4.4

W dniu dzisiejszym wydana została nowa wersji biblioteki Apache Lucene oraz serwera wyszukiwania Apache Solr oznaczonych numerem 4.4. Jest to kolejna wersja z serii 4, wprowadzająca nowe możliwości i usprawnienia.

Poniżej kilka zmian w porównaniu do wersji 4.3 oraz 4.3.1:

Lucene

  • Nowy moduł umożliwiający replikację indeksów
  • AnalyzingInfixSuggester – nowa implementacja suggestera umożliwiająca znajdowanie podpowiedzi na podstawie wszystkich słów, a nie tylko tych które zaczynają się od danej frazy
  • Ulepszenia FieldCache – kompresja danych typu Int i Long w celu zmniejszenia ilości wykorzystywanej pamięci oraz zmniejszenie wykorzystania pamięci pól typu String w przypadku występowania dużej ilości unikalnych wartości
  • Nowe możliwości modułu umożliwiającego wyliczanie facetingu
  • Nowe filtry – ScandinavianFoldingFilter Scandinavian i NormalizationFilter
  • SimpleMergeSegmentWarmer umożliwiający rozgrzanie struktur danych, takich jak słownik termów, czy docvalues
  • IndexWriter domyślnie zapisuje segmenty do formatu typu compound
  • Poprawki znalezionych bugów i drobne optymalizacje

Solr

  • Możliwość zapisywania i odczytu indeksów prosto z HDFS
  • Solr może teraz działać w trybie bez zdefiniowanej struktury indeksu, tzw. schemaless. Nowo dodawane pola będą analizowane i będzie im nadawany odpowiedni typ w zależności od zawartości dokumentów – przykład takie wdrożenia znajduje się w dystrybuowanym przykładzie
  • Możliwość dodawania definicji copyField przy pomocy Schema API
  • Nowy format pliku solr.xml, umożliwiający automatyczne wyszukiwanie rdzeni w lokalnym systemie plików – zamiast umieszczać informacje dotyczące poszczególnych rdzeni w pliku solr.xml wystarczy umieścić plik core.properties wraz z wartościami, a Solr sam najdzie taki rdzeń
  • Możliwość dodawania plików binarnych do ZooKeeper’a w trybie SolrCloud
  • Możliwość dodawania dokumentów z poziomu panelu administracyjnego Solr
  • Nowy handler umożliwiający pobieranie informacji o systemie
  • Zmiany wynikające z Apache Lucene 4.4

Pełna lista zmian w bibliotece Lucene znajduje się pod adresem http://wiki.apache.org/lucene-java/ReleaseNote44. Pełna lista zmian dotyczących serwera wyszukiwania Solr znajduje się pod adresem http://wiki.apache.org/solr/ReleaseNote44.

Bibliotekę Apache Lucene w wersji 4.4 można pobrać pod adresem: http://www.apache.org/dyn/closer.cgi/lucene/java/. Serwer wyszukiwania Apache Solr 4.4 można pobrać pod adresem: http://www.apache.org/dyn/closer.cgi/lucene/solr/.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *