Wyobraźmy sobie następujący problem – mamy aplikację, która oczekuje od Solr zwracania posortowanych po pewnym polu wyników, które będą następnie stronicowane. Jednak, jeżeli osoba korzystająca z aplikacji wybierze od razu dziesiątą, dwudziestą, czy pięćdziesiątą stronę wyników wyszukiwania pojawia się problem długiego oczekiwania na wyniki wyszukiwania. Czy jest coś co możemy z tym zrobić ? Tak, możemy trochę pomóc Solr.
Author: Rafał Kuć
Lucene i Solr 3.3
Minęło dopiero kilka tygodnia od wydania wersji 3.2 (lista zmian), a na serwerach Apache Software Foundation (oraz mirrorach) można znaleźć wersję 3.3 biblioteki Lucene oraz opartego na niej silnika wyszukiwania Solr. W najnowszej wersji zostało zawartych kilka ciekawych funkcjonalności, szczególnie jeżeli chodzi o Solr. Lista moim zdaniem najważniejszych zmian w rozwinięciu.
Kiedy należy commitować ?
Pytanie jakie ostatnio sobie zadałem, wydaje się jednym z tych na które odpowiedź powinna być szybka i bezproblemowa. Tak więc, kiedy należy wysyłać polecenie commit do Solr (lub Lucene) ? Pomimo prostoty pytania, odpowiedź nie jest moim zdaniem jednoznaczna.
Solr 3.1: FastVectorHighlighting
Jedną z wielu nowych funkcjonalności jakie przyniosła wersja 3.1 biblioteki Lucene i serwera wyszukiwania Solr jest FastVectorHighlighting, czyli nic innego jak usprawnione funkcjonalności odpowiedzialne za highlighting. Ze względu na to, że obecny dotychczas w Solr highlighting nie dość, że nie działał zbyt szybko, to mówiąc wprost potrafił zabić Solr przy dużej ilości danych, bądź bardzo długich polach tekstowych. Stwierdziłem, że warto przetestować wydajność nowej funkcjonalności.
Lucene i Solr 3.2
W sobotę 03.06.2011 została opublikowana najnowsza wersja biblioteki Lucene oraz oparty na niej silnik wyszukiwania Solr, oznaczone numerem 3.2. W stosunku do wersji 3.1 nie należy spodziewać się rewolucji, jednak warto wiedzieć co się zmieniło. Lista najważniejszych moim zdaniem zmian w rozwinięciu.
Krótkie spojrzenie: frange
W Solr 1.4 pojawił się nowy typ zapytań funkcyjnych zwanych frange. Służą one do wyszukiwania informacji z danego przedziału. Według twórców Solr zapytania te powinny być znacznie szybsze (w niektórych przypadkach testy wykazały nawet 40-krotny wzrost wydajności) od zwykłych zapytań. Stwierdziłem, że przeprowadzę prosty test sprawdzający, czy można spodziewać się takich wzrostów wydajności w przypadku zapytań o przedziały.
Solr filtry: KeepWordFilter
Tym razem postanowiłem się przyjrzeć nietypowym filtrom dostępnym w standardowej dystrybucji Solr. Jako pierwszy w moje ręce trafił filtr o nazwie KeepWordFilter.
Solr 3.1 Cookbook
W związku ze zbliżającą się datą premiery chcielibyśmy zaprezentować nową pozycję dotyczącą Solr, która niedługo (planowana data wydania czerwiec 2011) ukaże się na rynku – „Solr 3.1 Cookbook„. Z tym większą przyjemnością prezentujemy książkę ze względu na to, że została napisana przez jednego z nas 😉
Solr 3.1: JSON Update Handler
W związku z pojawieniem się Solr 3.1 postanowiłem przyjrzeć się funkcjonalności rozszerzającej listę formatów za pomocą których możemy uaktualniać indeksy. Do tej pory mieliśmy do wyboru trzy rodzaje formatów za pomocą których mogliśmy dostarczać dane – XML, CSV oraz tzw. JavaBin. Wraz z pojawieniem się Solr 3.1 wprowadzono czwarty format – JSON.
Lucene i Solr 3.1
Kilka minut temu zostały opublikowana najnowsza wersja biblioteki Lucene oraz opartego na niej silnika wyszukiwania Solr, oznaczone numerem 3.1. Zmian jest sporo, pozwolę sobie zatem na przytoczenie niektórych z nich (opierając się na wiadomości wysłanej przez Granta Ingersoll):