Wielkimi krokami nadchodzi moment wydania wersji 4.0 gdyż właśnie opublikowana została beta biblioteki Lucene oraz serwera wyszukiwania Solr.
Read more4.0
Solr 4.0: DirectSolrSpellChecker
Jedną z nowości, która zostanie zaprezentowana w Solr 4.0, jest nowy rodzaj SpellChecker’a, który nie potrzebuje własnego indeksu. Postanowiłem przyjrzeć się jego konfiguracji i działaniu.
Read moreSolr 4.0 i możliwości analizy języka polskiego
Ze względu na to, iż wsparcie dla języka polskiego w Lucene (i Solr) jest już od jakiegoś czasu, postanowiłem przyjrzeć się jak zmieni się to wraz z premierą Lucene i Solr w wersji 4.0.
Read moreSolr 4.0: Realtime GET
Kolejną funkcjonalnością, jakiej postanowiłem się przyjrzeć, w związku ze zbliżającym się Solr 4.0, jest tzw. „Realtime Get”. Jest to funkcjonalność umożliwiająca wyszukiwanie danych, które nie zostały jeszcze dodane do indexu, czyli po ich indeksowaniu nie zostało wysłane polecenie commit. Spójrzmy zatem, jak to działa.
Read moreSolr 4.0: DocTransformers – pierwsze spojrzenie
Dzisiejszy wpis jest kolejnym z serii, w której staramy się przybliżyć funkcjonalności jakie pojawią się w wersji 4.0 Apache Solr. Dzisiaj przyjrzymy się funkcjonalności pozwalającej na zmianę sposobu w jaki zwracane są pola w dokumentach.
Read moreSolr 4.0: możliwości parametru fl – pierwsze spojrzenie
W związku ze zbliżającym się powoli wydaniem Apache Solr w wersji 4.0 uznałem, iż nadszedł czas, aby przybliżyć niektóre z funkcjonalności, jakie dostaniemy w swoje ręce wraz z premierą tej wersji silnika wyszukiwania. Na pierwszy ogień przyjrzymy się prostej, aczkolwiek przydatnej funkcjonalności nazwanej pseudo fields wraz z dodatkowymi możliwościami związanymi z parametrem fl.
Read moreKilka słów o optymalizacji – documentCache
Dobrych kilka miesięcy temu (tutaj) przygadaliśmy się działaniu filterCache. Postanowiłem odświeżyć temat i przyjrzeć się do czego może się nam przydać kolejny cache, czyli documentCache.
Read moreSolr 3.1: JSON Update Handler
W związku z pojawieniem się Solr 3.1 postanowiłem przyjrzeć się funkcjonalności rozszerzającej listę formatów za pomocą których możemy uaktualniać indeksy. Do tej pory mieliśmy do wyboru trzy rodzaje formatów za pomocą których mogliśmy dostarczać dane – XML, CSV oraz tzw. JavaBin. Wraz z pojawieniem się Solr 3.1 wprowadzono czwarty format – JSON.
Read moreHierarchiczny faceting – czyli Pivot Facet w trunk’u
W dużej ilości wdrożeń z jakimi miałem do czynienia zawsze pojawiało się pytanie – co możemy zrobić, aby uzyskać od Solr drzewiastą strukturę facetingu. Oczywiście są na to metody, jednak ich wykorzystanie polegało na modyfikacji danych i odpowiednim przetwarzaniu po stronie aplikacji. Nie było to szczególnie funkcjonalne, jak i szczególnie wygodne. Jednak kilka dni temu Solr w wersji 4.0 został wzbogacony o kod oznaczony jako SOLR-792 w systemie JIRA. Zobaczmy w takim wypadku, jak pobrać wyniki facetingu w postaci drzewa.
Read moreSzybkie spojrzenie – FieldCollapsing
FieldCollapsing, czyli inaczej grupowanie wyników wyszukiwania – funkcjonalność nad którą developerzy Lucene/Solr pracowali już od dłuższego czasu trafiła właśnie do repozytorium projektu Solr. Postanowiłem się przyjrzeć, w jaki sposób działa ta funkcjonalność.
Read more