A teraz dwie sroki za ogon – nowy artykuł i rozdanie w naszym małym konkursie, gdzie można było wygrać elektroniczną wersję książki Apache Solr 4 Cookbook. W artykule chcielibyśmy pokazać, jak zaimplementować losową kolejność dokumentów w wynikach zapytania zwracanego przez Apache Solr. Nasz przykład jest rozwiązaniem rzeczywistego problemu – właśnie dzięki niemu wylosujemy dwóch zwycięzców naszego konkursu. Autorzy komentarzy, którzy znajdą się na początku wyników wyszukiwania otrzymają naszą nagrodę.
Author: Marek Rogoziński
SolrCloud HOWTO
Co jest najważniejszą zmianą w wersji 4.x Apache Solr? Myślę, że takich zmian jest wiele, ale SolrCloud jest czymś, co zdecydowanie zmienia architekturę wdrożeń. Do tej pory większe instalacje użerały się z problemem single point of failure (SPOF) – istniał tylko jeden serwer master i gdy ten serwer ulegał uszkodzeniu, cały cluster tracił zdolność przyjmowania nowych danych. Oczywiście można było próbować opcji z wieloma serwerami master, gdzie pojedynczy serwer był odpowiedzialny tylko za część danych, ale ciąle SPOF był obecny. Nawet, gdy wszystko działało poprawnie, ze względu na odstęp między operacjami commit, oraz ze względu na fakt, że instancje slave sprawdzały dostępność nowych danych co pewien okres, rozwiązanie było dalekie od ideału – nowe dane były widoczne dopiero po paru(nastu) minutach.
Apache Lucene i Solr 4.0 beta
Wielkimi krokami nadchodzi moment wydania wersji 4.0 gdyż właśnie opublikowana została beta biblioteki Lucene oraz serwera wyszukiwania Solr.
Autcomplete, cz. 4 (Ngram i faceting)
W poprzednich częściach przedstawiliśmy dwie metody tworzenia podpowiadania zapytań. Następnie jedną z nich rozbudowaliśmy o możliwość dodatkowego definiowania zwracanych informacji. W tym artykule wrócimy ponownie wykorzystamy faceting oraz ngram.
Wymagania
Przy tworzeniu listy podpowiedzi przyjęliśmy następujące założenia:
Explain: nowa wersja
Pod adresem: explain.solr.pl znajdziecie nową wersję naszego oprogramowania do analizy zapytań zadawanych do solr. Nowa wersja obejmuje:
- poprawki błędów
- wstępne wsparcie dla Solr 4.0
- obsługę ruby 1.9
Cały kod jest dostępny na naszym koncie GitHub.
explain.solr.pl jako Open Source!
Niniejszym, zgodnie z wcześniejszą obietnicą kod źródłowy explain.solr.pl został opublikowany.
Explain 0.9.1 – Nowa wersja
Po paru tygodniach (wliczając święta, gdzie teoretycznie raczej ludzie się zajmują innymi rzeczami niż analizowanie zapytań do solr ;)) chcielibyśmy podzielić się wnioskami z udostępnienia explain.solr.pl. Zaobserwowaliśmy, że:
explain.solr.pl: Status
Podczas konferencji Lucene Eurocon 2011 prezentowaliśmy narzędzie do analizy wyników Solr. Obiecywaliśmy, że publiczna wersja serwisu zostanie wkrótce udostępniona społeczności. Chcieliśmy zapewnić, że cały czas zbliżamy się do tego momentu. W tym momencie skupiamy się jeszcze nad:
Wróciliśmy
Kolejny Lucene Eurocon za nami. Bardzo intensywne dwa dni, gdzie podstawowym problemem było: na który z trzech wykładów pójść. Czasem wybór był bardzo trudny, jedyna nadzieja w tym, że w tym roku wszystkie prezentacje były nagrywane i wkrótce zostaną udostępnione w sieci.
Solr filtry: PatternReplaceCharFilter
Kontynuując przeglad filtrów dostępnych w Solr dziś przyglądamy się pracy PatternReplaceCharFilter.
Jak łatwo się domyślić zadaniem filtra jest zamiana w strumieniu wejściowym tych fragmentów, które pasują do danego wyrażenia regularnego.