Solr i Lucene 4.0 powoli zaczynają pojawiać się na horyzoncie i w związku z tym postanowiłem opisać kolejną funkcjonalność, która może okazać się przydatna wielu użytkownikom Solr – częściowa aktualizacja dokumentów.
Solr
Apache Lucene i Solr 4.0 alpha
W dniu dzisiejszym ogłoszone zostało wydanie wersji 4.0 alpha biblioteki Apache Lucene oraz serwera wyszukiwania Apache Solr. Jest to pierwsza wersja przygotowująca do pełnego wydania wersji 4.0. W stosunku do wersji 3.6 zostało wprowadzonych bardzo wiele zmian, o których więcej informacji w rozwinięciu.
Solr: własna implementacja ExchangeRateProvider dla CurrencyField
W poprzednim wpisie dotyczącym implementacji własnych funkcjonalności Solr pokazałem, jak zaimplementować własny filtr dla Solr. Dzisiaj zaimplementujemy własny mechanizm dostarczający kursów wymiany walut, czyli ExchangeRateProvider dla nowego typu pól – CurrencyField zaprezentowany w Solr 3.6.
Przetwarzanie rich documents – po stronie wyszukiwarki, czy aplikacji ?
Korzystając z indeksowania tzw. „rich documents” powinniśmy się czasami zastanowić, gdzie chcemy dokonywać przetwarzania dokumentów – czy wysłać do Solr (lub innego silnika wyszukiwania, np. ElasticSearch) i zapomnieć, czy jednak wykorzystać Apache Tika przed wysłaniem dokumentu do indeksowania, do Solr wysyłać już tylko i wyłącznie tekst, który ma zostać zaindeksowany.
Autcomplete, cz. 4 (Ngram i faceting)
W poprzednich częściach przedstawiliśmy dwie metody tworzenia podpowiadania zapytań. Następnie jedną z nich rozbudowaliśmy o możliwość dodatkowego definiowania zwracanych informacji. W tym artykule wrócimy ponownie wykorzystamy faceting oraz ngram.
Wymagania
Przy tworzeniu listy podpowiedzi przyjęliśmy następujące założenia:
Solr: tworzenie własnego filtra
Czasami to co oferują Lucene i Solr mogą okazać się niewystarczające. Wtedy musimy sami rozszerzyć możliwości w/w i przygotować kawałek własnego kodu. W dzisiejszym wpisie postaram się pokazać, jak przygotować własny filtr i jak użyć go w Solr.
Solr 4.0: DirectSolrSpellChecker
Jedną z nowości, która zostanie zaprezentowana w Solr 4.0, jest nowy rodzaj SpellChecker’a, który nie potrzebuje własnego indeksu. Postanowiłem przyjrzeć się jego konfiguracji i działaniu.
Apache Lucene i Solr 3.6
Solr 4.0 i możliwości analizy języka polskiego
Ze względu na to, iż wsparcie dla języka polskiego w Lucene (i Solr) jest już od jakiegoś czasu, postanowiłem przyjrzeć się jak zmieni się to wraz z premierą Lucene i Solr w wersji 4.0.
Solr 3.6: CurrencyField
Solr 3.6 przyniesie ciekawą funkcjonalność w postaci obsługi walut. Ktoś mógłby zapytać: „Po co ? Przecież wystarczy typ zmiennoprzecinkowy i mamy obsługę walut”. Przyjrzyjmy się zatem co da nam solr.CurrencyField w Solr 3.6.