W poprzednim wpisie dotyczącym implementacji własnych funkcjonalności Solr pokazałem, jak zaimplementować własny filtr dla Solr. Dzisiaj zaimplementujemy własny mechanizm dostarczający kursów wymiany walut, czyli ExchangeRateProvider dla nowego typu pól – CurrencyField zaprezentowany w Solr 3.6.
Przetwarzanie rich documents – po stronie wyszukiwarki, czy aplikacji ?
Korzystając z indeksowania tzw. „rich documents” powinniśmy się czasami zastanowić, gdzie chcemy dokonywać przetwarzania dokumentów – czy wysłać do Solr (lub innego silnika wyszukiwania, np. ElasticSearch) i zapomnieć, czy jednak wykorzystać Apache Tika przed wysłaniem dokumentu do indeksowania, do Solr wysyłać już tylko i wyłącznie tekst, który ma zostać zaindeksowany.
Autcomplete, cz. 4 (Ngram i faceting)
W poprzednich częściach przedstawiliśmy dwie metody tworzenia podpowiadania zapytań. Następnie jedną z nich rozbudowaliśmy o możliwość dodatkowego definiowania zwracanych informacji. W tym artykule wrócimy ponownie wykorzystamy faceting oraz ngram.
Wymagania
Przy tworzeniu listy podpowiedzi przyjęliśmy następujące założenia:
Solr: tworzenie własnego filtra
Czasami to co oferują Lucene i Solr mogą okazać się niewystarczające. Wtedy musimy sami rozszerzyć możliwości w/w i przygotować kawałek własnego kodu. W dzisiejszym wpisie postaram się pokazać, jak przygotować własny filtr i jak użyć go w Solr.
Solr 4.0: DirectSolrSpellChecker
Jedną z nowości, która zostanie zaprezentowana w Solr 4.0, jest nowy rodzaj SpellChecker’a, który nie potrzebuje własnego indeksu. Postanowiłem przyjrzeć się jego konfiguracji i działaniu.
Explain: nowa wersja
Pod adresem: explain.solr.pl znajdziecie nową wersję naszego oprogramowania do analizy zapytań zadawanych do solr. Nowa wersja obejmuje:
- poprawki błędów
- wstępne wsparcie dla Solr 4.0
- obsługę ruby 1.9
Cały kod jest dostępny na naszym koncie GitHub.
Apache Lucene i Solr 3.6
Solr 4.0 i możliwości analizy języka polskiego
Ze względu na to, iż wsparcie dla języka polskiego w Lucene (i Solr) jest już od jakiegoś czasu, postanowiłem przyjrzeć się jak zmieni się to wraz z premierą Lucene i Solr w wersji 4.0.
Solr 3.6: CurrencyField
Solr 3.6 przyniesie ciekawą funkcjonalność w postaci obsługi walut. Ktoś mógłby zapytać: „Po co ? Przecież wystarczy typ zmiennoprzecinkowy i mamy obsługę walut”. Przyjrzyjmy się zatem co da nam solr.CurrencyField w Solr 3.6.