Solr: tworzenie własnego filtra

Maj 14th, 2012Posted by gr0

Czasami to co oferują Lucene i Solr mogą okazać się niewystarczające. Wtedy musimy sami rozszerzyć możliwości w/w i przygotować kawałek własnego kodu. W dzisiejszym wpisie postaram się pokazać, jak przygotować własny filtr i jak użyć go w Solr.

Solr 4.0: DirectSolrSpellChecker

Kwiecień 30th, 2012Posted by gr0

Jedną z nowości, która zostanie zaprezentowana w Solr 4.0, jest nowy rodzaj SpellChecker’a, który nie potrzebuje własnego indeksu. Postanowiłem przyjrzeć się jego konfiguracji i działaniu.

Explain: nowa wersja

Kwiecień 16th, 2012Posted by negativ

Pod adresem:  explain.solr.pl znajdziecie nową wersję naszego oprogramowania do analizy zapytań zadawanych do solr. Nowa wersja obejmuje: poprawki błędów wstępne wsparcie dla Solr 4.0 obsługę ruby 1.9 Cały kod jest dostępny na naszym koncie GitHub.

Apache Lucene i Solr 3.6

Kwiecień 12th, 2012Posted by gr0

W dniu dzisiejszym ogłoszone zostało wydanie nowej wersji biblioteki Apache Lucene oraz serwera wyszukiwania Apache Solr oznaczone numerem 3.6. W stosunku do wersji 3.5 zostało wprowadzonych kilka znaczących zmian, o których więcej w rozwinięciu.

Solr 4.0 i możliwości analizy języka polskiego

Kwiecień 2nd, 2012Posted by gr0

Ze względu na to, iż wsparcie dla języka polskiego w Lucene (i Solr) jest już od jakiegoś czasu, postanowiłem przyjrzeć się jak zmieni się to wraz z premierą Lucene i Solr w wersji 4.0.

Solr 3.6: CurrencyField

Marzec 19th, 2012Posted by gr0

Solr 3.6 przyniesie ciekawą funkcjonalność w postaci obsługi walut. Ktoś mógłby zapytać: „Po co ? Przecież wystarczy typ zmiennoprzecinkowy i mamy obsługę walut”. Przyjrzyjmy się zatem co da nam solr.CurrencyField w Solr 3.6.

Użycie parametrów cache=false i cost w zapytaniach

Marzec 5th, 2012Posted by gr0

Od chwili premiery Solr 3.4 użytkownicy otrzymali całkiem ciekawą funkcjonalność pozwalającą na określenie, czy wynik działania filtra, bądź zapytanie mają być cachowane. Oprócz tego dostaliśmy do ręki możliwość określania kosztu filtra. Przyjrzyjmy się zatem tym parametrom.

explain.solr.pl jako Open Source!

Luty 27th, 2012Posted by negativ

Niniejszym, zgodnie z wcześniejszą obietnicą kod źródłowy explain.solr.pl został opublikowany. Dla przypomnienia: jest to narzędzie do wizualizacji wyników zapytań zadawanych do Solr i odpowiedzi w przejrzystej formie na pytania: dlaczego dany dokument został znaleziony dlaczego dany dokument nie został znaleziony Dokładniejsze informację znajdują się tutaj. Zdecydowaliśmy się w tym momencie opublikować, mimo, że jeszcze wiele [...]

Prosta wyszukiwarka zdjęć

Luty 20th, 2012Posted by gr0

Mieliśmy niedawno okazję pomocy przy tworzeniu niekomercyjnego projektu, którego częścią była wyszukiwarka. Jednym z założeń, trochę pobocznych, było wyszukiwanie zdjęć, aby korzystający mogli bardzo szybko dotrzeć do interesujących ich obrazów. Wyszukiwarka miała działać w oparciu o meta dane zapisane w plikach JPEG, tak więc wybór był jasny – Apache Solr oraz Apache Tika.

Do czego może przydać się tie w Dismax’ie ?

Luty 6th, 2012Posted by gr0

Dismax parser obecny jest w Solr od niepamiętnych czasów. W większości wypadków jednak korzystamy z parameterów takich, jak qf, pf, czy mm zapominając zupełnie o bardzo przydatnym parametrze pozwalającym kontrolować wpływ mniej ważnych pól na score dokumentu, czyli o parametrze tie.