solr – Strona 13

Lucene i Solr 3.2

Rafał Kuć Solr 5 czerwca 201111 listopada 2020lucene, solr 0 Comment

W sobotę 03.06.2011 została opublikowana najnowsza wersja biblioteki Lucene oraz oparty na niej silnik wyszukiwania Solr, oznaczone numerem 3.2. W stosunku do wersji 3.1 nie należy spodziewać się rewolucji, jednak warto wiedzieć co się zmieniło. Lista najważniejszych moim zdaniem zmian w rozwinięciu.

Krótkie spojrzenie: frange

Rafał Kuć Ogólna 30 maja 201111 listopada 2020frange, query, range, solr 0 Comment

W Solr 1.4 pojawił się nowy typ zapytań funkcyjnych zwanych frange. Służą one do wyszukiwania informacji z danego przedziału. Według twórców Solr zapytania te powinny być znacznie szybsze (w niektórych przypadkach testy wykazały nawet 40-krotny wzrost wydajności) od zwykłych zapytań. Stwierdziłem, że przeprowadzę prosty test sprawdzający, czy można spodziewać się takich wzrostów wydajności w przypadku zapytań o przedziały.

Solr filtry: PatternReplaceCharFilter

Marek Rogoziński Solr 9 maja 201111 listopada 2020filtr, filtrowanie, schema, schema.xml, solr, tokenizer 0 Comment

Kontynuując przeglad filtrów dostępnych w Solr dziś przyglądamy się pracy PatternReplaceCharFilter.

Jak łatwo się domyślić zadaniem filtra jest zamiana w strumieniu wejściowym tych fragmentów, które pasują do danego wyrażenia regularnego.

Solr filtry: KeepWordFilter

Rafał Kuć Solr 2 maja 201111 listopada 2020filter, keep, keepword, keepwordfilter, solr, word 0 Comment

Tym razem postanowiłem się przyjrzeć nietypowym filtrom dostępnym w standardowej dystrybucji Solr. Jako pierwszy w moje ręce trafił filtr o nazwie KeepWordFilter.

Solr 3.1 Cookbook

Rafał Kuć Solr 24 kwietnia 201111 listopada 20203.1, book, cookbook, solr, solr cookbook 0 Comment

W związku ze zbliżającą się datą premiery chcielibyśmy zaprezentować nową pozycję dotyczącą Solr, która niedługo (planowana data wydania czerwiec 2011) ukaże się na rynku – „Solr 3.1 Cookbook„. Z tym większą przyjemnością prezentujemy książkę ze względu na to, że została napisana przez jednego z nas 😉

Solr 3.1: JSON Update Handler

Rafał Kuć Solr 18 kwietnia 201111 listopada 2020file format, handler, json, solr, update 0 Comment

W związku z pojawieniem się Solr 3.1 postanowiłem przyjrzeć się funkcjonalności rozszerzającej listę formatów za pomocą których możemy uaktualniać indeksy. Do tej pory mieliśmy do wyboru trzy rodzaje formatów za pomocą których mogliśmy dostarczać dane – XML, CSV oraz tzw. JavaBin. Wraz z pojawieniem się Solr 3.1 wprowadzono czwarty format – JSON.

Lucene i Solr 3.1

Rafał Kuć Lucene, Solr 31 marca 201111 listopada 2020lucene, solr 0 Comment

Kilka minut temu zostały opublikowana najnowsza wersja biblioteki Lucene oraz opartego na niej silnika wyszukiwania Solr, oznaczone numerem 3.1. Zmian jest sporo, pozwolę sobie zatem na przytoczenie niektórych z nich (opierając się na wiadomości wysłanej przez Granta Ingersoll):

Integracja Solr z Tika (cz. 1 – podstawy)

Rafał Kuć Solr 21 marca 201111 listopada 2020solr 0 Comment

Indeksowanie tzw, „rich documents”, czyli plików w formacie pdf, doc, rtf i tak dalej (lub też plików binarnych) zawsze wymagało pewnej pracy po stronie dewelopera w celu wyciągnięcia interesujących go treści, a następnie przygotowanie ich w formacie zrozumiałym dla wyszukiwarki, w tym wypadku dla Solr. Aby zminimalizować tą pracę postanowiłem przyjrzeć się Apache Tika i integracji tej biblioteki z Solr.

Aplikacja „sprzedaż samochodów” – Spatial Search, czyli wprowadzenie danych lokalizacyjnych (cz. 3)

Rafał Andrzejewski Solr 14 marca 201111 listopada 2020howto, schema, solr 0 Comment

Ilość ogłoszeń w naszej bazie rozrosła się do tego stopnia, że klienci zaproponowali dodanie nowej opcji przy filtrowaniu wyników wyszukiwania oraz nowej opcji sortowania. Mianowicie musimy dodać funkcjonalność, która pozwoli nam operować na danych związanych z lokalizacją auta w danym ogłoszeniu.

Data Import Handler & XML – zagnieżdzone encje

Marek Rogoziński Solr 7 marca 201111 listopada 2020data import handler, dih, import, solr 0 Comment

Data Import Handler jest bardzo miłym i rozbudowanym narzędziem. Poniżej opis problemu (i rozwiązania) w którym spotkałem się ostatnio.