index – Solr.pl

Index – usuwać, czy nadpisywać ?

Rafał Kuć Solr 16 lutego 201111 listopada 2020aktualizacja, index, solr, usuwanie 0 Comment

Co jakiś czas, w pracy z Solr pojawia się problem – aktualizacja struktury indeksów Solr. Różne są powody tych zmian – nowe wymagania funkcjonalne, optymalizacje, czy cokolwiek innego – nie jest to ważne. Istotne jest pytanie, które się wtedy pojawia – usuwać indeks, czy po prostu zmienić strukturę i przeprowadzić pełną indeksację ? Wbrew pozorom odpowiedź na to pytanie zależy od zmian, jakich dokonaliśmy w strukturze indeksu.

CheckIndex, czyli na ratunek indeksowi

Rafał Kuć Lucene, Solr 17 stycznia 201111 listopada 2020check, check index, checkindex, index, lucene, naprawa, solr, sprawdzanie 0 Comment

Korzystając z Lucene i Solr jesteśmy przyzwyczajeni do bardzo dużej niezawodności wymienionych rozwiązań. Może jednak nadejść ten dzień, kiedy Solr krzyknie do nas, iż nasz indeks przestał być poprawny i musimy coś z tym zrobić. Czy jedynym wyjściem jest odtwarzanie z kopii zapasowej, bądź ponowna pełna indeksacja ? Nie tylko – jest jeszcze nadzieja w postaci narzędzia CheckIndex.

Szybkie spojrzenie – IndexSorter

Rafał Kuć Solr 4 października 201010 listopada 2020index, index sorter, indexsorter, lucene, solr, sorting, sortowanie, sortowanie indeksu 0 Comment

Na konferencji Apache Lucene Eurocon 2010, która miała miejsce w maju tego roku, Andrzej Białecki w swojej prezentacji opowiadał o sposobach pozwalających uzyskać zadowalające efekty wyszukiwania korzystając z technik wcześniejszej terminacji wyszukiwania. Niestety narzędzia o których była mowa, nie były dostępne w Solr – to się jednak zmieniło.

Co to jest schema ?

Rafał Kuć Solr 16 sierpnia 201010 listopada 2020analiza, filtr, indeks, index, pole, schema, schema.xml, solr, tokenizer, typ, typ pola, type 0 Comment

Jednym z plików konfiguracyjnych opisujących każde wdrożenie Solr jest plik schema.xml. Opisuje on jedną z najważniejszych rzeczy dotyczącą wdrożenia – strukturę indeksu. Informacje zawarte w tym pliku pozwalają kontrolować, jak zachowuje się Solr podczas indeksowania danych, czy też zadawania zapytań do odpowiednich pól. Schema.xml to jednak nie tylko sama struktura indeksu, to także szczegółowe informacje o typach danych, które mają duży wpływ na zachowanie Solr, a z reguły są traktowane po macoszemu. Tym wpisem postaram się przybliżyć składowe pliku schema.xml.