W związku ze zbliżającym się powoli wydaniem Apache Solr w wersji 4.0 uznałem, iż nadszedł czas, aby przybliżyć niektóre z funkcjonalności, jakie dostaniemy w swoje ręce wraz z premierą tej wersji silnika wyszukiwania. Na pierwszy ogień przyjrzymy się prostej, aczkolwiek przydatnej funkcjonalności nazwanej pseudo fields wraz z dodatkowymi możliwościami związanymi z parametrem fl.
solr
Lucene Eurcon 2011 – dzień pierwszy
Jak już pisaliśmy, kilkanaście dni temu wróciliśmy z kolejnej odsłony konferencji Lucene Eurocon, która miała miejsce w Barcelonie. Pomimo tego, iż dostępne będą filmy z każdej z prezentacji, postanowiliśmy opisać te na których byliśmy i które zapadły nam w pamięć. Niestety ze względu na to, że konferencja prowadzona była trzema ścieżkami, nie byliśmy w stanie być obecni na wszystkich tych na których byśmy chcieli.
Plany na najbliższą przyszłość
Na pewno zauważyliście zmniejszoną aktywność na solr.pl. Nie jest to jednak związane z przygotowaniami do zapadnięcia w sen zimowy. Nie znudziła nam się też nasza działalność. Powodem jest gorący okres związany z deadline projektu, który wykonujemy w ramach naszej pracy zawodowej. Dodatkowo cała reszta wolnego czasu jest zajęta przez dwa tematy o których poniżej.
Lucene i Solr 3.4
Na serwerach Apache Software Foundation (oraz mirrorach) można znaleźć wersję 3.4 biblioteki Lucene oraz opartego na niej silnika wyszukiwania Solr. W najnowszej wersji zostało zawartych kilka ciekawych funkcjonalności, szczególnie jeżeli chodzi o Solr. Lista moim zdaniem najważniejszych zmian w rozwinięciu.
Kilka słów o optymalizacji – documentCache
Data Import Handler – import danych z plików Solr XML
Do tej pory, w poprzednich artykułach, przyglądaliśmy się importowi danych z baz SQL. Dziś przyszedł czas na import z plików XML.
Problem „głębokiego” stronicowania
Wyobraźmy sobie następujący problem – mamy aplikację, która oczekuje od Solr zwracania posortowanych po pewnym polu wyników, które będą następnie stronicowane. Jednak, jeżeli osoba korzystająca z aplikacji wybierze od razu dziesiątą, dwudziestą, czy pięćdziesiątą stronę wyników wyszukiwania pojawia się problem długiego oczekiwania na wyniki wyszukiwania. Czy jest coś co możemy z tym zrobić ? Tak, możemy trochę pomóc Solr.
Lucene i Solr 3.3
Minęło dopiero kilka tygodnia od wydania wersji 3.2 (lista zmian), a na serwerach Apache Software Foundation (oraz mirrorach) można znaleźć wersję 3.3 biblioteki Lucene oraz opartego na niej silnika wyszukiwania Solr. W najnowszej wersji zostało zawartych kilka ciekawych funkcjonalności, szczególnie jeżeli chodzi o Solr. Lista moim zdaniem najważniejszych zmian w rozwinięciu.
Kiedy należy commitować ?
Pytanie jakie ostatnio sobie zadałem, wydaje się jednym z tych na które odpowiedź powinna być szybka i bezproblemowa. Tak więc, kiedy należy wysyłać polecenie commit do Solr (lub Lucene) ? Pomimo prostoty pytania, odpowiedź nie jest moim zdaniem jednoznaczna.
Solr 3.1: FastVectorHighlighting
Jedną z wielu nowych funkcjonalności jakie przyniosła wersja 3.1 biblioteki Lucene i serwera wyszukiwania Solr jest FastVectorHighlighting, czyli nic innego jak usprawnione funkcjonalności odpowiedzialne za highlighting. Ze względu na to, że obecny dotychczas w Solr highlighting nie dość, że nie działał zbyt szybko, to mówiąc wprost potrafił zabić Solr przy dużej ilości danych, bądź bardzo długich polach tekstowych. Stwierdziłem, że warto przetestować wydajność nowej funkcjonalności.