Rozproszone obliczanie IDF

Korzystając z SolrCloud, kiedy nasza kolekcja rozproszona jest pomiędzy wiele instancji Solr dotyka nas problem związany z obliczaniem tzw. odwrotnej częstotliwości dokumentu, czyli zmiennej określającej w jak dużej liczbie dokumentów występuje dany term. Problem w tym, iż domyślnie każda instanacja Solr trzyma dane na temat tej częstotliwości tylko sobie i nie dzieli się z innymi 😉 A co za tym idzie, im bardziej rozproszona jest nasza kolekcja, tym mniejsza jest precyzja naszego wyszukiwania. Zobaczmy zatem co możemy na to poradzić.

Read more

Solr 8: ByteBuffersDirectory – szybkie spojrzenie

Jedną z nowości wprowadzonych w niedawno opublikowanym Solr 8.0 jest nowa implementacja interfejsu Directory mająca zastąpić mało skalowalne RAMDirectory. Ta nowa implementacja to ByteBuffersDirectory dedykowana małym, krótko żyjącym danym. Przyjrzyjmy się zatem potencjalnym zastosowaniom, ograniczeniom i wykorzystaniu w Solr.

Read more