Korzystając z indeksowania tzw. „rich documents” powinniśmy się czasami zastanowić, gdzie chcemy dokonywać przetwarzania dokumentów – czy wysłać do Solr (lub innego silnika wyszukiwania, np. ElasticSearch) i zapomnieć, czy jednak wykorzystać Apache Tika przed wysłaniem dokumentu do indeksowania, do Solr wysyłać już tylko i wyłącznie tekst, który ma zostać zaindeksowany.
Ogólna
Explain: nowa wersja
Pod adresem: explain.solr.pl znajdziecie nową wersję naszego oprogramowania do analizy zapytań zadawanych do solr. Nowa wersja obejmuje:
- poprawki błędów
- wstępne wsparcie dla Solr 4.0
- obsługę ruby 1.9
Cały kod jest dostępny na naszym koncie GitHub.
explain.solr.pl jako Open Source!
Niniejszym, zgodnie z wcześniejszą obietnicą kod źródłowy explain.solr.pl został opublikowany.
Plany na najbliższą przyszłość
Na pewno zauważyliście zmniejszoną aktywność na solr.pl. Nie jest to jednak związane z przygotowaniami do zapadnięcia w sen zimowy. Nie znudziła nam się też nasza działalność. Powodem jest gorący okres związany z deadline projektu, który wykonujemy w ramach naszej pracy zawodowej. Dodatkowo cała reszta wolnego czasu jest zajęta przez dwa tematy o których poniżej.
Data Import Handler – import danych z plików Solr XML
Do tej pory, w poprzednich artykułach, przyglądaliśmy się importowi danych z baz SQL. Dziś przyszedł czas na import z plików XML.
Krótkie spojrzenie: frange
W Solr 1.4 pojawił się nowy typ zapytań funkcyjnych zwanych frange. Służą one do wyszukiwania informacji z danego przedziału. Według twórców Solr zapytania te powinny być znacznie szybsze (w niektórych przypadkach testy wykazały nawet 40-krotny wzrost wydajności) od zwykłych zapytań. Stwierdziłem, że przeprowadzę prosty test sprawdzający, czy można spodziewać się takich wzrostów wydajności w przypadku zapytań o przedziały.
Kilka słow o optymalizacji – query result window size
Niniejszym chciałbym rozpocząć mały cykl artykułów opisujący elementy optymalizacji instancji Solr. Na pierwszy rzut pójdzie parametr określający tzw. wielkość okna danych, czyli inaczej query result window. Miejmy nadzieję, że tym artykułem będę w stanie wyjaśnić jak korzystać z tego parametru i jak modyfikować i dostosowywać go do swoich potrzeb.
Idealna wyszukiwarka w trzech, prostych krokach
Jeśli jesteś właścicielem serwisu, lub osobą odpowiedzialną za jakikolwiek serwis, którego elementem powinna być wyszukiwarka, ten wpis powie Ci jak prosto i szybko uzyskać idealne rozwiązanie, działające w każdej sytuacji.
Data Import Handler – import danych z baz SQL (cz. 2)
W pierwszej części udało nam się zindeksować informacje zawarte w bazie danych. W części drugiej spróbujemy rozszerzyć funkcjonalność importu o import przyrostowy.
Proces wyszukiwania
Niniejszym inaugurujemy część solr.pl poświęconą tym zagadnieniom, które nie są związane z konkretnym silnikiem wyszukiwania a raczej z budową i rozwojem funkcjonalności serwisów internetowych związanych z wyszukiwaniem.
Czy zastanawialiście się co powoduje, że wyszukiwarka w serwisie jest uważana za dobrą? By odpowiedzieć na to pytanie, należy się zastanowić, jak wygląda typowy proces znajdowania przez klienta pożądanej przez niego informacji. I czy jest coś takiego, jak typowy proces.