Ogólna – Strona 2

Przetwarzanie rich documents – po stronie wyszukiwarki, czy aplikacji ?

Rafał Kuć Ogólna, Solr 11 czerwca 201211 listopada 2020 0 Comment

Korzystając z indeksowania tzw. „rich documents” powinniśmy się czasami zastanowić, gdzie chcemy dokonywać przetwarzania dokumentów – czy wysłać do Solr (lub innego silnika wyszukiwania, np. ElasticSearch) i zapomnieć, czy jednak wykorzystać Apache Tika przed wysłaniem dokumentu do indeksowania, do Solr wysyłać już tylko i wyłącznie tekst, który ma zostać zaindeksowany.

Explain: nowa wersja

Marek Rogoziński Ogólna 16 kwietnia 201211 listopada 2020explain 0 Comment

Pod adresem: explain.solr.pl znajdziecie nową wersję naszego oprogramowania do analizy zapytań zadawanych do solr. Nowa wersja obejmuje:

poprawki błędów
wstępne wsparcie dla Solr 4.0
obsługę ruby 1.9

Cały kod jest dostępny na naszym koncie GitHub.

explain.solr.pl jako Open Source!

Marek Rogoziński Ogólna 27 lutego 201211 listopada 2020explain, explain.solr.pl 0 Comment

Niniejszym, zgodnie z wcześniejszą obietnicą kod źródłowy explain.solr.pl został opublikowany.

Plany na najbliższą przyszłość

Rafał Kuć Ogólna 26 września 201111 listopada 20202011, barcelona, eurocon, explain, explain.solr.pl, lucene, lucene eurocon, solr 0 Comment

Na pewno zauważyliście zmniejszoną aktywność na solr.pl. Nie jest to jednak związane z przygotowaniami do zapadnięcia w sen zimowy. Nie znudziła nam się też nasza działalność. Powodem jest gorący okres związany z deadline projektu, który wykonujemy w ramach naszej pracy zawodowej. Dodatkowo cała reszta wolnego czasu jest zajęta przez dwa tematy o których poniżej.

Data Import Handler – import danych z plików Solr XML

Rafał Kuć Ogólna 16 sierpnia 201111 listopada 2020data import handler, dih, solr 0 Comment

Do tej pory, w poprzednich artykułach, przyglądaliśmy się importowi danych z baz SQL. Dziś przyszedł czas na import z plików XML.

Krótkie spojrzenie: frange

Rafał Kuć Ogólna 30 maja 201111 listopada 2020frange, query, range, solr 0 Comment

W Solr 1.4 pojawił się nowy typ zapytań funkcyjnych zwanych frange. Służą one do wyszukiwania informacji z danego przedziału. Według twórców Solr zapytania te powinny być znacznie szybsze (w niektórych przypadkach testy wykazały nawet 40-krotny wzrost wydajności) od zwykłych zapytań. Stwierdziłem, że przeprowadzę prosty test sprawdzający, czy można spodziewać się takich wzrostów wydajności w przypadku zapytań o przedziały.

Kilka słow o optymalizacji – query result window size

Rafał Kuć Ogólna 10 stycznia 201111 listopada 2020cache, query, query result, queryResultCache, queryResultWindowSize, result, size 0 Comment

Niniejszym chciałbym rozpocząć mały cykl artykułów opisujący elementy optymalizacji instancji Solr. Na pierwszy rzut pójdzie parametr określający tzw. wielkość okna danych, czyli inaczej query result window. Miejmy nadzieję, że tym artykułem będę w stanie wyjaśnić jak korzystać z tego parametru i jak modyfikować i dostosowywać go do swoich potrzeb.

Idealna wyszukiwarka w trzech, prostych krokach

Marek Rogoziński Ogólna 8 listopada 201010 listopada 2020wdrożenia 0 Comment

Jeśli jesteś właścicielem serwisu, lub osobą odpowiedzialną za jakikolwiek serwis, którego elementem powinna być wyszukiwarka, ten wpis powie Ci jak prosto i szybko uzyskać idealne rozwiązanie, działające w każdej sytuacji.

Data Import Handler – import danych z baz SQL (cz. 2)

Marek Rogoziński Ogólna 1 listopada 201010 listopada 2020 0 Comment

W pierwszej części udało nam się zindeksować informacje zawarte w bazie danych. W części drugiej spróbujemy rozszerzyć funkcjonalność importu o import przyrostowy.

Proces wyszukiwania

Marek Rogoziński Ogólna 9 sierpnia 201010 listopada 2020faceting, filtrowanie, podstawy, sortowanie, wyszukiwanie 0 Comment

Niniejszym inaugurujemy część solr.pl poświęconą tym zagadnieniom, które nie są związane z konkretnym silnikiem wyszukiwania a raczej z budową i rozwojem funkcjonalności serwisów internetowych związanych z wyszukiwaniem.

Czy zastanawialiście się co powoduje, że wyszukiwarka w serwisie jest uważana za dobrą? By odpowiedzieć na to pytanie, należy się zastanowić, jak wygląda typowy proces znajdowania przez klienta pożądanej przez niego informacji. I czy jest coś takiego, jak typowy proces.