Przetwarzanie rich documents – po stronie wyszukiwarki, czy aplikacji ?

Korzystając z indeksowania tzw. „rich documents” powinniśmy się czasami zastanowić, gdzie chcemy dokonywać przetwarzania dokumentów – czy wysłać do Solr (lub innego silnika wyszukiwania, np. ElasticSearch) i zapomnieć, czy jednak wykorzystać Apache Tika przed wysłaniem dokumentu do indeksowania, do Solr wysyłać już tylko i wyłącznie tekst, który ma zostać zaindeksowany.

Read more