<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>vector &#8211; Solr.pl</title>
	<atom:link href="https://solr.pl/tag/vector/feed/" rel="self" type="application/rss+xml" />
	<link>https://solr.pl</link>
	<description>All things to be found - Blog related to Apache Solr &#38; Lucene projects - https://solr.apache.org</description>
	<lastBuildDate>Wed, 11 Nov 2020 18:48:51 +0000</lastBuildDate>
	<language>pl-PL</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9</generator>
	<item>
		<title>Solr 3.1: FastVectorHighlighting</title>
		<link>https://solr.pl/2011/06/13/solr-3-1-fastvectorhighlighting/</link>
					<comments>https://solr.pl/2011/06/13/solr-3-1-fastvectorhighlighting/#respond</comments>
		
		<dc:creator><![CDATA[Rafał Kuć]]></dc:creator>
		<pubDate>Mon, 13 Jun 2011 17:48:18 +0000</pubDate>
				<category><![CDATA[Solr]]></category>
		<category><![CDATA[fast]]></category>
		<category><![CDATA[highlighting]]></category>
		<category><![CDATA[lucene]]></category>
		<category><![CDATA[podświetlanie]]></category>
		<category><![CDATA[solr]]></category>
		<category><![CDATA[vector]]></category>
		<guid isPermaLink="false">http://sematext.solr.pl/?p=248</guid>

					<description><![CDATA[Jedną z wielu nowych funkcjonalności jakie przyniosła wersja 3.1 biblioteki Lucene i serwera wyszukiwania Solr jest FastVectorHighlighting, czyli nic innego jak usprawnione funkcjonalności odpowiedzialne za highlighting. Ze względu na to, że obecny dotychczas w Solr highlighting nie dość, że nie]]></description>
										<content:encoded><![CDATA[<p>Jedną z wielu nowych funkcjonalności jakie przyniosła wersja 3.1 biblioteki Lucene i serwera wyszukiwania Solr jest <em>FastVectorHighlighting</em>, czyli nic innego jak usprawnione funkcjonalności odpowiedzialne za highlighting. Ze względu na to, że obecny dotychczas w Solr highlighting nie dość, że nie działał zbyt szybko, to mówiąc wprost potrafił <em>zabić </em>Solr przy dużej ilości danych, bądź bardzo długich polach tekstowych. Stwierdziłem, że warto przetestować wydajność nowej funkcjonalności.</p>
<p><span id="more-248"></span></p>
<h3>Kilka słów na początek</h3>
<p>Na początek kilka informacji o możliwościach nowego hightlightra w Lucene:</p>
<ul>
<li>wspiera pola oparte o N-gram</li>
<li>wymusza wykorzystanie Java 5 lub wyższej</li>
<li>bierze pod uwagę podbicia w celu nadawania ważności fragmentom tekstu</li>
<li>jest bardzo szybki dla dużych dokumentów</li>
</ul>
<p>Warto wspomnieć, iż obecny highlighter został oznaczony jako <em>Deprecated</em> zgodnie z ticketem <a href="https://issues.apache.org/jira/browse/SOLR-1696" target="_blank" rel="noopener noreferrer">SOLR-1696</a>.</p>
<h3>Jak został wykonany test ?</h3>
<p>Do testów wykorzystałem indeks zawierający około 1.2 miliona dokumentów (zaindeksowane dane polskiej wikipedii &#8211;  tylko najnowsze zmiany). Dla każdego z poniższych wyszukiwań wykorzystywałem duże pole testowe do podświetlenia, raz ze <em>starym (hl.useFastVectorHighlighter=false)</em>, raz z <em>nowym (hl.useFastVectorHighlighter=true)</em><em> </em>highlighterem. Testy wykonywane były na wyłączonym cache`u Solr. Przedstawiony w tabelce czas odpowiedzi, to średni czas z 10 kolejno zadanych zapytań z wyłączeniem czasu największego i najmniejszego. Poniżej wyniki tego prostego testu:</p>
[table “7” not found /]<br />

<p>Pomimo tego, iż test jest prosty pokazuje pewną prawidłowość &#8211; <em>FastVectorHighlighter </em>jest szybszy od dotychczasowego highlightera.</p>
<p>Co do samej jakości podświetleń nie udało mi się zauważyć większych różnic, aczkolwiek specyfika danych nie sprzyja takim obserwacjom.</p>
<h3>O czym należy pamiętać ?</h3>
<p>Należy pamiętać, że <em>FastVectorHighlighter </em>wymaga, aby pole na którym będzie działać, było odpowiednio zdefiniowane. Konieczne jest ustawienie atrybutów pola na następujące:<em> termVectors=”true” termPositions=”true” termOffsets=”true”</em>. W przeciwnym wypadku dalej będzie wykorzystywany stary mechanizm.</p>
<h3>Podsumowując</h3>
<p>Warto pamiętać, że test przeprowadzony przeze mnie nie jest dokładnym testem wydajności, a jedynie sprawdzeniem nowego mechanizmu w warunkach mniej lub bardziej przypominających produkcyjne. Pozwala to jednak stwierdzić, iż możemy spodziewać się zwiększonej wydajności podczas korzystania z nowej wersji highlightingu.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://solr.pl/2011/06/13/solr-3-1-fastvectorhighlighting/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
