<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>whoosh &#8211; 天地一沙鸥</title>
	<atom:link href="https://haoluobo.com/tag/whoosh/feed/" rel="self" type="application/rss+xml" />
	<link>https://haoluobo.com</link>
	<description>to be continue....</description>
	<lastBuildDate>Mon, 08 Feb 2010 05:47:11 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.8.2</generator>
	<item>
		<title>Whoosh性能</title>
		<link>https://haoluobo.com/2010/02/whoosh-performance/</link>
					<comments>https://haoluobo.com/2010/02/whoosh-performance/#comments</comments>
		
		<dc:creator><![CDATA[vicalloy]]></dc:creator>
		<pubDate>Mon, 08 Feb 2010 05:47:11 +0000</pubDate>
				<category><![CDATA[编程]]></category>
		<category><![CDATA[python]]></category>
		<category><![CDATA[whoosh]]></category>
		<category><![CDATA[xapian]]></category>
		<guid isPermaLink="false">/?p=10061</guid>

					<description><![CDATA[早些时候就在google到Whoosh和xapian的性能对比文章，只是由于文章被墙，今天才翻墙看到。 文章是 [&#8230;]]]></description>
										<content:encoded><![CDATA[<p>早些时候就在google到Whoosh和xapian的性能对比文章，只是由于文章被墙，今天才翻墙看到。<br />
文章是xapian作者写的。就文章里的对比结果来看，whoosh和xapian的性能差距还是比较明显。索引和搜索的速度有近4倍的差距，在full cache情况下的性能差距更是达到了60倍。<br />
除算法原因外，whoosh的纯python定位也决定了whoosh很难达到其他c/java的搜索引擎库的速度。<br />
当然，whoosh的优势是易用性，在考虑性能的情况下whoosh不是首先。<br />
注：<a href="http://xapian.wordpress.com/2009/02/12/xapian-performance-comparision-with-whoosh/" target="_blank" rel="noopener">Xapian performance comparision with Whoosh</a></p>
]]></content:encoded>
					
					<wfw:commentRss>https://haoluobo.com/2010/02/whoosh-performance/feed/</wfw:commentRss>
			<slash:comments>2</slash:comments>
		
		
			</item>
		<item>
		<title>纯python的全文搜索组件Whoosh</title>
		<link>https://haoluobo.com/2010/01/%e7%ba%afpython%e7%9a%84%e5%85%a8%e6%96%87%e6%90%9c%e7%b4%a2%e7%bb%84%e4%bb%b6whoosh/</link>
					<comments>https://haoluobo.com/2010/01/%e7%ba%afpython%e7%9a%84%e5%85%a8%e6%96%87%e6%90%9c%e7%b4%a2%e7%bb%84%e4%bb%b6whoosh/#comments</comments>
		
		<dc:creator><![CDATA[vicalloy]]></dc:creator>
		<pubDate>Sat, 30 Jan 2010 11:16:39 +0000</pubDate>
				<category><![CDATA[编程]]></category>
		<category><![CDATA[python]]></category>
		<category><![CDATA[whoosh]]></category>
		<guid isPermaLink="false">/index.php/2010/01/%e7%ba%afpython%e7%9a%84%e5%85%a8%e6%96%87%e6%90%9c%e7%b4%a2%e7%bb%84%e4%bb%b6whoosh/</guid>

					<description><![CDATA[haystack 是 django 全文搜索的一个中间件，可以粘合 django 应用和 solr、xapia [&#8230;]]]></description>
										<content:encoded><![CDATA[<p>haystack 是 django 全文搜索的一个中间件，可以粘合 django 应用和 solr、xapian、whoosh 全文搜索引擎。</p>
<p>solr和xapian是早就知道的，Whoosh就没听过了。简单的了解后感觉这东西还是非常不错的。whoosh是一个纯python实现的全文搜索引擎。对python应用而言，whoosh的纯python实现，使whoosh的集成会容易很多，而且扩展起来也会容易很多。</p>
<p>下面是对Whoosh官方简介的翻译</p>
<p><strong>原文地址</strong>：<a href="http://whoosh.ca/wiki">http://whoosh.ca/wiki</a> </p>
<p><strong>Whoosh: 高效的纯python全文搜索组件</strong> </p>
<p>Whoosh是一个纯python实现的全文搜索组件。Whoosh不但功能完善，还非常的快。 </p>
<p>Whoosh的作者是MattChaput，由Side Effects Software公司开发。项目的最初用于Houdini（Side Effects Software公司开发的3D动画软件）的在线帮助系统。Side Effects Software公司将该项目开源。 </p>
<p><strong>主要特性</strong></p>
<ul>
<li>敏捷的API（Pythonic API）。 </li>
<li>纯python实现，无二进制包。程序不会莫名其妙的崩溃。 </li>
<li>按字段进行索引。 </li>
<li>索引和搜索都非常的快 &#8212; 是目前最快的纯python全文搜索引擎。 </li>
<li>良好的构架，评分模块/分词模块/存储模块等各个模块都是可插拔的。 </li>
<li>功能强大的查询语言（通过pyparsing实现功能）。 </li>
<li>纯python实现的拼写检查（目前唯一的纯python拼写检查实现） </li>
</ul>
<p> <strong>为啥选择Whoosh</strong>   </p>
<ul>
<li>纯python实现，省了编译二进制包的繁琐过程。 </li>
<li>python代码比java更容易读懂，而且用起来也更方便。（翻者注：这个容易引发口水） </li>
<li>在很多时候易用性比单纯的最求速度更重要。 </li>
</ul>
<p> Whoosh从其他的开源搜索引擎中获取了大量的灵感。 基础构架参考Lucene，使用KinoSearch的索引算法，部分评分算法来自Terrier，英文的词语态变化来自Minion.   </p>
]]></content:encoded>
					
					<wfw:commentRss>https://haoluobo.com/2010/01/%e7%ba%afpython%e7%9a%84%e5%85%a8%e6%96%87%e6%90%9c%e7%b4%a2%e7%bb%84%e4%bb%b6whoosh/feed/</wfw:commentRss>
			<slash:comments>8</slash:comments>
		
		
			</item>
	</channel>
</rss>
