solr
apache solr
http://lucene.apache.org/solr/
以前使用lucene还需要理解lucene的api 然后自己架设前端。
现在solr把一切都通过http完成了(index 和 query)
可以很方便的构建小型的搜索引擎,而且部署非常简单(我把两年前用C写的一个检索系统用solr试 部署了一下)。
不过其实搜索引擎,尤其是基本检索本来就不太负载 ,再过两年就会和做网站差不多。
有挑战的事情是信息收集,提取,关联分析,匹配。
btw
最近冒出来不少商业搜索,不知道赚钱不赚钱