Hawk搜索引擎平台0.6.9测试版(提供下载)
- 对网页进行深度抓取和分析,自定义抓取规则,实现站内搜索。
- 可以索引各种常用类型文档,实现桌面文档检索。
- 单台PC服务器能索引上千万文档,可以用于中小型检索服务。
- 可以自定义网页展示模板,或XML接口,轻松与各种系统整合。
- 自动分析网页文本,提取新词,如人名,地名等。
- 支持检索词自动推荐以及繁简转换功能。
Hawk是一款面向中小型网站的垂直搜索引擎平台,支持网页深度抓取、文档索引及个性化检索。该平台基于Lucene、Hadoop和Nutch开发,适用于站内搜索、桌面文档检索等多种应用场景。
255

被折叠的 条评论
为什么被折叠?