搜索资源列表
K-PageSearch
- 功能特点 多线程网络蜘蛛 网页定向采集 多语言网页编码自动识别 哈希表网页去重 智能网页正文抽取 基于词库的智能中文分词 中文分词词库管理 海量数据毫秒级全文检索 缓存技术 网页快照 高级搜索 竞价排名 网络蜘蛛-Features multi-threaded web spider web oriented multi-language Web page collection automatic identific
Web-Data-Extraction-Tools
- 主要是对当前的信息抽取工具所作的一个总结和概括。-A Brief Survey of Web Data Extraction Tools