搜索资源列表
zdlove2008
- 一片讲述Web 可视化的论文, Web站点结构及网页特征信息的抽取和过滤 -on a Web visualization of papers, Web site structure and website feature information extraction and filtration
jipiao
- 基于对象的垂直搜索引擎越来越受到人们的关注,结合这一热门技术,详细介绍了机票比价搜索系统的设计与实现。该 系统基于垂直搜索的思想,采用模板方式的网页抽取技术,提供给用户全面的机票信息。-Object-based vertical search engine more and more people' s attention, combined with the hot technology, detailed information on ticket price ratio sear
InformationExtractionAlgorithms
- 关于网页信息抽取的论文:【摘要】提出并实现了一种基于网页文字密度的正文信息提取算法,该算法主要根据中文网页源码每行中的中文字符比例,区别正文行和非正文行,并辅助一些相关的伪源码正文块识别算法,来区别真正的正文信息和噪声信息,从而实现中文网页正文信息的提取。实验结果表明本方法切实可行并且具有较高的准确性和通用性。-About Web information extraction papers: Abstract proposed and implemented a web-based text i