搜索资源列表
ThemeCrawler
- 现在常见的搜索策略主要分为两种:一种是基于网页链接结构的搜索策略,另一种是基于内容评价的搜索策略。第一种是通过网页之间的链接关系来确定网页的重要性,从而决定链接访问的顺序。此方法虽然考虑了网页链接结构和网页之间的链接关系,但忽略了网页内容与主题的相关度,容易出现网页搜索“主题漂移”。第二种主要考虑网页内容,好处就是思路清晰且计算简单。但这种方法忽略了网页的链接关系,故在预测链接网页价值方面存在不足。考虑到这些问题,提出将布谷鸟搜索算法应用到主题爬虫中。-Now the common search
Recommender
- 基于MovieLens数据,通过计算余弦相似度,Python语言构建的一个简单协同过滤推荐系统,并给出RMSE等测评结果-Based MovieLens data by calculating the cosine similarity, Python language to build a simple collaborative filtering systems, and the like are given RMSE uation results
特征分解
- 简单的特征分解使用说明,使用numpy.linalg.eig()函数(Simple Method to use eig)