搜索资源列表
Hadoop
- 使用hadoop开发,可以对输入文件中出现的关键词统计词频并进行不同文本词频统计高低的排序,本代码需要用户自行定义关键词和输入文件-Use hadoop development, can appear in the input file keyword statistics word frequency and low frequency statistics different sort of text, the code requires a user-defined keywords an
code_BPMF
- 如何使它工作: 1。创建一个单独的目录,并将所有这些文件下载到相同的目录中 2。下载7个文件: *demo:主文件demo:PMF和贝叶斯PMF * PMF.m:训练的PMF模型 * bayespmf.m贝叶斯PMF模型实现吉布斯采样器。 * moviedata.mat样本数据包含三元组(user_id,movie_id,评分) * makematrix.m:辅助功能转换成大型矩阵的三元组。 * PRED.m:辅助功能使得预测验证集。 三.在Matlab只需运
统计建模于R
- 基于R语言的建模,结合例子的代码实现,包括假设检验与各种统计量的计算(Based on the R language modeling, combined with the code implementation of the example, including the hypothesis test and the calculation of various statistics)
TianCheng-master_chusai_qingyu
- 2018年甜橙金融杯大数据建模大赛初赛方案:通过追踪时间、设备、ip和经纬度等属性的变化来建模判断UID是否为黑产链 ## 代码说明: - gen_stat_feat.py 统计特征 - gen_w2v_feat.py word2vec特征 - lgb_train.py lgb训练模型 两份特征建模加权8:2比例融合即可0.792+,单独统计特征加UID列建模即可0.795。(The preliminary scheme of the 2018 Sweet