`
AngelAndAngel
  • 浏览: 230784 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Mahout各种推荐器的主要特点

阅读更多
    Mahout有很多推荐的实现,各有特点,在这里一并记录。
    GenericUserBasedRecommender: 基于用户的推荐,用户数量相对较少时速度较快。
    GenericItemBasedRecommender:基于物品的推荐,物品数量较少时速度较快,外部提供了物品相似度数据后会更加有效率。
    SlopeOneRecommender:基于slope-one算法(想想那个填空的表格吧)的推荐,在线推荐或更新比较快,需要先下大量的预处理运算。物品数量相对较少时使用比较合适。
    SVDRecommender:效果不错,和slope-one一样,事先需要大量的预处理运算。
    KnnItemBasedRecommender:基于最近邻算法的推荐器,物品数量较小时表现良好。
    TreeClusteringRecommender:基于聚类的推荐器,在线推荐较快,同时也需要事先大量预处理运算,用户数量相对较少时表现良好。
分享到:
评论

相关推荐

    基于Mahout协同过滤的MovieRecommender电影推荐系统源码

    项目名称:MovieRecommender - 基于Mahout的协同过滤电影推荐系统 项目概述: MovieRecommender是一个基于Apache Mahout协同过滤算法实现的电影推荐系统。该系统主要由Java语言编写,同时整合了JavaScript以提供...

    mahoutMvn 测试代码

    mahout的推荐引擎的测试代码,主要是读取csv文件数据,更具用户的的特征相似性给用户提供推荐。

    第7章-大数据分析与挖掘技术---大数据基础.pptx

    (4)时序模式分析:时序模式分析反映的是属性在时间上的特征,属性在时间维度上如何变化,时序模式分析试图在这些历史数据中找到重复概率较高的模式,从而可以利用已知的数据预测未来的值,主要应用在产品生命周期...

    Android代码-recommendSys

    推荐系统 离线计算和实时计算 本项目主要分为WEB(产生数据)、离线和实时三大模块 WEB(产生数据即用户的行为数据) 用户对物品的操作(查看,浏览,购买)ugcLOG 通过flume采集ugcLOG日志到HDFS 离线处理(hadoop ...

    Hadoop生态系统学习

    本文是HADOOP生态系统的基础教程,介绍HADOOP主要组件如HIVE,HDFS,HBASE, ZOOKEEPER ,MAPREDUCE, PIG, MAHOUT的概念,特点,运行流程等。

    毕业设计--网上书店前后台系统。.zip

    Java的主要特点和优势包括以下几个方面: 跨平台性(Write Once, Run Anywhere): Java的代码可以在不同的平台上运行,只需编写一次代码,就可以在任何支持Java的设备上执行。这得益于Java虚拟机(JVM),它充当了...

    你需要Spark的10个理由

    5,不得不提的是Spark的“One stack to rule them all”的特性,Spark的特点之一就是用一个技术堆栈解决云计算大数据中流处理、图技术、机器学习、交互式查询、误差查询等所有的问题,此时我们只需要一个技术团队...

    大数据分析及处理方法.docx

    比方,电商会使用传统的关系型数据库MySQL和Oracle等来存储每一笔事务数据,除此之外,Redis和MongoDB这样的NoSQL数据库也常用于数据的采集 在大数据的采集过程中,其主要特点和挑战是并发数高,因为同时有可能会有...

    Hadoop从业者为什么需要Spark?

    5,Mahout前一阶段表示从现在起他们将不再接受任何形式的以MapReduce形式实现的算法,另外一方面,Mahout宣布新的算法基于Spark; 6,Cloudera的机器学习框架Oryx的执行引擎也将由Hadoop的MapReduce替换成Spark; ...

    Hadoop海量网络数据处理平台的关键技术

    5.一种基于分类器联合的分布式异常流量检测算法海量网络数据处理平台中存在着大量的实时数据流,该数据具有价值高、流量大等特点。同时,云计算平台本身具有强大的计算能力和存储资源,极易成为黑客的攻击目标。而...

    大数据工程师学习计划.pdf

    如果你对⼤数据开发感兴趣,想系统学习⼤数据的话,可以加⼊⼤数据技术学习交流扣群:数字4583+数字45782,私信管理员即可免费 领取开发⼯具以及⼊门学习资料 针对以上主要的4个特征我们需要考虑以下问题: 数据...

Global site tag (gtag.js) - Google Analytics