Spark MLlib 机器学习算法与源码解析
官方地址:http://www.dataguru.cn/myclassnew.php?mod=new_basicforlesson&op=basic&lessonid=775课程简介:Spark是一个开源集群运算框架,最初是由加州大学柏克利分校AMPLab所开发。Spark使用了内存内运算技术,在内存上的运算速度比Hadoop MapReduce的运算速度快上100倍,即便是在磁盘上运行也能快10倍。Spark允许将数据加载至集群内存,并多次对其进行查询,非常适合用于机器学习算法。目前,Spark成为了现在大数据领域最火的开源软件,Spark也被许多企业尤其是互联网企业广泛应用到商业项目中,在国内包括阿里、百度、腾讯、网易、搜狐等。本课程主要讲解Spark MLlib,Spark MLlib是一种高效、快速、可扩展的分布式计算框架;实现了常用的机器学习,如:聚类、分类、回归等算法。本课拒绝枯燥的讲述,将循序渐进从Spark的基础知识、矩阵向量的基础知识开始,然后再透彻讲解各个算法的理论、详细展示Spark源码实现,最后均会通过实例进行解析实战,帮助大家真正从理论到实践全面掌握Spark MLlib分布式机器学习。通过该课程的学习,同学们可以全面掌握Spark MLlib机器学习,进而能够在实际工作中进行MLlib的应用开发和定制开发。且该课程优异毕业生均可获得老师内推机会,职位:数据挖掘工程师,就职企业:久邦数码、唯品会、腾讯等。掌握技术,高薪就业,课程等待你的加入!课程大纲:第一课 Spark MLlib基础入门1、Spark介绍2、Spark MLlib介绍3、课程的基础环境4、Spark RDD操作5、RDD操作的代码实操第二课 Spark MLlib矩阵向量1、Spark MLlib矩阵向量2、矩阵向量的代码实操第三课 Spark MLlib线性回归算法1、线性回归算法2、源码分析3、实例4、实例的代码实操第四课 Spark MLlib逻辑回归算法1、逻辑回归算法2、源码分析3、实例4、实例的代码实操第五课 Spark MLlib贝叶斯分类算法1、贝叶斯分类算法2、源码分析3、实例4、实例的代码实操第六课 Spark MLlib决策树算法1、决策树算法2、源码分析3、实例4、实例的代码实操第七课 Spark MLlib KMeans聚类算法1、KMeans聚类算法2、源码分析3、实例4、实例的代码实操第八课 Spark MLlib FPGrowth关联规则算法1、FPGrowth关联规则算法2、源码分析3、实例4、实例的代码实操第九课 Spark MLlib协同过滤推荐算法1、协同过滤推荐算法2、源码分析3、实例4、实例的代码实操第十课 Spark MLlib神经网络算法1、神经网络算法2、源码分析3、实例4、实例的代码实操学习基础:学习者需要有一些Spark/Scala/线性代数基础知识。课程环境:Spark1.4.1, Spark 1.5.1预期收获:通过该课程的学习,同学们可以全面掌握Spark MLlib机器学习,进而能够在实际工作中进行MLlib的应用开发和定制开发。该课程优异毕业生均可获得老师内推机会,职位:数据挖掘工程师,就职企业:久邦数码、唯品会、腾讯等。**** Hidden Message *****看了LZ的帖子,我只想说一句很好很强大!支持吾爱编程网!
页:
[1]