打印 上一主题 下一主题

[百度网盘]全面掌握Spark性能优化炼成真正的Spark高手 Spark高级视频教程 spark性能优化

[复制链接]
跳转到指定楼层
楼主
admin 发表于 2017-11-10 23:08:55
8556 12
课程目标
  • 大数据性能调优的本质
  • Spark 性能调优要点分析
  • Spark 资源使用原理流程
  • Spark 资源调优最佳实战
  • Spark 更高性能的算子
课程简介
我们谈大数据性能调优,到底在谈什么,它的本质是什么,以及 Spark 在性能调优部份的要点,这两点让在进入性能调优之前都是一个至关重要的问题,它的本质限制了我们调优到底要达到一个什么样的目标或者说我们是从什么本源上进行调优。希望我们的课程能为同学们带出以下的启发:
  • 了解大数据性能调优的本质
  • 了解 Spark 性能调优要点分析
  • 了解 Spark 在资源优化上的一些参数调优
  • 了解 Spark 的一些比较高效的 RDD 操作算子

大数据性能调优的本质
编程的时候发现一个惊人的规律,软件是不存在的!所有编程高手级别的人无论做什么类型的编程,最终思考的都是硬件方面的问题!最终思考都是在一秒、一毫秒、甚至一纳秒到底是如何运行的,并且基于此进行算法实现和性能调优,最后都是回到了硬件!
在大数据性能的调优,它的本质是硬件的调优!即基于 CPU(计算)、Memory(存储)、IO-Disk/ Network(数据交互) 基础上构建算法和性能调优!我们在计算的时候,数据肯定是存储在内存中的。磁盘IO怎么去处理和网络IO怎么去优化。

Spark 性能调优要点分析
在大数据性能本质的思路上,我们应该需要在那些方面进行调优呢?比如:
  • 并行度
  • 压缩
  • 序例化
  • 数据倾斜
  • JVM调优 (例如 JVM 数据结构化优化)
  • 内存调优
  • Task性能调优 (例如包含 Mapper 和 Reducer 两种类型的 Task)
  • Shuffle 网络调优 (例如小文件合并)
  • RDD 算子调优 (例如 RDD 复用、自定义 RDD)
  • 数据本地性
  • 容错调优
  • 参数调优


大数据最怕的就是数据本地性(内存中)和数据倾斜或者叫数据分布不均衡、数据转输,这个是所有分布式系统的问题!数据倾斜其实是跟你的业务紧密相关的。所以调优 Spark 的重点一定是在数据本地性和数据倾斜入手。
  • 资源分配和使用:你能够申请多少资源以及如何最优化的使用计算资源
  • 关发调优:如何基于 Spark 框架内核原理和运行机制最优化的实现代码功能
  • Shuffle调优:分布式系统必然面临的杀手级别的问题
  • 数据倾斜:分布式系统业务本身有数据倾斜
  • Spark 资源使用原理流程
这是一张来至于官方的经典资源使用流程图,这里有三大组件,第一部份是 Driver 部份,第二就是具体处理数据的部份,第三就是资源管理部份。这一张图中间有一个过程,这表示在程序运行之前向资源管理器申请资源。在实际生产环境中,Cluster Manager 一般都是 Yarn 的 ResourceManager,Driver 会向 ResourceManager 申请计算资源(一般情况下都是在发生计算之前一次性进行申请请求),分配的计算资源就是 CPU Core 和 Memory,我们具体的 Job 里的 Task 就是基于这些分配的内存和 Cores 构建的线程池来运行 Tasks 的。

游客,如果您要查看本帖隐藏内容请回复


吾爱编程网 - 免责声明
1、吾爱编程网为非营利性网站,全站所有资料仅供网友个人学习使用,禁止商用
2、本站所有文档、视频、书籍等资料均由网友分享,本站只负责收集不承担任何技术及版权问题
3、如本帖侵犯到任何版权问题,请立即告知本站,本站将及时予与删除下载链接并致以最深的歉意
4、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责
5、一经注册为本站会员,一律视为同意网站规定,本站管理员及版主有权禁止违规用户
6、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和吾爱编程网的同意
7、吾爱编程网管理员和版主有权不事先通知发贴者而删除本文




上一篇:大数据Spark基础+Spark中级架构原理、运行流程图+Spark内核分析解密视频课程
下一篇:10小时入门大数据
收藏
收藏
支持
支持
反对
反对
回复

使用道具 举报

沙发
bzadmin 发表于 2017-12-29 16:48:19
回复

使用道具 举报

板凳
huxingxing 发表于 2018-1-10 20:39:17
规范健康快乐就
回复

使用道具 举报

地板
gaochao 发表于 2018-8-13 17:44:54
不管你信不信,反正我是信了。支持吾爱编程网!
回复

使用道具 举报

5#
Breeze 发表于 2018-8-13 18:57:01
看帖看完了至少要顶一下,还可以加入到淘帖哦!支持吾爱编程网!
回复

使用道具 举报

6#
coffeebeansyy 发表于 2018-8-30 15:54:23
看了LZ的帖子,我只想说一句很好很强大!支持吾爱编程网!
回复

使用道具 举报

7#
FunnyKing 发表于 2018-12-9 13:54:34 来自手机
cufctucutcr7xuitcttutx
回复

使用道具 举报

8#
漫游者 发表于 2019-1-1 09:28:14
不管你信不信,反正我是信了。支持吾爱编程网!
回复

使用道具 举报

9#
db198905 发表于 2019-4-3 17:09:53
啥也不说了,楼主就是给力!支持吾爱编程网!
回复

使用道具 举报

10#
小兵123 发表于 2019-4-3 18:37:42 来自手机
全面掌握Spark性能优化炼成真正的Spark高手 S
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

返回顶部 返回列表

平台简介

吾爱编程网:http://www.52pg.net/是IT技能学习交流平台,我们提供了丰富的移动端开发、php开发、web前端开发、android开发、Java开发、Python开发、大数据开发、区块链开发、人工智能开发以及html5等大量的实战视频教程资源。(如果我们有侵犯了您权益的资源请联系我们删除)

点击这里给我发消息|Archiver|手机版|小黑屋|站点地图|吾爱编程  |网站地图

Powered by Discuz! X3.2??? 2017-2020 Comsenz Inc.??吾爱编程网