Fork me on GitHub
修行者

Zero


  • 首页

  • 分类

  • 归档

  • 标签

  • 关于

《统计学习方法》--学习笔记

发表于 2019-01-13 | 分类于 机器学习

《统计学习方法》的相关学习记录

阅读全文 »

【从0开始学大数据】--模块四学习记录

发表于 2018-12-29 | 分类于 学习记录

该篇是记录模块三大数据平台与系统集成相关

阅读全文 »

【数据分析实战45讲】--模块一学习记录

发表于 2018-12-28 | 分类于 学习记录

该篇学习记录主要是记录和总结极客时间专栏 「数据分析实战45讲」
如何培养 数据思维?

阅读全文 »

【从0开始学大数据】--模块三学习记录

发表于 2018-12-08 | 分类于 学习记录

该篇是记录模块三大数据开发实践相关

如何开发一个大数据 SQL 引擎

学习一样技术,如果只是作为学习者,被动接受总是困难的,但如果从开发者的视角看,很多东西就豁然开朗了,明白了原理,有时甚至不需要学习,顺着原理就可以推导出各种实现细节

阅读全文 »

【从0开始学大数据】--模块二学习记录

发表于 2018-12-06 | 分类于 学习记录

模块二主要讲的是大数据生态体系主要产品原理与架构

Hive 如何让 MapReduce 实现 SQL 操作

Hive 就是一种工具,自动将 SQL 生成 MapReduce 代码,分析师只需要输入 SQL,然后提交给 Hadoop 执行就可以。

Hive 的执行计划是根据 SQL 语句生成这些函数的 DAG (有向无环图),然后封装进 MapReduce 的 map 和 reduce 函数中,Hive 可实现的计算有聚合(group by)、过滤(where)、连接(join)等操作。

大数据 SQL 引擎:

  • Impala:运行在 HDFS 上的MPP架构的 SQL 引擎
  • Spark SQL
阅读全文 »
12…7
Bodycoder

Bodycoder

编程界的健身爱好者

35 日志
14 分类
37 标签
RSS
Github Weibo Zhihu
Creative Commons
友情链接
  • 帅哥
© 2016 - 2019 Bodycoder
由 Hexo 强力驱动
主题 - NexT.Mist
本站访客数 人次 本站总访问量 次