若泽大数据 www.ruozedata.com

ruozedata


  • 主页

  • 归档

  • 分类

  • 标签

  • 发展历史

  • Suche

Hive生产上,压缩和存储结合使用案例

Veröffentlicht am 2018-04-23 | Bearbeitet am 2019-05-13 | in Hive

你们Hive生产上,压缩和存储,结合使用了吗?

案例:
原文件大小:19M
enter description here

Weiterlesen »

又又又是源码!RDD 作业的DAG是如何切分的?

Veröffentlicht am 2018-04-23 | Bearbeitet am 2019-05-15 | in Spark Core

我们都知道,RDD存在着依赖关系,这些依赖关系形成了有向无环图DAG,DAG通过DAGScheduler进行Stage的划分,并基于每个Stage生成了TaskSet,提交给TaskScheduler。那么这整个过程在源码中是如何体现的呢?

Weiterlesen »

Hive存储格式的生产应用

Veröffentlicht am 2018-04-20 | Bearbeitet am 2019-04-24 | in Hive

相同数据,分别以TextFile、SequenceFile、RcFile、ORC存储的比较。

原始大小: 19M

enter description here

Weiterlesen »

大数据压缩,你们真的了解吗?

Veröffentlicht am 2018-04-18 | Bearbeitet am 2019-04-24 | in Hadoop

若泽大数据,带你们剖析大数据之压缩!

Weiterlesen »

Hadoop常用命令大全

Veröffentlicht am 2018-04-14 | Bearbeitet am 2019-05-13 | in Hadoop

若泽大数据,Hadoop常用命令大全

Weiterlesen »

Spark2.2.0 全网最详细的源码编译

Veröffentlicht am 2018-04-14 | Bearbeitet am 2019-06-01 | in Spark Other

若泽大数据,Spark2.2.0 全网最详细的源码编译

Weiterlesen »

为什么我们生产上要选择Spark On Yarn模式?

Veröffentlicht am 2018-04-13 | Bearbeitet am 2019-06-01 | in Spark Other

若泽大数据,为什么我们生产上要选择Spark On Yarn?

Weiterlesen »

Hive全网最详细的编译及部署

Veröffentlicht am 2018-04-11 | Bearbeitet am 2019-05-13 | in Hive

若泽大数据,Hive全网最详细的编译及部署

Weiterlesen »

Hadoop全网最详细的伪分布式部署(MapReduce+Yarn)

Veröffentlicht am 2018-04-10 | Bearbeitet am 2019-04-24 | in Hadoop

若泽大数据,Hadoop全网最详细的伪分布式部署(MapReduce+Yarn)

Weiterlesen »

Hadoop全网最详细的伪分布式部署(HDFS)

Veröffentlicht am 2018-04-08 | Bearbeitet am 2019-04-24 | in Hadoop

Hadoop全网最详细的伪分布式部署(HDFS)

Weiterlesen »
1…141516

ruozedata

若泽数据优秀博客汇总
155 Artikel
31 Kategorien
74 schlagwörter
RSS
GitHub B站学习视频 腾讯课堂学习视频 官网
|
若泽数据
|