Hive生产上，压缩和存储结合使用案例

Veröffentlicht am 2018-04-23 | Bearbeitet am 2019-05-13 | in Hive

你们Hive生产上，压缩和存储，结合使用了吗？

案例：
原文件大小：19M
enter description here

又又又是源码！RDD 作业的DAG是如何切分的？

Veröffentlicht am 2018-04-23 | Bearbeitet am 2019-05-15 | in Spark Core

我们都知道，RDD存在着依赖关系，这些依赖关系形成了有向无环图DAG，DAG通过DAGScheduler进行Stage的划分，并基于每个Stage生成了TaskSet，提交给TaskScheduler。那么这整个过程在源码中是如何体现的呢？

Veröffentlicht am 2018-04-20 | Bearbeitet am 2019-04-24 | in Hive

相同数据，分别以TextFile、SequenceFile、RcFile、ORC存储的比较。

原始大小: 19M

enter description here

Veröffentlicht am 2018-04-18 | Bearbeitet am 2019-04-24 | in Hadoop

若泽大数据，带你们剖析大数据之压缩！

Veröffentlicht am 2018-04-14 | Bearbeitet am 2019-05-13 | in Hadoop

若泽大数据，Hadoop常用命令大全

Veröffentlicht am 2018-04-14 | Bearbeitet am 2019-06-01 | in Spark Other

若泽大数据，Spark2.2.0 全网最详细的源码编译

Veröffentlicht am 2018-04-13 | Bearbeitet am 2019-06-01 | in Spark Other

若泽大数据，为什么我们生产上要选择Spark On Yarn？

Veröffentlicht am 2018-04-11 | Bearbeitet am 2019-05-13 | in Hive

若泽大数据，Hive全网最详细的编译及部署

Veröffentlicht am 2018-04-10 | Bearbeitet am 2019-04-24 | in Hadoop

若泽大数据，Hadoop全网最详细的伪分布式部署(MapReduce+Yarn)

Veröffentlicht am 2018-04-08 | Bearbeitet am 2019-04-24 | in Hadoop

Hadoop全网最详细的伪分布式部署(HDFS)