若泽大数据 www.ruozedata.com

ruozedata


  • 主页

  • 归档

  • 分类

  • 标签

  • 发展历史

  • Suche

03生产预警平台项目之hadoop-2.7.3编译和搭建集群环境(HDFS HA,Yarn HA)

Veröffentlicht am 2018-09-03 | Bearbeitet am 2019-05-26 | in 生产预警平台项目
Weiterlesen »

04生产预警平台项目之Flume Agent的3台收集+1台聚合到hdfs的搭建

Veröffentlicht am 2018-09-03 | Bearbeitet am 2019-05-28 | in 生产预警平台项目

【log收集】:
机器名称 服务名称 用户
flume-agent-01: namenode hdfs
flume-agent-02: datanode hdfs
flume-agent-03: datanode hdfs

【log聚合】:
机器名称 用户
sht-sgmhadoopcm-01(172.16.101.54) root

【sink到hdfs】:
hdfs://172.16.101.56:8020/testwjp/

Weiterlesen »

02生产预警平台项目之Flume-1.7.0源码编译导入eclipse

Veröffentlicht am 2018-08-28 | Bearbeitet am 2019-05-25 | in 生产预警平台项目
Weiterlesen »

这是一篇热腾腾的面经

Veröffentlicht am 2018-08-27 | Bearbeitet am 2019-06-11 | in 面试真题

伟梦:
1.主要还是项目?
基本上没问什么技术,我就说了一遍项目流程,
然后说几个优化点,比如上次讲的血案,我也顺带提了一下。
2.在大数据中,有没有什么是不足的,遇到过什么问题?

Weiterlesen »

01生产预警平台项目之项目概述

Veröffentlicht am 2018-08-27 | Bearbeitet am 2019-05-25 | in 生产预警平台项目

1.前期基本架构图

enter description here

2.最终基本架构图

enter description here

Weiterlesen »

spark中配置启用LZO压缩

Veröffentlicht am 2018-08-20 | Bearbeitet am 2019-06-01 | in Spark Other

Spark中配置启用LZO压缩,步骤如下:

一、spark-env.sh配置

1
2
3
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/app/hadoop-2.6.0-cdh5.7.0/lib/native
export SPARK_LIBRARY_PATH=$SPARK_LIBRARY_PATH:/app/hadoop-2.6.0-cdh5.7.0/lib/native
export SPARK_CLASSPATH=$SPARK_CLASSPATH:/app/hadoop-2.6.0-cdh5.7.0/share/hadoop/yarn/*:/app/hadoop-2.6.0-cdh5.7.0/share/hadoop/yarn/lib/*:/app/hadoop-2.6.0-cdh5.7.0/share/hadoop/common/*:/app/hadoop-2.6.0-cdh5.7.0/share/hadoop/common/lib/*:/app/hadoop-2.6.0-cdh5.7.0/share/hadoop/hdfs/*:/app/hadoop-2.6.0-cdh5.7.0/share/hadoop/hdfs/lib/*:/app/hadoop-2.6.0-cdh5.7.0/share/hadoop/mapreduce/*:/app/hadoop-2.6.0-cdh5.7.0/share/hadoop/mapreduce/lib/*:/app/hadoop-2.6.0-cdh5.7.0/share/hadoop/tools/lib/*:/app/spark-2.2.0-bin-2.6.0-cdh5.7.0/jars/*

二、spark-defaults.conf配置

1
2
spark.driver.extraClassPath /app/hadoop-2.6.0-cdh5.7.0/share/hadoop/common/hadoop-lzo-0.4.19.jar
spark.executor.extraClassPath /app/hadoop-2.6.0-cdh5.7.0/share/hadoop/common/hadoop-lzo-0.4.19.jar

注:指向编译生成lzo的jar包

Weiterlesen »

HDFS之垃圾回收箱配置及使用

Veröffentlicht am 2018-07-18 | Bearbeitet am 2019-05-19 | in Hadoop

HDFS为每个用户创建一个回收站:
目录:/user/用户/.Trash/Current, 系统回收站都有一个周期,周期过后hdfs会彻底删除清空,周期内可以恢复。

Weiterlesen »

Spark序列化,你了解吗

Veröffentlicht am 2018-07-16 | Bearbeitet am 2019-05-17 | in Spark Core

序列化在分布式应用的性能中扮演着重要的角色。格式化对象缓慢,或者消耗大量的字节格式化,会大大降低计算性能。通常这是在spark应用中第一件需要优化的事情。Spark的目标是在便利与性能中取得平衡,所以提供2种序列化的选择。

Weiterlesen »

Spark Streaming 状态管理函数,你了解吗

Veröffentlicht am 2018-06-25 | Bearbeitet am 2019-05-16 | in Spark Streaming
Weiterlesen »

Apache Spark和DL/AI结合,谁与争锋? 期待Spark3.0的到来!

Veröffentlicht am 2018-06-22 | Bearbeitet am 2019-05-15 | in Spark MLlib

enter description here

Weiterlesen »
1…101112…16

ruozedata

若泽数据优秀博客汇总
155 Artikel
31 Kategorien
74 schlagwörter
RSS
GitHub B站学习视频 腾讯课堂学习视频 官网
|
若泽数据
|