2 为集群搭大数据情况(一般公司招大数据工程师情况都已经搭好了公司内部会有现成的大数据平台);
8 数据可视化(这个我司是用 Spring Boot 毗连后台数据与前端前端用自己魔改的 echarts)
5 应用迁移(有部门公司需要把应用从传统的数据库 Oracle、MySQL 等数据库的存储历程法式或者SQL剧本迁移到大数据平台上这个历程也是很是繁琐的事情高度重复且庞大)
11 搭建数据堆栈(这里的数据堆栈的搭建不是指 Hive Hive 是搭建数仓的工具数仓搭建一般会分为三层 ODS、DW、DM 层其中DW是最重要的它又可以分为DWD,DWM,DWS这个层级只是逻辑上的观点类似于把表名根据层级区离开来的操作分层的目的是防止开发数据应用的时候直接会见底层数据可以淘汰资源注意淘汰资源开销是淘汰 内存 和 CPU 的开销分层后磁盘占用会大大增加磁盘不值钱所以没什么关系分层可以使数据表的逻辑越发清晰利便进一步的开发操作如果分层没有做好会导致逻辑杂乱新来的员工难以接手业务提高公司的运营成本另有这个建数仓也分为建离线和实时的)
综上就是大数据工程师平常的事情内容了经由我们比力发现最离不开的就是基础所以不管学习什么都要注重基础打好基础!
4 数据迁移(有部门公司需要把数据从传统的数据库 Oracle、MySQL 等数据迁移到大数据集群中这个是比力繁琐的事情);
现在我们经常听到大数据这个词汇大数据作为IT行业的“新宠”备受接待许多人想转行大数据那么你们相识大数据工程师的日常吗?一起来看看叭~
9 大数据平台开发(偏Java偏向的或许就是把开源的组件整合起来整成一个可用的大数据平台这样常见的是种种难用的 PaaS 平台)
7.1 离线数据处置惩罚(这个一般就是写写 SQL 然后扔到 Hive 中跑其实和第一点有点重复了)
3 维护大数据平台(这个应该是每个大数据工程师都做过的事情或多或少会负担“运维”的事情);
1 写 SQL :一般来说许多入职一两年的大数据工程师主要的事情就是写 SQL ;
7.2 实时数据处置惩罚(这个涉及到消息行列KafkaSparkFlink 这些组件一般就是 Flume 收罗到数据发给 Kafka 然后 Spark 消费 Kafka 的数据举行处置惩罚)
10 数据中台开发(中台需要支持接入种种数据源把种种数据源清洗转换为可用的数据然后再基于原始数据搭建起宽表层一般为了节约开发成本和服务器资源都是基于宽表层查询出业务数据)
6 数据收罗(收罗日志数据、文件数据、接口数据这个涉及到种种花样的转换一般用得比力多的是 Flume 和 Logstash)
7 数据处置惩罚
本文来源:亚搏手机版app下载体育官网-www.ghtcm.com
Copyright © 2008-2022 www.ghtcm.com. 亚搏手机版app下载体育官网科技 版权所有 备案号:ICP备43042341号-8