Giter VIP home page Giter VIP logo

focusbigdata's Introduction

FocusBigData

引子

夏季是阳光最为灿烂的季节,走在林间的小道上,看着地上斑驳的树影,闭上双眼感受清风拂面,用力呼吸着每一口自由的气息,也许只有在996福报之外,才能体会得到这种感觉吧,但这或许就是人生吧。

​ 哈哈瞎扯了一堆有的没的,下面开始进入正题,现在随着5G时代的到来,信息传输速率大幅提高,对个人来说只不过打开网页快了点,玩游戏延迟低了点,看视频完全不担心卡顿的问题,前提是办理更贵的5G套餐:smile:。但是对于企业来说这个提升,可以带来更高的生产力,带来更高的收益,

但信息传输速率提高,说明单位时间内获得的数据量比以往更多,说明单位时间内系统要承担更大的处理压力,如果没有好的大数据处理框架【框架就是解决方案】,那么信息只能是信息,而不是能带来收益的数据。

​ 现在有很多开发人员都在往大数据领域靠拢,大数据领域也确实是未来IT方向的一个热点或者说是风口。在招聘软件上,大数据岗位现在平均薪资约为25K左右,相比开发岗位大约高了百分之40左右,如果是中高阶的大数据架构师甚至可以达到百万薪资。但这诱人的薪资对于同学来说还有距离,但只要我们知道了这个距离具体是指哪些技能,然后努力去补齐这些技能,我相信大家也都能达到自己想要的目标。【愿与诸君共勉】

大家如果有什么问题,包括学习问题,大数据职业规划,简历书写和项目包装等问题都加我【微信focusbigdata】,或者到【公众号FocusBigData】后台留言给我,看到后都会给大家详细回答的。

🐘Hadoop分布存储框架

【源码是做成思维导图的方式,放在公众号里面,恢复hadoop思维导图 即可获得,思维导图部分展示如下】

🐬Spark分布式计算框架

🐦Flink分布式流式框架

​ 最近利用工作之余给给大家先更新了Hadoop、Spark、Flink三个大数据中最主要的框架,后面还陆续给大家跟新如下内容:【公众号第一时间发布文章,后面在同步到各个平台】

  • Hive数据仓库
  • Zookeeper分布式协调框架
  • HBase列式存储分布式数据库
  • Elasticsearch开源搜索引擎
  • Kafka消息队列
  • Flume数据传输框架
  • Sqoop数据传输框架
  • Azkaban调度框架
  • Kylin分析型数据仓库
  • Impala实时查询分析引擎
  • Hue大数据web管理器
  • Kudu列式存储分布式数据库
  • Kettle开源的ETL工具
  • DataX阿里开源ETL工具
  • ClickHouse开源列式数据库
  • Ambari大数据平台搭建利器
  • Ranger大数据权限管理利器
  • Airflow调度和监控工作流的平台
  • Griffin数据质量监控工具
  • Tableau大数据分析工具
  • Pulsar大数据分析工具
  • Atlas元数据治理工具
  • Filebeat数据采集工具
  • Saiku数据分析工具
  • Superset大数据可视化的利器
  • Sentry大数据权限管理框架
  • Zabbix集群监控工具
  • Zepplin数据交互可视化工具

数据仓库系列

【待更新】

  • 数据仓库概念
  • 数据仓库建模
  • 数仓分层
  • 数据集市和数据中台和数据仓库区别
  • 数据治理是什么
  • 项目技术选型
  • 系统数据流程设计
  • 服务器选型
  • 集群资源规划
  • 数据埋点设计
  • 数据采集设计
  • 电商业务术语和流程
  • 数据同步策略
  • 漏斗分析
  • 数据监控查询和可视化

大数据面试

可以关注公众号(FocusBigData)

回复大数据简历即可获得简历模板

回复大数据面经即可获得面经

回复大数据面试经历即可获得面经经历

福利

可以关注公众号(FocusBigData)

回复大数据学习路线图即可获得学习路线图

回复大数据书单即可获得相关书籍

回复数据仓库书单即可获得相关书籍

回复内功书单即可获得相关书籍

微信公众号

​ 文章也会同步到公众号中,福利也都放在公众号上面,回复对应关键词即可领取。在公众号后台也可以给我留言,或者直接加我私聊都行【图片加载不出来可以搜索:FocusBigData】

关于我

​ 说起来在工作中已经有一段时间没有使用大数据了,被我们总监拉去做人工智能【:cry:】,主要做图像识别和目标物体检测,然后装在tx2小车上跑,太多算法真的看的头都大了,而且关键之前我还没做过,只能硬着头皮学了机器学习和深度学习算法【所以大家想入门AI也可以找我,不过深入就不行了】,过程痛并快乐着,最后也能出了个模型【其实就是调参炼丹,懂的都懂】。未来我想做的技术还是大数据方向的,尤其是流式计算,后面我在星球中会有很大篇幅来讲流式计算,创作不易,希望大家支持一下,愿与诸君共勉。【可加我咨询,记得备注git】【图片加载不出来可以搜索:focusbigdata】

focusbigdata's People

Contributors

zhutiansama avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.