收藏 分享(赏)

Flink技术分享PPT.pptx

上传人:吉祥草 文档编号:2728914 上传时间:2020-08-23 格式:PPTX 页数:11 大小:1.34MB
下载 相关 举报
Flink技术分享PPT.pptx_第1页
第1页 / 共11页
Flink技术分享PPT.pptx_第2页
第2页 / 共11页
Flink技术分享PPT.pptx_第3页
第3页 / 共11页
Flink技术分享PPT.pptx_第4页
第4页 / 共11页
Flink技术分享PPT.pptx_第5页
第5页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、Flink介绍和就业情况分析 目录 1 Flink简介 2 Flink应用场景 3 Flink基础架构 4 大数据行业就业情况 Flink简介 Flink介绍:分布式流处理框架 Flink的优点:能实现高吞吐,低延迟,能处理批数据和流数据 Flink应用场景 (1)实时智能推荐场景 对用户购买行为的历史数据分析,通过推荐模型,预测用户可能会购买哪些商品,然后实时推荐商品给用户; (2)实时报表分析 实时报表分析是近年来很多公司采用的报表统计方案之一,其中最主要的应用便是实时大屏展示。利用流式计算实时得出 的结果直接被推送到前端应用,实时显示出重要指标的变换情况。最典型的案例便是淘宝的双十一活动

2、,每年双十一购物节, 除疯狂购物外,最引人注目的就是天猫双十一大屏不停跳跃的成交总额。 (3)我们自己的用法 Flink的基础架构 Flink程序结构 step01: 获得flink的执行环境(Execution Environment) step02: 加载或创建初始数据源 (Source) step03: 对数据集执行转换处理 (Transformation) step04: 指定输出结果位置 (Sink) step05: 指定任务名称并处触发任务执行 获得flink执行环境的三种方式介绍 1、StreamExecutionEnvironment.getExecutionEnvironme

3、nt (自动识别获取本地还是集群flink环境 ) 2、StreamExecutionEnvironment.createLocalEnvironment (获取本地flink环境) 3、StreamExecutionEnvironment.createRemoteEnvironment (获取集群flink环境) Flink程序结构-01获得flink的执行环境 (1)基于文件File的数据源: readTextFile(path) (2)基于集合的数据源: fromCollection(seq) (3)第三方数据源: kafka、mq等数据源 Flink程序结构-02加载或创建初始数据源

4、(1)Map算子:DataStream DataStream:输入一个参数产生一个参数 (2)FlatMap算子:DataStream DataStream:输入一个参数,产生0个、1个或者多个输出; (3)Filter算子:DataStream DataStream:结算每个元素的布尔值,并返回布尔值为true的元素; (4)KeyBy算子:DataStream KeyedStream:输入必须是Tuple类型,在内部以hash的形式实现的。 . Flink程序结构-03对数据集执行转换处理 (1)输出到文本文件:writeAsText (2)以CSV的格式输出:WriteAsCsv (3)直接打印到控制台:print (4)输出到redis,kafak的地方 Flink程序结构-04加载或创建初始数据源 大数据行业就业情况

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 网络技术 > 热门技术

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报