Flink是什么

  • Flink是一个分布式计算引擎 MapReduce Spark Storm

    • 同时支持流计算和批处理

    • 和Spark不同, Flink是使用流的思想做批, Spark是采用做批的思想做流

  • Flink的优势

    • 和Hadoop相比, Flink使用内存进行计算, 速度明显更优

    • 和同样使用内存的Spark相比, Flink对于流的计算是实时的, 延迟更低

    • 和同样使用实时流的Storm相比, Flink明显具有更优秀的API, 以及更多的支持, 并且支持批量计算

  • 速度

    • 在单机上, Storm大概能达到30万条/秒的吞吐量, 这个数据大概是Storm得3-5倍.在阿里中,Flink集群能达到每秒能处理17亿数据量,一天可处理上万亿条数据

    • 一天的数据量有多大?(数据的条数/数据占用的磁盘空间)

    • 10亿条数据,一条数据1KB 20亿Kb 20 00GMB 6/亿, 400G

    • 在单机上, Flink消息处理的延迟大概在200毫秒左右, 这个数据大概是Spark的3-5倍

Flink的发展现状

14年Apache立为顶级项目.阿里15年开始使用

  • Flink在很多公司的生产环境中得到了使用, 例如: ebay, 腾讯, 阿里, 亚马逊, 华为等

  • Blink

Flink的母公司被阿里全资收购, 阿里一直致力于Flink在国内的推广使用

Flink的适用场景

  • 零售业和市场营销(运营)

  • 物联网(5G,无限流量,延迟低/打游戏,无人驾驶)

  • 电信业,

  • 银行和金融业,

项目外包,人员外包

对比Flink、Spark、Storm

Flink、Spark Streaming、Storm都可以进行实时计算,但各有特点

 

版权声明:本文为alexzhang92原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/alexzhang92/p/11032285.html