博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
大数据分析引擎Apache Flink升级成为Apache顶级项目
阅读量:6941 次
发布时间:2019-06-27

本文共 1142 字,大约阅读时间需要 3 分钟。

是一个高效、分布式、基于Java实现的通用大数据分析引擎,它具有分布式 MapReduce一类平台的高效性、灵活性和扩展性以及并行数据库查询优化方案,它支持批量和基于流的数据分析,且提供了基于Java和Scala的API。从Apache官方博客中,Flink已于近日升级成为Apache基金会的顶级项目。Flink项目的副总裁对此评论到:

\\

Flink能够成为基金会的顶级项目,自己感到非常高兴。自己认为社区的驱动将是Flink成长的最好保证。Flink逐渐的成长以及众多新人加入该社区真是一件大好事。

\\

从Flink官网得知,其具有如下主要特征:

\\

1. 快速

\\

Flink利用基于内存的数据流并将迭代处理算法深度集成到了系统的运行时中,这就使得系统能够以极快的速度来处理数据密集型和迭代任务。

\\

2. 可靠性和扩展性

\\

当服务器内存被耗尽时,Flink也能够很好的运行,这是因为Flink包含自己的内存管理组件、序列化框架和类型推理引擎。

\\

3. 表现力

\\

利用Java或者Scala语言能够编写出漂亮、类型安全和可为核心的代码,并能够在集群上运行所写程序。开发者可以在无需额外处理就使用Java和Scala数据类型

\\

4. 易用性

\\

在无需进行任何配置的情况下,Flink内置的优化器就能够以最高效的方式在各种环境中执行程序。此外,Flink只需要三个命令就可以运行在Hadoop的新MapReduce框架Yarn上,

\\

5. 完全兼容Hadoop

\\

Flink支持所有的Hadoop所有的输入/输出格式和数据类型,这就使得开发者无需做任何修改就能够利用Flink运行历史遗留的MapReduce操作

\\

Flink主要包括基于Java和Scala的用于批量和基于流数据分析的API、优化器和具有自定义内存管理功能的分布式运行时等,其主要架构如下:

\\

0116000.png

\\

更多关于Flink的相关信息,请读者登录其托管在和其官网查看。另外,开源的大数据分析平台除了Flink外,还包括Apache推出Google Dremel的开源版本(2014年12月份升级成为Apache基金会的顶级项目)、来自NSA(美国国家安全局)(2014年12月份贡献给Apache基金会)、来自公司开发的实时分析系统(受Google Dremel启发)、加州伯克利大学AMPLab开发的大数据分析系统、Facebook开源的分布式SQL查询引擎、开源的实时且类SQL的即时查询系统等等。

\

感谢对本文的审校。

\

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至。也欢迎大家通过新浪微博()或者腾讯微博()关注我们,并与我们的编辑和其他读者朋友交流。

转载地址:http://nbsnl.baihongyu.com/

你可能感兴趣的文章
实模式和保护模式(附i386/x86的由来)
查看>>
sql server DbHelperSQL类
查看>>
杭电 1874 畅通工程续 (求某节点到某节点的最短路径)
查看>>
PHP添加mongodb驱动的问题
查看>>
JS将秒转换为 天-时-分-秒
查看>>
CRUD
查看>>
Unity3D性能优化--- 收集整理的一堆
查看>>
数据库基础
查看>>
数组函数
查看>>
基础概要
查看>>
转-架构高性能网站秘笈(三)——浏览器缓存
查看>>
[SDOI2009][BZOJ 1876]SuperGCD
查看>>
TweenMax动画库学习(六)
查看>>
VueConf 全球首届Vue.js开发者大会资料整理
查看>>
多态 向上,向下转型
查看>>
Linux进程间通信——使用信号量
查看>>
C语言中带有返回类型的函数没有return语句的影响
查看>>
学习笔记之XML
查看>>
高性能js之js文件的加载与解析
查看>>
扭转二次大战战局的关键:雷达英雄传奇
查看>>