蒋晓伟 + 关注
阿里搜索技术专家

蒋晓伟 参与了问答:

【问题整理】使用Blink后,为阿里带来哪些好处?

使用Blink后,为阿里带来哪些好处?

“更大的灵活性,更高的开发效率,流和批共享一套代码和更高的性能”

蒋晓伟 参与了问答:

【问题整理】我想更多了解Blink的信息,在哪里可以看到它的动态?

【问题整理】我想更多了解Blink的信息,在哪里可以看到它的动态?

“可以关注一下Apache Flink。我们将会merge回社区”

蒋晓伟 参与了问答:

流和表的转换问题

在流转换成表的计算中,多次的撤销之前的计算结果会有什么隐患/问题?

“撤销需要算子的支持才能work,有些算子要实现撤销的语义是成本比较高的”

蒋晓伟 参与了问答:

是否可以鉴于blink,开发一套用于旅游搜索的引擎?

开发一个旅游综合计算引擎的建议

“blink适合于做实时数据处理,而不是查询”

蒋晓伟 参与了问答:

关于blink

请问blink开源了吗?有没有github repo

“后续将会merge回Apache Flink”

蒋晓伟 参与了问答:

flink实时计算性能比spark高多少?

flink实时计算性能比spark高多少?

“spark streaming最短只能做到几秒的延迟,再短就追不上了。所以在低延迟的场景Flink有明显的性能优势。在高延迟的场景区别会变小”

蒋晓伟 参与了问答:

flink是否有类似shuffle的过程

flink是否有类似shuffle的过程 如果有如果节点挂了 shuffle到这个节点的数据怎么获取

“有shuffle的过程,如果节点失败了,上游的节点也会会退到上个checkpoint,从而获取到数据”

蒋晓伟 参与了问答:

双流怎样jion的

时间差的问题是怎么解决的

“由于Blink支持状态,所以可以把出现的消息记录到状态里,来一条消息的时候可以查状态找到需要的消息”

蒋晓伟 参与了问答:

Blink是阿里独创的吗?

Blink是阿里独创的吗?基于什么样的想法创造出来的呢?

“是阿里基于Apache Flink开发的,后续会merge回Flink社区”

蒋晓伟 参与了问答:

有没有对比调研storm

有没有对比调研storm

“storm的API更底层一些,没有高层的DataStream API和SQL层。也没有exactly once语义的支持。另外storm只支持流处理,不支持批处理”

蒋晓伟 参与了问答:

streamingSQL

Blink的Streaming SQL呢?

“Blink的流处理和批处理都支持SQL和TableAPI”

蒋晓伟 参与了问答:

阿里主要用Java改写Flink和写基于Blink的应用?

Blink方面,主要采用什么语言和规范。目前主要有什么成果或者应用

“Blink和Flink本身的代码都是Java和Scala写的”

蒋晓伟 参与了问答:

Blink的最优应用场景是什么?有什么替代品?

“高吞吐,低延迟,复杂的流计算场景”

蒋晓伟 参与了问答:

flink对sql的支持怎么样?

flink对sql的支持怎么样?

“Blink支持了大部分SQL的语法,后续会反馈回社区”

蒋晓伟 参与了问答:

blink现在可以直接部署到hadoop吗

blink现在可以直接部署到hadoop吗

“可以的,blink对Hadoop Yarn有原生态的支持”

蒋晓伟 参与了问答:

Blink 对状态的copy(从本机到HDFS)是异步的,怎样保证exactly once了?

如果copy是异步的,怎样保证exactly once了?--稍微修改了标题

“异步的copy都完成了以后那个checkpoint才算成功,我们只会回滚到成功的checkpoint”
2014年底加入阿里,现在负责搜索工程的数据团队。在加入阿里前曾经就职于西雅图的脸书。负责过调度系统,Timeline Infra和Messenger的项目。在微软的SQL Server引擎担任过Principal Engineer,负责关系数据库的架构工作

感兴趣or擅长的领域:

暂无
更多>
更多>
zz2019
zz2019
文章:0丨 粉丝:2丨 话题:0
蜗牛_colnew
蜗牛_colnew
文章:0丨 粉丝:0丨 话题:0
千起
千起
文章:0丨 粉丝:0丨 话题:0
程齐凯
程齐凯
文章:0丨 粉丝:0丨 话题:0
无形的云
无形的云
文章:0丨 粉丝:2丨 话题:0
niaoshuai
niaoshuai
文章:1丨 粉丝:1丨 话题:0