例如:
有一个视频播放日志,格式为:user_id,video_id,play_duration,video_duration,country,request_date
我想计算:
A.最后一分钟的比赛次数
B.今天的比赛数量
C.在过去一小时内排名前10的最受欢迎的视频(播放时间)
D.在过去一小时内排名前10的最活跃用户(游戏时间)
在上述4个任务中,它们使用相同的源,但具有三个不同的时间窗口。是否有任何有效的解决方案来完成这些工作,而无需启动3或4个工作来复制消耗。
您可以使用单个作业以4种方式拆分流,然后将其中一个窗口运算符附加到每个复制的流中。您可以使用分割/选择或侧输出进行分割。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。