干货满满,阿里天池CIKM2017 Rank4比赛经验分享

简介:

这次比赛吸引了1395支队伍参赛,排行榜也已在阿里天池平台进行公示。

在这次比赛中,来自中国科学院的怀北村明远湖队(队员Zhang Rui, Qiao Fengchun, Guo Ran)在GitHub上分享了自己的代码和方法,他们在第一阶段获得第三名,第二阶段获得第四名。雷锋网 AI科技评论将他们发布的内容进行了整理,如下:

背景介绍

在这次比赛中,主办方提供了一组不同时间跨度(间隔为6分钟,共15个时间跨度)和不同高度下(0.5km、1.5km、2.5km、3.5km)测量的雷达图,每个雷达图都包含目标站点和目标站点周围区域的雷达反射率值。每个雷达图覆盖以目标站点为中心,面积为101 * 101平方公里的区域。该区域被标记为101×101格,目标站点位于中心,即(50,50)。

数据集中包含真实的雷达图和气象观测中心收集到的目标站点降水量。

比赛的任务是预测在未来1-2个小时内每个目标站点的总降雨量。

干货满满,阿里天池CIKM2017 Rank4比赛经验分享

数据处理过程

Percentil Method百分位数法

他们采用统计的方法来降低雷达数据的维度。对于每个雷达图,他们对目标站附近到整个地图范围内不同大小的区域都选取了雷达反射率值的25、50、75、100百分位。

干货满满,阿里天池CIKM2017 Rank4比赛经验分享

图:以目标站点为中心选取不同的区域

Wind法

他们首先将原始数据(15*4*101*101)压缩成稍小的数据(15*4*10*10),然后通过判断风向,将数据压缩到15*4*6*6个特征。整个预处理过程都是利用卷积神经网络的方法,特别是卷积运算和最大池化。

干货满满,阿里天池CIKM2017 Rank4比赛经验分享

图:卷积计算表征

干货满满,阿里天池CIKM2017 Rank4比赛经验分享

图:池化计算表征

他们利用第四层的数据来判断风向。然后,为了计算最终风向,用两种方法来选择有代表性的数据。第一种方法在每10*10单元中使用最大的值作为表征,第二种方法则采用最大的5个数据的平均值作为表征。

在选出有代表性的数据之后,通过每两个时间间隔之间数据的偏差值算出移动方向,最终基于给定的阈值统计不同移动方向的数目,按照数目最多移动方向的确定最终风向。

干货满满,阿里天池CIKM2017 Rank4比赛经验分享

图:当风向为西、西北、西南时提取特征的方法

模型

在这次任务中,他们的模型结合了Random Forestry、XGBoost和双向GRU单元(Bidirectional Gated Recurrent Unit)等,得出了较为满意的结果。

运用的工具

Python 3.6

Keras

XGBoost

Sklearn

他们的代码:https://github.com/zxth93/CIKM_AnalytiCup_2017




本文作者:思颖
本文转自雷锋网禁止二次转载, 原文链接
目录
相关文章
|
7月前
|
机器学习/深度学习 人工智能
如果 AI 也能参加亚运会,TA 会在什么项目上大放异彩?
如果 AI 也能参加亚运会,TA 会在什么项目上大放异彩?
42 0
|
10月前
|
人工智能 自然语言处理 开发工具
魔搭社区首届AI编程马拉松大赛,启动报名
魔搭社区首届AI编程马拉松大赛,启动报名
157 0
|
人工智能 搜索推荐 TensorFlow
阿里云PAI-DeepRec CTR 模型性能优化天池大赛——获奖队伍技术分享
超硬核解题思路快来看看吧!本期邀请“创新大师杯”全球AI极客挑战赛——PAI-DeepRec CTR模型性能优化挑战赛获奖队伍分享解题思路,共同推动实际工业实际场景中点击率预估模型的训练效率的提升。
揭秘CCF国际AIOps挑战赛选手背后的“武林神器”
CCF国际AIOps挑战赛揭秘选手背后的“武林神器”
985 0
揭秘CCF国际AIOps挑战赛选手背后的“武林神器”
|
人工智能 算法 大数据
AI:互联网程序设计竞赛之蓝桥杯大赛的简介、奖项设置、大赛内容以及蓝桥杯与ACM(ICPC)的四个维度对比之详细攻略
AI:互联网程序设计竞赛之蓝桥杯大赛的简介、奖项设置、大赛内容以及蓝桥杯与ACM(ICPC)的四个维度对比之详细攻略
AI:互联网程序设计竞赛之蓝桥杯大赛的简介、奖项设置、大赛内容以及蓝桥杯与ACM(ICPC)的四个维度对比之详细攻略
|
机器学习/深度学习 编解码 城市大脑
【比赛推送】KDD 2021/ Kaggle 顶级赛事等你来排位
【比赛推送】KDD 2021/ Kaggle 顶级赛事等你来排位
436 0
【比赛推送】KDD 2021/ Kaggle 顶级赛事等你来排位
|
机器学习/深度学习
重磅!吴恩达、林轩田公开课交流群正式成立啦
重磅!吴恩达、林轩田公开课交流群正式成立啦
144 0
重磅!吴恩达、林轩田公开课交流群正式成立啦
|
机器学习/深度学习 人工智能 自然语言处理
从700多支队伍脱颖而出,知乎这个算法大赛冠军这样让大V「谢邀」答题
鸽了多日的知乎大 V 为何频频「谢邀」?潜水多年的小白为何突然开始积极回答?昨日,智源-看山杯专家发现算法大赛正式落幕。机器之心带你走进冠军算法,揭秘什么样的方法能让系统准确邀请到答题者回答问题。
235 0
从700多支队伍脱颖而出,知乎这个算法大赛冠军这样让大V「谢邀」答题
|
机器学习/深度学习 人工智能 自然语言处理
Competition——AI:国内外人工智能比赛平台以及竞赛类型、竞赛题目、举行时间等之详细攻略(最全+ing)
Competition——AI:国内外人工智能比赛平台以及竞赛类型、竞赛题目、举行时间等之详细攻略(最全+ing)
Competition——AI:国内外人工智能比赛平台以及竞赛类型、竞赛题目、举行时间等之详细攻略(最全+ing)
|
机器学习/深度学习 人工智能 自然语言处理
Competition——AI:国内外人工智能比赛平台以及竞赛类型、竞赛题目、举行时间等之详细攻略(最全+ing)(一)
Competition——AI:国内外人工智能比赛平台以及竞赛类型、竞赛题目、举行时间等之详细攻略(最全+ing)