《中国人工智能学会通讯》——8.14 理论基础

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第8章,第8.14节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

8.14 理论基础

由于演化算法的启发性,往往缺乏理论的支持。演化算法在机器学习中的成功应用也多依赖于实验验证。然而机器学习领域对理论基础非常重视,演化学习理论基础的薄弱已成为其进一步发展的关键瓶颈。近年来,研究者们开始在演化学习的理论分析上取得进展。

文献 [33] 将集成剪枝形式化成一个二目标优化问题:image
其中 s ∈ {0,1} n 表示了所有基学习器的一个子集,每一位对应了一个特定的学习器,取值为 1 则该学习器被选择,取值为 0 则反之。第 1 个目标 f(s) 表示了当前学习器子集的泛化性能,常用验证集上的错误率来衡量;第 2 个目标 ||s|| 则是 s 中 1 的数目,即当前学习器子集的大小。引入局部搜索算子的一种简单多目标演化算法 PEP 被提出用于求解该二目标优化问题,在找到的 Pareto 最优解集中,拥有最小 f(s) 值的解被输出作为最终解。理论分析得出:相比以往基于单目标优化和基于排序的两大类集成剪枝方法,PEP 方法的优化性能更优,找到的学习器子集不仅可以获得更小的测试错误率,而且包含的学习器数目更少。

机器学习中的优化问题通常带有约束条件。通过将约束的违反程度视为另一个最小化目标,多目标演化算法可以去优化原始问题的二目标形式,即优化原始目标函数和最小化约束违反程度。在包括最小生成树[34] 、最小割问题 [35] 、最小代价覆盖 [36]等若干组合优化问题上的理论分析,已经显示出演化算法求解带约束优化问题的优势。受此启发,演化算法被成功应用于求解子集选择问题,其性能在理论上有严格保证[37-38] 。

子集选择(subset selection)问题旨在从给定的 n 个变量中选择一个大小不超过 k 的变量子集使某个给定的目标最优化,其形式化为image
子集选择问题出现在各种各样的应用中,比如属性选择、稀疏学习、压缩感知等。文献 [37] 将其转化为一个显示的二目标优化问题:image
进而提出一种简单多目标演化算法 POSS 去求解该问题,最后在找到的一组 Pareto 最优解中,将满足子集大小约束的最优解输出作为原始约束优化问题的解。在子集选择问题的代表实例稀疏回归上的理论分析和实验验证,均显示出 POSS 方法的优越性能。文献 [38] 进一步提出了 POSS 方法的并行化版本,其在保证解的质量不变的前提下,在运行时间上几乎获得了关于处理器数目的线性加速比。

相关文章
|
机器学习/深度学习 人工智能 自然语言处理
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口
第五届世界互联网大会正在如火如荼的举行。
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口
|
机器学习/深度学习 人工智能 自然语言处理
阳过→阳康,数据里的时代侧影;谷歌慌了!看各公司如何应对ChatGPT;两份优质AI年报;本周技术高光时刻 | ShowMeAI每周通讯 #003-12.24
这是ShowMeAI每周通讯的第3期。本期内容关键词:新冠、ChatGPT、2022 AI 报告、腾讯·绝悟、阿里·AliceMind、小红书·全站智投、OpenAI·Point-E、Google·CALM、Wayve·MILE、AI2·MemPrompt、Stanford x MosaicML·PubMed GPT、腾讯全员大会、特斯拉裁员、图森未来裁员、AI 应用与工具大全。
466 0
阳过→阳康,数据里的时代侧影;谷歌慌了!看各公司如何应对ChatGPT;两份优质AI年报;本周技术高光时刻 | ShowMeAI每周通讯 #003-12.24
|
机器学习/深度学习 人工智能 自然语言处理
与世界同行 2017中国人工智能大会有感
与世界同行 2017中国人工智能大会有感
1542 0
与世界同行 2017中国人工智能大会有感
|
人工智能 自动驾驶
2019年上半年收集到的中国人工智能发展详情文章
2019年上半年收集到的中国人工智能发展详情文章
|
人工智能 芯片
中国人工智能计划,我来说几句
中国人工智能计划,我来说几句
|
机器学习/深度学习 人工智能 自然语言处理
2022 年中国人工智能行业发展现状与市场规模分析 市场规模超 3000 亿元
人工智能产业是智能产业发展的核心,是其他智能科技产品发展的基础,近年来,中国人工智能产业在政策与技术双重驱动下呈现高速增长态势。
1565 0
2022 年中国人工智能行业发展现状与市场规模分析 市场规模超 3000 亿元
|
数据采集 人工智能 智能设计
Nat. Biotechnol. | 人工智能药物研发在中国蓬勃发展
Nat. Biotechnol. | 人工智能药物研发在中国蓬勃发展
632 0
Nat. Biotechnol. | 人工智能药物研发在中国蓬勃发展
|
机器学习/深度学习 人工智能 监控
中国95后流行色是什么?人工智能给出的答案是它
中国 95 后的流行色是什么?人工智能说是 RGB 值为 22/20/24 的「黑色」。
509 0
中国95后流行色是什么?人工智能给出的答案是它
|
机器学习/深度学习 人工智能 自然语言处理
机器之心选出全球最值得关注的100家人工智能公司(中国27家),同时这是一个开源项目
机器之心和 Comet Labs 联合发布了影响全球人工智能公司的榜单。我们选取了基础研究、技术和产品、行业潜力、公司运营能力、资本实力等五个维度,甄选出了全球范围内最具前途的 100 家人工智能公司,它们包括那些我们已经熟知的科技巨头,垂直行业独角兽,也有尚在萌芽的初创公司。 当然,这份榜单肯定没有做到尽善尽美,也存在 100 家的名额限制,但我们坚信,这份基于我们诚意、内容经验和专业判断的不存在任何商业利益的榜单可以为大家总结和精炼出一些有价值的信息,带给大家灵感和启发。
451 0
机器之心选出全球最值得关注的100家人工智能公司(中国27家),同时这是一个开源项目
|
机器学习/深度学习 人工智能 自然语言处理
AI 2000人工智能全球最具影响力学者揭晓,中国正在快速追赶美国
AI 2000人工智能全球最具影响力学者揭晓,中国正在快速追赶美国
AI 2000人工智能全球最具影响力学者揭晓,中国正在快速追赶美国