《中国人工智能学会通讯》——12.45 k-modes 型算法的类中心表示与收 敛性分析

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第12章,第12.45节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

12.45 k-modes 型算法的类中心表示与收 敛性分析

目前分类型数据的类中心表示方式有单值和多值两种。1998 年,Huang [4] 提出了 k-modes 算法,用 modes 来表示类中心,选择出现频率最高的值代表类,强调主流的属性值代表类,其他值为噪音,是典型的单值表示方式。单值表示方式由于简单易实现且聚类优化模型有很好的数学性质,保证了求解算法的收敛性,但它并不能充分刻画类的特性。San et al [17] 提出了多值表示类的方式,并应用于分类型数据的聚类。在该方法中,类是由每个属性上所有属性值来表示,并通过属性值在类内出现频率作为权值反映它对该类的代表能力,强调所有的值都对类有代表性,仅仅是代表能力不同。Kim et al [18] 将其扩展,提出了模糊 modes,并将其用于模糊 k-modes聚类算法。Lee 和 Pedrycz 提出了一种通用的多值类表示方式[19] ,类是由每个属性上属性值频率较高的前几个值来表示,通过属性值在类内出现频率作为权值反映它对该类的代表能力,强调部分的值被用于代表类,其他值为噪;其他基于频率的类中心表示方式都可以看作该方法的特例。

多值代表方法克服了单值代表方法的缺点,但却带来聚类算法的迭代收敛性无法保证,同时现有聚类优化算法仅在多值类表示方式退化为单值类表示方式时,才能保证算法的收敛性。为了解决这一问题,Bai et al [20] 研究了类的表示方式与聚类优化算法的收敛性关系,分析了现有多值类代表的聚类优化算法不能收敛的原因,构建了基于正则项的聚类优化模型,从根本上解决了多值类表示 k-modes型聚类算法的收敛性问题。

相关文章
|
1月前
|
机器学习/深度学习 人工智能 监控
AI算法分析,智慧城管AI智能识别系统源码
AI视频分析技术应用于智慧城管系统,通过监控摄像头实时识别违法行为,如违规摆摊、垃圾、违章停车等,实现非现场执法和预警。算法平台检测街面秩序(出店、游商、机动车、占道)和市容环境(垃圾、晾晒、垃圾桶、路面不洁、漂浮物、乱堆物料),助力及时处理问题,提升城市管理效率。
AI算法分析,智慧城管AI智能识别系统源码
|
1月前
|
算法
经典控制算法——PID算法原理分析及优化
这篇文章介绍了PID控制算法,这是一种广泛应用的控制策略,具有简单、鲁棒性强的特点。PID通过比例、积分和微分三个部分调整控制量,以减少系统误差。文章提到了在大学智能汽车竞赛中的应用,并详细解释了PID的基本原理和数学表达式。接着,讨论了数字PID的实现,包括位置式、增量式和步进式,以及它们各自的优缺点。最后,文章介绍了PID的优化方法,如积分饱和处理和微分项优化,以及串级PID在电机控制中的应用。整个内容旨在帮助读者理解PID控制的原理和实际运用。
87 1
|
1月前
|
机器学习/深度学习 算法
【优选算法】—— 滑动窗口类问题
【优选算法】—— 滑动窗口类问题
|
1月前
|
算法 机器学习/深度学习 索引
【算法设计与分析】——搜索算法
【算法设计与分析】——搜索算法
40 1
|
1月前
|
算法 调度
【算法设计与分析】— —基础概念题(one)可作为日常联系或期末复习
【算法设计与分析】— —基础概念题(one)可作为日常联系或期末复习
47 1
|
1月前
|
算法 C语言 C++
嵌入式PID算法理论+实践分析
嵌入式PID算法理论+实践分析
25 0
|
17小时前
|
算法 数据可视化 大数据
圆堆图circle packing算法可视化分析电商平台网红零食销量采集数据
圆堆图circle packing算法可视化分析电商平台网红零食销量采集数据
28 13
|
7天前
|
算法 数据可视化 Python
Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例
Python中LARS和Lasso回归之最小角算法Lars分析波士顿住房数据实例
11 0
|
7天前
|
算法 定位技术 Windows
R语言最大流最小割定理和最短路径算法分析交通网络流量拥堵问题
R语言最大流最小割定理和最短路径算法分析交通网络流量拥堵问题
13 4
|
30天前
|
算法
TOP-K问题和向上调整算法和向下调整算法的时间复杂度问题的分析
TOP-K问题和向上调整算法和向下调整算法的时间复杂度问题的分析
19 1

热门文章

最新文章