9.19 应 用
我们利用 LDL 已经解决了大量实际问题。这一过程中,最为关注的问题之一在于标记分布数据的获取。其中,有的标记分布来源于先验知识[11-12] ;有的标记分布直接来源于数据本身[13-14] ;有的标记分布是从数据中学习得来的[15-16] 。
作为最早的一个应用,首先将 LDL 用于人脸年龄估计[11] 。对于人脸年龄估计,其最大的问题在于缺少充足且完整的训练数据。考虑到人脸的老化是一个缓慢、渐进的过程,引入了一种特殊的标记分布:描述度在实际年龄上最高,并逐渐向其两边相邻年龄递减。通过产生标记分布,一张图像既可用于学习其真实年龄,也可用于学习相邻年龄,从而一定程度上缓解了训练集不足的问题。
接着将 LDL 用于头部姿态估计[12] 。与年龄的特点类似,头部姿态的变化也是一个连续、渐变的过程,据此可以为每张头部图像生成一个二维(考虑水平转动和垂直转动两个角度的姿态)标记分布,其中真实姿态的描述度最高,相邻姿态描述度随着其与真实姿态的距离增大而逐渐减小。这样生成的标记分布可以看作当前图像头部姿态的一个软描述,从而缓解了人工标记的姿态不够精确的问题。
进一步将 LDL 用于电影上映前的评分分布预测问题[13] 。与传统推荐系统不同,我们通过大众过去对电影的评分数据,将所有观众对一部电影的评分记录转化为一个标记分布,即以评分为标记,以各个评分的人数所占比例作为当前评分的描述度,利用 LDL 算法对转化后的数据集进行学习,并利用学习到的 LDL 模型对电影上映后的观众评分分布进行预测。
接下来,将 LDL 用于面部表情情感分布识别问题[14] 。与现有的大多数表情识别方法中认为一种表情只包含单一情感的假设不同的是,在我们的工作中,假设面部表情是由多种情感混合而成,各个情感都对当前表情具有一定的贡献度。在此基础上,引入 LDL 算法,较好地解决了面部表情多情感混合的问题。
此外,LDL 也被用于求解 MLL 问题。当前的MLL 算法假设每个相关标记都具有相同的重要度,而正如前文分析可知,在现实中,标记的重要度往往是不尽相同的。为了解决 MLL 算法中普遍存在的该问题,我们提出通过迭代标记传播过程,为每个训练样例产生标记重要度分布信息,并通过 LDL 学习该重要度分布信息,从而更好地求解MLL问题[15] 。
最后还将 LDL 用于自然场景图像多标记排序问题中[16] 。为了解决对同一幅自然场景图像,各个排序源给出的多标记排序的不一致性,通过一个称为“偏好分布转化”的过程,将多条不一致源给出的排序记录转化为一个统一的偏好分布。在该分布中,多数人认为重要(即排在前面)的标记描述度也较高,而少数人认为重要的标记也有一定描述度,而不是像常用的多数投票法等去不一致方法中那样被完全忽略掉。为每一幅图像生成相应的偏好分布后,就可以利用 LDL 学习该偏好分布,整个过程既保证了多数人的主流意见,又照顾了少数人的特殊意见,因此预测出的标记排序结果具有更广泛的满意度。