《中国人工智能学会通讯》——12.22 激励机制

  1. 云栖社区>
  2. CCAI>
  3. 博客>
  4. 正文

《中国人工智能学会通讯》——12.22 激励机制

知与谁同 2017-09-04 16:45:00 浏览1063

12.22 激励机制

对于一项指定的时空众包任务,众包平台应能够有效激励足够多的众包参与者完成此任务,这类研究被称为激励机制研究。时空众包应用中的激励方式以金钱激励为主,因此激励机制设计问题又可视为定价问题,即为某一时空众包任务设定合理价格。激励机制的相关研究,主要包括基于拍卖的激励机制和基于多臂赌博机 (Multi-armed Bandit) 的激励机制。

(1)基于拍卖理论的激励机制拍卖理论[33]是博弈论的分支,研究拍卖的性质和拍卖活动中人的行为。在拍卖过程中,卖家和买家对商品价格进行协商,并最终达成共识。在传统的拍卖中,竞标者通过出价竞争购买某一商品,价高者得。而在时空众包激励机制的研究中,反向拍卖模型更受青睐。在反向拍卖中,竞标者通过开价竞争执行某项任务,价低者得。基于反向拍卖并针对不用时空众包应用场景,研究人员还提出了在线拍卖、多属性拍卖、组合拍卖、全付拍卖、双向拍卖、VCG 拍卖等拍卖模型[34] 。

(2)基于多臂赌博机的激励机制多 臂 赌 博 机 (Multi-armed Bandit) 模 型[35]是在线学习 (Online Learning) 研究领域中的一个重要模型。该模型假设存在一个多臂赌博机 , 每摇其中一个臂 , 就可根据该臂相关的某概率分布获得收益。该模型的一个变种为上下文的多臂赌博机(Contextual Multi-armed Bandit),其摇臂收益所依从的概率分布和某上下文信息 X 以及某一未知参数θ 有关。使用该模型对众包任务进行定价,上下文信息 X 包含众包参与者和任务的时空属性以及价格信息,将参与者对任务的接受率视为摇臂收益,则可通过学习未知参数并根据 θ 对任务进行定价。