为什么说产品经理都该懂一点机器学习？

2018-01-26 1468

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

本文来自AI新媒体量子位（QbitAI）

一个普通（移动）互联网公司的产品经理，也需要懂机器学习？Quora的产品设计师Abhinav Sharma说，几乎所有设计师都需要对机器学习有一个基本的了解。

Quora虽然只是个问答网站，但机器学习技术至关重要，个性化订阅邮件、主页信息流、主题推荐、问题推送、垃圾信息过滤等方面，都用了这种技术。

先说明一点，在Quora，产品设计师和产品经理的只能有着很多重叠，我们就都叫产品经理（PM）好了。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

在阅读下文之前，请先把自己想象成一个这样的人：

你的日常工作，就是各种风格、网格、布局、色彩，以及设计能够在整个网站上重复使用的模式。

你在什么地方会用到机器学习呢？

垃圾信息/质量控制系统

垃圾信息过滤器的基础是机器学习的一个基本模型：分类。分类器使用以往的数据来添加标签，判断某条内容属于垃圾信息还是正常信息。

这种系统都会犯错，有的会把善意内容归入垃圾信息（假阳性），还有的则会放过垃圾信息（假阴性）。多类别分类也是一样。

为了更好的用户体验，产品经理需要对假阳性和假阴性的情况做处理。

当某些正常内容被误标为垃圾信息时，你需要考虑的是用户会担心错过信息，或者是不是应该适时提醒他们“查看一下垃圾邮件”。

当垃圾信息被放过的时候，你需要担心的是如何向用户解释，并给他们提供反馈通道，然后处理这些问题。

通知

通知可以大幅提升互动性，对人们的行动提供反馈，但这些系统很难设计。

随着公司规模扩大，往往要开发一套系统，让不同的团队可以制作不同的电子邮件或通知，以便发送给用户。而根据之前的互动和目前的带宽，分类器则负责决定是否发送邮件。LinkedIn的邮件优化框架（http://www.kdd.org/kdd2016/papers/files/adf0710-guptaA.pdf）便是其中一例。

这类系统也存在着假阳性和假阴性的问题，在下面两种场景下出现的问题尤其值得产品经理注意：

如果我关注的某人对我的回答进行了评论，这是个非常重要的信号，我肯定希望知道，即便我没有时间回应很多其他评论。
与很早以前发表的答案相比，我可能更关心最近发表的答案所获得的反馈。

如果不想因为错过信息和失去用户信任而忧心忡忡，那就必须知道用户何时渴望确定性关系，知道系统在什么时候无法承受假阳性。

通常而言，可以用一套规则集来规定我们需要的行为，来增强机器学习系统。事实上，有很多方式对“规则”进行编码，并融入实际的机器学习系统之中。

另外，有的产品未解决这类问题走到了极端，用异常复杂的规则集完全取代了机器学习，借此来建造一个他们完全信任的系统。例如，Slack用户就利用这个流程图来判断是否向你发送通知：

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

信息流排序

与Twitter不同，Facebook、Quora和Netflix的的主页信息流并非按照时间顺序排列，而是根据相关性排序。这就引出了我们的第一个回归问题，机器学习算法需要尝试预测你喜欢某条内容的概率。概率在0和1之间，而参考数据则是之前观察的案例所体现出的0和1。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

信息流是先筛选出可能的结果，再对它们进行排序，这可能缓解了你对归类中的假阳性和假阴性问题的担心。但是，你要考虑到影响首页信息流体验好坏的更多因素，包括新鲜度、多样性和用户最希望看到的内容。

所以负责用户体验的人，通常是产品经理，往往扮演确定目标函数的重要角色，你可以将此视作系统的最大化目标。例如，如果Facebook的最大化目标是你阅读某个帖子的概率，那就会为你展示很有趣，但却有可能过时的内容，或者很多来自同一个人的内容，同时也要考虑其他一些用户体验方面的因素。

另外，你必须要从用户那里收集正确的信号，了解他们是否真的喜欢某个内容，于是便有了接下来的……

内容行为

640?wx_fmt=png&wxfrom=5&wx_lazy=1

反馈对于这些排序系统十分重要。任何回归模型都只能针对可以衡量的事情进行优化，这就意味着你需要明确了解用户对某款产品的哪一方面要求较高，哪一方面要求较低。

这些信号可能很含蓄，例如用户在YouTube上观看视频的时间，也可能比较明确，例如在Quora上不赞同某个问题或答案的历史。要点在于这些信号必须具备以下特点：

可预测：真正说明优秀的用户体验。
明确：不要混淆意图，例如，Twitter最初的“星标”行为就是为了收藏，但实际上却被用作“点赞”。
密集使用：用户必须经常使用，才能通过数据加以分析。这就是视频观看时间等含蓄信号往往效果很好的原因所在。

解释神奇的数字

回归模型还经常被用来定价，而精明的用户想知道为什么是这个价格。比如说，Airbnb就遇到过这个问题，他们的定价模型接近线性回归，可以解释为独特性、供需关系和位置的加权求和，并用简单易懂的图表展示出来：

640?wx_fmt=png&wxfrom=5&wx_lazy=1

在更复杂的机器学习任务中，模型解释能力依然很重要，但是模型越复杂越精确，解释能力就越差。

搜索

现在，我们来说说Google。

还记得前边提到的信息流排序系统吗？Google可能是第一个涉及复杂UI的主流排序产品。

Google最开始时不是由机器学习驱动的，但现在是了。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

搜索引擎需要经过层层考量才会生成最后的搜索界面，这些考量点可能包括——过滤掉成人向和暴力向内容、在复杂目标函数运算下的排序、解释元数据和搜集用户对搜索结果满意度的反馈。

但是别忘了，一个搜索引擎最关键的着力点还在于识别用户意图。如你所见，当用户搜索电影时，他可能想要的是电影的内容介绍、上映时间、新闻评论、花絮集合或是其他信息。

在这种情况下，产品经理需要了解什么样的意图组合能最大限度满足用户的需要，并依此设计可以满足不同可能的UI系统。

声音与对话

聊天机器人（Chatbots）曾风靡一时，但自然语言理解和语音合成技术都还处在婴儿期。对于产品经理来说，与团队一起探索语音系统的局限性至关重要。

举个例子，让机器人记住上下文内容依然是非常困难的，而语音合成技术最近终于达到了接近人类的水平。

自然语言领域的技术进步迅速，值得产品经理持续关注，上周做不了的功能，说不定这周就可以实现了。

文案

最后一点，无数研究致力于个性化的产品显示，可能很多用户根本不知道他们收到的内容是基于个性化定制的。

所以，细节很重要，比如说将“头条故事”改成“为你推荐的头条故事”，或者在UI里找个合适的地方写上用户的名字。

最后，让我们再看看文章开头的疑问：为什么产品经理需要对机器学习有一定的了解？以上，就是一份综合但不详尽的答卷。机器学习在产品设计中无处不在，但意义非凡。

本文作者：李杉安妮

原文发布时间： 2017-04-18

为什么说产品经理都该懂一点机器学习？

垃圾信息/质量控制系统

通知

信息流排序

内容行为

解释神奇的数字

搜索

相关内容的呈现

声音与对话

文案

量子位

热门文章

最新文章

相关课程

相关电子书

相关实验场景