“啤酒尿布”模型管用,说不清因果又怎样?

简介: 好的模型,为什么非得是人能够理解的?有的人,对深度学习(deep learning)模型,很不以为然。说根本没有搞清楚因果关系,只是拿出相关性来说事儿。
img_c60226342e5f478a138fd2376a36e295.jpe

好的模型,为什么非得是人能够理解的?

有的人,对深度学习(deep learning)模型,很不以为然。

说根本没有搞清楚因果关系,只是拿出相关性来说事儿。

尤其是模型无法清楚解释——即不能像牛顿力学一样,用简单优美的数学公式刻画。

img_fb24ed19d0b4ebfb93218c401125318f.jpe

奇怪,为什么模型一定要简单到清清楚楚?

复杂系统已经被研究了这么多年,却还有人恨不得回归前信息化时代。

img_883c9273c2c8c0214243a2f9ea5723e3.jpe

总不能因为你只学过文科班高中物理,就得让全世界的科学研究退回到1800年之前吧?

人是通过大脑,对信息进行加工的。

连这个加工工具,至今都没有完全搞清楚,不是吗?

img_d05177539222155954186920c5c016ee.png

那为何要对机器们在大数据上,辛辛苦苦构造出的模型,如此苛刻?

一个模型,可以准确做分类预测。而且反复在新的、没有训练的数据上尝试过,好用,那不就好了?

虽然不能排除纯是因为运气,但是这种可能概率很小。

img_58d7055309b6e07b164994dd19f14f5e.jpe

好的模型,为什么非得是人能够理解的?

人对于宏观世界,至今缺乏理解。大爆炸只是假说。

人对于微观世界,同样缺乏理解。什么叫“测不准”来着?

人对于暗物质,意见不一。找不到证据,成为了“最好的证据”。

人连时间是什么,还说不清楚。要不然哪儿来的这么多穿越剧?

那凭什么,一个好用的模型,只是因为层数多、结构复杂、无法用数学语言解释给听众,就被鄙视?

img_dfe4eaaa4450e2b58b38c5fe82f918c0.png

其实原因也不难理解。

都在于人类社会协作中的共识。

img_0069d7d8485db13bd17cd21e0d2e9b20.jpe

大家都认同的,很有价值。

例如美元、黄金和一线城市的房地产。

极少数人才认同的,价值没有这么高。

例如2012年的比特币。

img_1dae1fe5334fad732601977afd00f209.png

大部分人都无法理解,自然难以达成共识。

这时候有人出来批评复杂模型,看不懂的人就觉得很爽。

看,我不理解的东西,就一定是不靠谱的,哈哈。

站队的结果,就是大部分连讨论对象是啥,都没有搞清楚的人,跟随主流意见,人云亦云而已。

然而……

共识是会发生变化的,即所谓“范式转移”嘛。

img_8bd81534a8064c282fac48ca0c9cb83a.jpe

喜欢请点赞。还可以微信关注和置顶我的公众号“玉树芝兰”(nkwangshuyi)

如果你对数据科学感兴趣,不妨阅读我的系列教程索引贴《如何高效入门数据科学?》,里面还有更多的有趣问题及解法。

目录
相关文章
|
3月前
|
机器学习/深度学习 存储 算法
手写决策树算法——基于决策树的XX联盟游戏胜负预测
手写决策树算法——基于决策树的XX联盟游戏胜负预测
38 0
|
9月前
|
数据挖掘 计算机视觉 Python
【每周一坑】蜥蜴流感与贝叶斯定理
不过今天的题,我希望你们用程序模拟一场蜥蜴流感。比如有10万个人,按照上述3条规则去模拟,最后去统计下检测结果阳性中有多少人是真正的患者。
|
11月前
|
编解码 自然语言处理 机器人
哈佛大学砸场子:DALL-E 2只是「粘合怪」,生成正确率只有22%
哈佛大学砸场子:DALL-E 2只是「粘合怪」,生成正确率只有22%
|
11月前
|
机器学习/深度学习 人工智能 算法
如何用Transformer分清12位女排运动员?这个「时空双路」框架刷群体行为识别SOTA
如何用Transformer分清12位女排运动员?这个「时空双路」框架刷群体行为识别SOTA
|
搜索推荐
ICDE 2023 | DCMT:基于因果纠偏的直接全空间多任务转化率预测模型
ICDE 2023 | DCMT:基于因果纠偏的直接全空间多任务转化率预测模型
640 0
ICDE 2023 | DCMT:基于因果纠偏的直接全空间多任务转化率预测模型
|
数据可视化 数据挖掘 数据建模
鸟枪换炮,利用python3对球员做大数据降维(因子分析得分),为C罗找到合格僚机
众所周知,尤文图斯需要一座欧冠奖杯,C罗也还想再拿一座欧冠奖杯,为自己的荣誉簙上锦上添花。意甲霸主在意甲虽然风生水起,予取予求,但是在今年欧冠1/8决赛赛场上,被法甲球队里昂所淘汰,痛定思痛,球队解雇了主教练萨里,签约名宿皮尔洛,但是要想在欧冠赛场上夺冠,这还不够,球队还需要什么?没错,需要一名强力中锋,在正印中锋伊瓜因难堪大用的情况下,尤文图斯必须引进一名强力中锋。
鸟枪换炮,利用python3对球员做大数据降维(因子分析得分),为C罗找到合格僚机
|
机器学习/深度学习 数据可视化 Windows
属实逼真,决策树可视化!
属实逼真,决策树可视化!
属实逼真,决策树可视化!
|
数据挖掘
2022国赛C题古代玻璃制品的成分分析与鉴别思路分析
2022国赛C题古代玻璃制品的成分分析与鉴别思路分析
15030 9
|
机器学习/深度学习 算法 数据可视化
女神也用的约会决策:决策树算法实践
由于决策树非常有价值,还衍生出了很多高级版本。决策树是机器学习中强大的有监督学习模型,本质上是一个二叉树的流程图,其中每个节点根据某个特征变量将一组观测值拆分。决策树的目标是将数据分成多个组,这样一个组中的每个元素都属于同一个类别。决策树也可以用来近似连续的目标变量。在这种情况下,树将进行拆分,使每个组的均方误差最小。决策树的一个重要特性可解释性好,即使你不熟悉机器学习技术,也可以理解决策树在做什么。
133 0
女神也用的约会决策:决策树算法实践
|
机器学习/深度学习 人工智能 算法
啤酒和尿布放在一起卖得更好?来看看这个故事背后的Apriori算法
云栖号资讯:【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! Apriori算法号称是十大数据挖掘算法之一,在大数据时代威风无两,哪怕是没有听说过这个算法的人,对于那个著名的啤酒与尿布的故事也耳熟能详。
啤酒和尿布放在一起卖得更好?来看看这个故事背后的Apriori算法