机器学习 LR中的参数迭代公式推导——极大似然和梯度下降

简介:

Logistic本质上是一个基于条件概率的判别模型(DiscriminativeModel)。

                           

wKioL1TEnTjA2NPbAAAZDt4MjeU599.jpg

函数图像为:

wKioL1TEnTiD9dUWAAB7G34zbW0271.jpg

通过sigma函数计算出最终结果,以0.5为分界线,最终结果大于0.5则属于正类(类别值为1),反之属于负类(类别值为0)。

如果将上面的函数扩展到多维空间,并且加上参数,则函数变成:

wKiom1TEnF3xBqCrAAAtwFC_Y7M318.jpg

接下来问题来了,如何得到合适的参数向量θ呢?

 

由于sigma函数的特性,我们可作出如下的假设:

wKiom1TEnF2hTs5PAABLtf3DlpQ603.jpg

上式即为在已知样本X和参数θ的情况下,样本X属性正类(y=1)和负类(y=0)的条件概率。

 

将两个公式合并成一个,如下:

wKioL1TEnTnA8ZKSAAA8rx3sZUM132.jpg

既然概率出来了,那么最大似然估计也该出场了。假定样本与样本之间相互独立,那么整个样本集生成的概率即为所有样本生成概率的乘积:

wKioL1TEnTmCIvnhAACSHATjZaY077.jpg

为了简化问题,我们对整个表达式求对数,(将指数问题对数化是处理数学问题常见的方法):

wKiom1TEnF7glwX2AABxj9lYg18460.jpg

满足似然函数(θ)的最大的θ值即是我们需要求解的模型。

 

梯度上升算法

 

     就像爬坡一样,一点一点逼近极值。爬坡这个动作用数学公式表达即为:

wKioL1TEnTyxHegQAAAgSFtr9U4431.jpg 

其中,α为步长。

回到Logistic Regression问题,我们同样对函数求偏导。

wKiom1TEnGHhkXbMAAFCAkpV7Zs421.jpg

 

先看:

wKiom1TEnGGgVCkNAABH3qNWcA4288.jpg

其中:

wKiom1TEnfKTaMuVAABFm0Px270384.jpg

再由:

wKioL1TEnT-xsSdfAABva83f19A126.jpg

可得:

wKiom1TEnGPTqcd8AAAxlx9xE7w874.jpg

接下来就剩下第三部分:

 wKioL1TEnT_jreuTAAA53p9A8ec077.jpg

(这个公式应该很容易理解,简单的偏导公式)

还有就是:

wKioL1TEnwPzRXsWAAAtwFC_Y7M157.jpg

综合三部分即得到:

wKiom1TEnGTAhlbMAAAfcirD1mM147.jpg

 

因此,梯度迭代公式为:

wKiom1TEnGSDl1JuAAAqXOo511s178.jpg

      

       结合本式再去理解《机器学习实战》Page 78中的代码就很简单了。

 摘自:http://sbp810050504.blog.51cto.com/2799422/1608064















本文转自张昺华-sky博客园博客,原文链接:http://www.cnblogs.com/bonelee/p/7253508.html,如需转载请自行联系原作者


相关文章
|
3月前
|
机器学习/深度学习
【机器学习】误差总似然
【1月更文挑战第23天】【机器学习】误差总似然
|
7月前
|
机器学习/深度学习 算法 索引
深入探讨梯度下降:优化机器学习的关键步骤(三)
深入探讨梯度下降:优化机器学习的关键步骤(三)
|
1月前
|
机器学习/深度学习 算法 计算机视觉
python机器学习超参数调优
超参数(hyper parameters)就是机器学习或深度学习算法中需要预先设置的参数,这些参数不是通过训练数据学习到的参数;原始算法一般只给出超参数的取值范围和含义,根据不同的应用场景,同一个算法的同一超参数设置也不同。【2月更文挑战第14天】
63 0
|
3月前
|
机器学习/深度学习 人工智能 算法
【人工智能】<吴恩达-机器学习>批量梯度下降&矩阵和向量运算概述
【1月更文挑战第26天】【人工智能】<吴恩达-机器学习>批量梯度下降&矩阵和向量运算概述
|
3月前
|
机器学习/深度学习 人工智能
【人工智能】<吴恩达-机器学习>单变量的线性回归&认识梯度下降
【1月更文挑战第26天】【人工智能】<吴恩达-机器学习>单变量的线性回归&认识梯度下降
|
3月前
|
机器学习/深度学习 算法
【机器学习】三种梯度下降对比
【1月更文挑战第24天】【机器学习】三种梯度下降对比
|
3月前
|
机器学习/深度学习 算法 异构计算
机器学习第4天:模型优化方法—梯度下降
机器学习第4天:模型优化方法—梯度下降
38 0
|
4月前
|
机器学习/深度学习 算法 Python
【Python机器学习】Sklearn库中Kmeans类、超参数K值确定、特征归一化的讲解(图文解释)
【Python机器学习】Sklearn库中Kmeans类、超参数K值确定、特征归一化的讲解(图文解释)
59 0
|
9月前
|
机器学习/深度学习
hyperopt用于机器学习参数调整
本文举例了如何使用hyperopt对机器学习参数进行调整
73 0
|
6月前
|
机器学习/深度学习 算法 PyTorch
解锁机器学习-梯度下降:从技术到实战的全面指南
解锁机器学习-梯度下降:从技术到实战的全面指南
44 0

热门文章

最新文章