机器学习中常用的矩阵求导公式

飞熊 • 2023年9月5日下午6:59 • Python • 阅读 100

不管现实多么惨不忍睹，都要持之以恒地相信，这只是黎明前短暂的黑暗而已。不要惶恐眼前的难关迈不过去，不要担心此刻的付出没有回报，别再花时间等待天降好运。真诚做人，努力做事！你想要的，岁月都会给你。机器学习中常用的矩阵求导公式，希望对大家有帮助，欢迎收藏，转发！站点地址：www.bmabk.com，来源：原文

本文转载自：http://blog.sina.com.cn/s/blog_8eac0b290101fsqb.html

矩阵求导好像读书的时候都没学过，因为讲矩阵的课程上不讲求导，讲求导的课又不提矩阵。如果从事机器学习方面的工作，那就一定会遇到矩阵求导的东西。维基百科上：
http://en.wikipedia.org/wiki/Matrix_calculus
，根据Y与X的不同类型（实值，向量，矩阵），给出了具体的求导公式，以及一堆相关的公式，查起来都费劲。

机器学习中常用的矩阵求导公式

其实在实际的机器学习工作中，最常用到的就是实值函数y对向量X的求导，定义如下（其实就是y对向量X的每一个元素求导）：

机器学习中常用的矩阵求导公式

实值函数对矩阵X求导也类似：

机器学习中常用的矩阵求导公式

因为机器学习（这里指的是有监督的机器学习）的一般套路是给定输入X，选择一个模型f作为决策函数，由f(X)预测出Y’。而得到f的参数θ（往往是向量），需要定义一个loss函数（一般都是实值函数），描述当前f预测值Y’与实际的Y值的接近程度。模型学习的过程就是求使得 loss函数 L(f(X),Y)最小的参数θ。这是一个最优化问题，实际应用中都是用和梯度相关的最优化方法，如梯度下降，共轭梯度，拟牛顿法等等。

其实只要掌握上面这个公式，就能搞定很多问题了。

为了方便推导，下面列出一些机器学习中常用的求导公式，其中andrew ng那一套用矩阵迹的方法还是挺不错的，矩阵的迹也是实值的，而一个实数的迹等于其本身，实际工作中可以将loss函数转化成迹，然后在求导，可能会简化推导的步骤。

机器学习中常用的矩阵求导公式

以上只是一些最基本的公式，能够解决一些问题，主要是减少大家对矩阵求导的恐惧感。关于矩阵方面的更多信息可以参考上面的wiki链接以及《Matrix cookbook》（感谢
@王树森 CS 推荐）。

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

文章由极客之音整理，本文链接：https://www.bmabk.com/index.php/post/162957.html

赞 (0)

0 0

Python

Python格式化输出

00075

seven_
2023年2月21日
Python

【django】HttpRequest对象(更新)

00086

飞熊
2023年3月5日
Python

Flask初探之WSGI

00070

小半
2023年12月29日
Python

go 关于配置文件的变化(Viper基本使用)

00088

小半
2022年12月12日
Django自学教程

Django-8-用户认证

00089

小半
2024年1月11日
Python

前端学习倒数第二天

00067

小半
2023年1月6日
Python

深入理解拉格朗日乘子法（Lagrange Multiplier) 和KKT条件

00092

飞熊
2023年9月5日
Python

【Flask】ORM高级操作之排序和分页操作

000150

飞熊
2023年3月5日
Python

python之路45 初识django框架

00079

小半
2023年2月11日
Python

记一个bug：ImportError: cannot import name ‘comb‘

000127

小半
2023年1月1日
Python

【Flask】数据的CRUD之增加和查询操作

00083

飞熊
2023年3月5日
Python

【python】JSON标准库文件介绍及python中json模块使用

000103

小半
2022年10月28日

发表回复

登录后才能评论

极客之音——专业性很强的中文编程技术网站，欢迎收藏到浏览器，订阅我们！