机器学习基础
机器学习都学过,主要是过了一下监督学习,有很多需要算的东西可能需要注意一下
概念
Instance(实例),feature vector(特征向量),feature space(特征空间)
输入实例𝑥的特征向量:
与 不同,后者表示多个输入变量中的第 个
- 训练集:
- 输入变量和输出变量:
- 分类问题、回归问题、标注问题
线性回归
推导
正规方程
线性回归最优解对应的解析公式
正则化
正则化一般形式:
- 回归问题中:
正则化与岭回归
正则化与交叉验证
- 简单交叉验证(70%,30%)
- S折交叉验证
- 留一交叉验证(上一种的极端情况,每轮只留一个样本验证)
分类
二分类
单位跃阶函数
- 缺点:不连续
替代函数——对数几率函数(logistic funtion
- 单调可微、任意阶可导
logistic 回归
NOTE
这个做过实验
发现这个式子和线性回归是一样的(只有
变了)
多项logistic回归
Q: 为什么只用算到 K - 1
A: 因为这里采用的是:“以一个类别作为基准类(reference class)” 的多项 logistic 回归写法, 最后一个类别的概率由:
自动确定。
Softmax回归
(后面是一些推理和求导,和上面二分类基本上一样的逻辑)
常用的定理
没有免费午餐定理(No Free Lunch Theorem,NFL)
对于基于迭代的最优化算法,不存在某种算法对所有问题(有限的 搜索空间内)都有效。如果一个算法对某些问题有效,那么它一定 在另外一些问题上比纯随机搜索算法更差。
丑小鸭定理(Ugly Duckling Theorem)
丑小鸭与白天鹅之间的区别和两只白天鹅之间的区别一样大.
GPT:
丑小鸭定理实际上是在说明:
没有“先验偏好”,就不存在有效学习。
这也是:
- 特征工程
- 模型结构
- 正则化
- inductive bias
为什么重要的理论原因之一。
奥卡姆剃刀原理(Occam's Razor)
如无必要,勿增实体
归纳偏置(Inductive Bias)
很多学习算法经常会对学习的问题做一些假设,这些假设就称为归纳偏置
在贝叶斯学习中成为先验(Prior)