
$$
y = wx + b
$$
| 符号 | 含义 |
|---|---|
| x | 输入特征,比如面积 |
| y | 预测结果,比如房价 |
| w | 权重,可以理解为“面积每增加 1㎡,房价增加多少” |
| b | 偏置,可以理解为“基础价格” |
均方误差(MSE)计算公式如下:
$$
MSE = \frac{1}{n} \sum_{i=1}^{n} (\text{真实值}_i - \text{预测值}_i)^2
$$
这个公式的三个步骤:
误差1平方 + 误差2平方 + ... + 误差n平方
最后结果再除以 n
MSE 越小,预测的就越准;根据这个分数,调整模型参数,让下次预测更准。
怎么让 MSE 变得更小?下一个概念 梯度下降
衡量数据分散程度,但单位是平方后的,所以不适合直接用生活语言解释。
$$
s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2
$$
x-:样本平均值。方差开根号,单位回到原单位,所以更适合解释成“平均上下波动多少”。
标准差衡量的是:一组数据整体有多分散。
$$
s = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2}
$$
站在山坡上,想走到最低点,每次朝“下降最快的方向”走一小步。
在这里:
训练模型就是:
不断调整 w 和 b,让自己走到 MSE 最低的位置。
**下降?**因为目标是让损失函数变小。
损失函数就是 MSE。
所以训练过程是:
$$
w,b \rightarrow 预测值 \rightarrow 误差 \rightarrow MSE \rightarrow 调整w,b \rightarrow 新的MSE
$$
一轮一轮重复。
| 工作年限 x | 真实工资 y |
|---|---|
| 1 | 9000 |
| 2 | 13000 |
| 3 | 17000 |
模型公式如下:
$$
y = 2000x + 5000
$$
请你算一下:
7000, 9000, 11000
误差为:2000, 4000, 6000
调大