目录
机器学习(一)
/  

机器学习(一)

image.png

房价预测

$$
y = wx + b
$$

符号含义
x输入特征,比如面积
y预测结果,比如房价
w权重,可以理解为“面积每增加 1㎡,房价增加多少”
b偏置,可以理解为“基础价格”

损失函数

均方误差(MSE)计算公式如下:

$$
MSE = \frac{1}{n} \sum_{i=1}^{n} (\text{真实值}_i - \text{预测值}_i)^2
$$

这个公式的三个步骤:

  • 计算每个样本的误差:真实值 - 预测值
  • 把误差平方:避免正负抵消,也会惩罚特别离谱的预测
  • 把所有的平方后的误差求平均

误差1平方 + 误差2平方 + ... + 误差n平方

最后结果再除以 n

MSE 越小,预测的就越准;根据这个分数,调整模型参数,让下次预测更准。

怎么让 MSE 变得更小?下一个概念 梯度下降

方差

衡量数据分散程度,但单位是平方后的,所以不适合直接用生活语言解释。

$$
s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2
$$

  • s^2 :样本方差(如果是总体方差,通常用 $\sigma^2$,分母为 $n$)。
  • x_i:第 i 个样本值。
  • x-:样本平均值。
  • n:样本数量。

标准差

方差开根号,单位回到原单位,所以更适合解释成“平均上下波动多少”。

标准差衡量的是:一组数据整体有多分散。

$$
s = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2}
$$

梯度下降

站在山坡上,想走到最低点,每次朝“下降最快的方向”走一小步。

在这里:

  • 山的高度 = MSE
  • 你的位置 = 当前的 w 和 b
  • 山谷最低点 = 最好的 w 和 b

训练模型就是:

不断调整 w 和 b,让自己走到 MSE 最低的位置。

**下降?**因为目标是让损失函数变小。

损失函数就是 MSE。

所以训练过程是:

$$
w,b \rightarrow 预测值 \rightarrow 误差 \rightarrow MSE \rightarrow 调整w,b \rightarrow 新的MSE
$$

一轮一轮重复。

练习

工作年限 x真实工资 y
19000
213000
317000

模型公式如下:

$$
y = 2000x + 5000
$$

请你算一下:

  1. x=1、2、3 时,预测工资分别是多少?

7000, 9000, 11000

  1. 每一行误差 (真实值 - 预测值) 分别是多少?

误差为:2000, 4000, 6000

  1. 你觉得这个模型的 w 应该调大还是调小?

调大


标题:机器学习(一)
作者:gitsilence
地址:https://blog.lacknb.cn/articles/2026/04/24/1776993568684.html