机器学习入门线性回归(2)

3.4广义线性回归

一般形式：$y = g^{-1} \left( w^T x + b \right)$

单调可微的联系函数 (link function)

令 $g(\cdot) = \ln (\cdot)$ 则得到对数线性回归

$$\ln y = w^T x + b$$

实际上是在用$e^{w^T x + b}$逼近$y$

线性回归模型产生的实值输出 $z = w^T x + b$

期望输出 $y \in {0, 1}$

理想的"单位阶跃函数" (unit-step function)

$$y = \begin{cases} 0, & z < 0; \\ 0.5, & z = 0; \\ 1, & z > 0, \end{cases}$$

性质不好，需找"替代函数" (surrogate function)

常用单调可微、任意阶可导

$$y = \frac{1}{1 + e^{-z}}$$

找 $z$和 $y$的联系函数

对数几率函数 (logistic function) 简称"对率函数"

以对率函数为联系函数：$y = \frac{1}{1 + e^{-z}}$

变为$y = \frac{1}{1 + e^{-(w^T x + b)}}$

即：$\ln \left( \frac{y}{1 - y} \right) = w^T x + b$

$\ln \left( \frac{y}{1 - y} \right)$称为几率 (odds)，反映了 $x$ 作为正例的相对可能性（log odds，亦称 logit）。

“对数几率回归”（logistic regression）简称“对率回归”

注意：它是分类学习算法！

原理为每个类别训练一个独立的二分类器，将该类别作为正类，其他所有类别合并作为负类

实现步骤

特点

原理为每两个类别组合训练一个独立的二分类器，专门区分这两个类别

实现步骤

特点