《第三章》

3.1线性判别函数和决策边界

3.1.1二分类

在二分类问题中，我们只需要一个线性判别函数𝑓(𝒙; 𝒘) = 𝒘T𝒙+𝑏. 特征空间 ℝ^𝐷 中所有满足 𝑓(𝒙; 𝒘) = 0的点组成一个分割超平面（Hyperplane），称为决策边界（Decision Boundary）或决策平面（Decision Surface）.特征空间中每个样本点到决策平面的有向距离（Signed Distance）为𝛾 =𝑓(𝒙; 𝒘)/‖𝒘‖ . 线性可分理解:存在权重w,使其和所有特征x,标签y组合起来均大于0.

3.1.2多分类

多分类三种方式对于(2),需要(C-1)+(C-2)+...+1=C(C-1)/2个判别函数对于(3),argmax(f(x))是使得 f(x)取得最大值所对应的变量点x(或x的集合)。arg即argument，此处意为“自变量”。从而可以理解为c的概率最大.此方法在特征空间中不会有不确定的值. 多类线性可分

3.2logistic回归

𝑔(⋅) 通常称为激活函数（Activation Function）逆函数 𝑔−1(⋅)也称为联系函数（Link Function）. logistic函数标准 Logistic函数在机器学习中使用得非常广泛，经常用来将一个实数空间的数映射到(0,1)区间. logistic对数几率 Logistic回归可以看作是预测值为 “ 标签的对数几率”的线性回归模型. 因此， Logistic 回归也称为对数几率回归（Logit Regression）