自适应线性单元adaline的激活函数是一个线性函数

自适应线性单元(Adaline)的激活函数是一个线性函数，该函数的输出等于输入，实际上就相当于没有激活函数，线性激活函数φ(Z)的定义：

将样本数据中的实际输出与线性激活函数的输出进行比较，计算模型偏差，然后更新权重。

将样本数据中的实际输出与模型输出进行比较，计算模型偏差，然后更新权重。

自适应线性单元与感知器的区别，在于激活函数不同，自适应线性单元将返回一个实数值而不是01分类。因此自适应线性单元用来解决回归问题而不是分类问题。

监督学习：对有标记（分类）的训练样本进行学习，以尽可能对训练样本集外的数据进行标记（分类）预测。

监督学习中，所有的标记（分类）是已知的。因此，训练样本的岐义性低。

无监督学习：对没有标记（分类）的训练样本进行学习，以发现训练样本集中的结构性知识。

这里，所有的标记（分类）是未知的。因此，训练样本的岐义性高。

聚类就是典型的无监督学习，经过聚类后的样本数据就可以用来做监督学习。

通常，神经网络的训练都属于监督学习类别，即使样本数据没有分类，也可先做聚类处理，把样本数据分类，然后就可以用来做监督学习了。

在监督学习下，对于一个样本，我们知道它的特征（输入）x，以及标记（输出）y。同时，我们还可以得到神经网络的预测输出\hat y。注意这里面我们用y表示训练样本里面的标记，也就是实际值；用\hat y表示神经网络的的预测值。我们当然希望预测值\hat y和实际值y越接近越好。

上面的也可以表示为和式：

对于一个训练数据集来说，我们当然希望误差E最小越好。对于特定的训练数据集来说，(x^{(i)} y^{(i)})的值都是已知的，所以E其实是参数w的函数。

由此可见，神经网络的训练，实际上就是求取到合适的权重w，使差值E取得最小值。这在数学上称作优化问题，而J(w)就是我们优化的目标，称之为目标函数，也被称为代价函数、损失函数。

注意：前面提到，目标函数实际上是差值平方和，从数学上来说，平方与线性激活函数让目标函数变成可微凸函数。

对于可微凸函数，可以使用一种简单但功能强大的优化算法，梯度下降法来求取目标函数J(w)的最小值，及其对应的参数w。