用各种数学方法让计算机(软件与硬件)来实现人的模式识别能力,即用计算机实现人对各种事物或现象的分析、描述、判断、识别。
模式识别也可以看成是从特征向量向类别所作的映射。
1.模式或者模式类:可以是研究对象的组成成分或影响因素之间存在的规律性关系,因素之间存在确定性或随机性规律的对象、过程或者事件的集合。
2.识别:对以前见过的对象的再认识。
3.模式识别:对模式的区分与认识,将待识别的对象根据其特征归并到若干类别中的某一类。
4.样本:所研究对象的一个一个个体, 通常有一组特征构成的向量来描述,也称样本向量。
5.样本集:若干样本的集合。
6.类或者类别:在样本集上定义的模式类子集合,同一类的样本在我们所关心的某种性质上是不可区分的,即具有相同的模式。
7.特征或者属性:描述样本的若干观测值。多个特征或属性构造特征向量或者属性向量,通常与样本向量混用。
以专家系统为代表,根据人们已知的(从专家那里收集整理得到的)知识,整理出若干描述特征与类别间关系的准则,建立一定的计算机推理系统,再对未知样本决策其类别。
1)监督模式识别(分类):先有一批已知样本作为训练集设计分类器,再判断新的样本类别(分类)
针对具体的应用,分析是否可以转化成分类问题;
可能有那些类别;
已有的数据或者欲采集的数据中哪些因素或者特征与分类最具关联性。
2)非监督模式识别(聚类):只有一批样本,根据样本之间的相似性直接将样本集划分成若干类别(聚类)
针对具有的应用,分析是否可以转化成聚类问题;
可能或者希望得到的类别数;
已有的数据或者欲采集的数据中那些因素或者特征与聚类相关。
构造出无类别标识的样本集(都是未知样本)
选定某一个非监督模式识别方法,对样本集进行聚类分析。
如果有新样本,可以采用就近原则进行进行分类。
利用概率论中的Bayes公式进行分类,可以得到错误率最小的分类规则。
问题1:模式识别和机器学习有什么区别和联系?
问题1解决方案:模式识别是自己建立模型刻画已有的特征,样本是用于估计模型中的参数,落脚点是感知。机器学习根据样本训练模型,如训练好的神经网络是一个针对特定分类问题的模型,重点在于“学习”,训练模型的过程就是学习,落脚点是思考。
通过这一次模式识别的学习,对模式识别的一些基本概念及其系统有了一定了解,对模式识别的一些主要方法也有了一些掌握,最后还了解了贝叶斯公式在模式识别中的运用,收获很大。