机器学习与模式识别[才子佳人博客，我的故事我讲述]

机器学习与模式识别

来源：xjh 编辑：xjh 2018-01-18

机器学习是一门人工智能的科学，该领域的主要研究对象是人工智能，特别是如何在经验学习中改善具体算法的性能，可以分成下面几种类别：

有监督学习从给定的训练样本集中学习出一个决策函数，当新的未知样本到来时，可以根据这个决策函数预测结果。有监督学习的训练集要求是包括输入和输出，也可以说是特征和目标。训练集中的目标是由人标注的。常见的监督学习算法包括分类问题和回归分析。

无监督学习与有监督学习相比，训练集没有人为标注的结果。最常见的无监督学习算法为聚类。

半监督学习介于监督学习与无监督学习之间。

增强学习通过观察来学习做成如何的动作。每个动作都会对环境有所影响，学习对象根据观察到的周围环境的反馈来做出判断。

分类问题也被叫做模式识别，是机器学习一个主要问题。

模式识别主要分为两类：统计模式识别和结构模式识别。统计模式识别把模式类看成是用某个随机向量实现的集合，主要方法包括 Bayes 决策、概率密度估计（参数方法和非参数方法）、特征提取（变换）和选择、聚类分析等。

设计一个模式识别系统通常涉及如下几个不同的步骤的重复：数据获取、预处理、特征提取和特征选择、分类器和后处理。

·数据获取：一个模式识别系统的输入通常取自一些传感器，比如摄像机或麦克风。

·预处理：预处理的目的是去除噪声，加强有用的信息，并对由输入设备或其他因素造成的退化现象进行复原，以利于特征提取的进行。

·特征提取和特征选择

一般情况下经过预处理后的数据维数很高，如医学图像中的结构MRI图像，每张MRI图像可以看成一个模式，特征的维数由 MRI图像的像素个数决定，通常一张MRI图像的像素大小为224×256×176，从运算代价和分类准确率考虑，应尽可能地对原始数据的特征维数进行降维处理，通常可以采取特征提取和特征选择。特征选择是指从输入特征集中选择具有明显区分意义的最好子集，可以节省模式分类的运算成本；特征提取是基于原始特征的变换和组合设计新的特征。通常特征提取一般在特征选择前进行，首先从传感数据中提取特征，然后剔除那些辨别能力低的特征。在模式识别领域，特征提取和特征选择经常被混淆使用。

特征提取方法决定了原始 d维特征空间中的一个合适的 m（m≤d）维的特征子空间。在模式识别系统中，线性特征提取方法被广泛使用。例如主成份分析法（Principal component analysis, PCA）和线性鉴别分析法(Fisher Linear Discriminant Analysis, FLDA)。

·分类器

分类器设计(Classifier design)是模式识别系统设计中的一项重要内容，也是处理许多其它问题的核心。系统中的分类器的作用是：根据特征提取器得到的特征向量来给一个被测对象赋一个类标记，分类的难易程度取决于两个因素，其一是来自同一个类别的不同个体之间的特征值的波动。其二是属于不同类别样本的特征值之间的差异。

我们考虑一个分类问题，输入是一个向量，被称为“模式”，每个模式含有n 个成分，这些成分被称为“特征”，这些特征构成一个 n 维的特征空间。假设m 个训练样本集{ x1, x2, ... , xm }∈Rn,样本集对应的标签{ y1, y2, ... ym }。这些训练样本集被用来训练一个判别函数 y =D(x)，预测未知的新样本 x，按照判别函数的输出将新样本 x分类到相应的类中。

·后处理

后处理器利用分类器的输出结果来确定合适的动作，也可能采用“上下文信息”来改善系统的性能。

分类:网络日志| 查看评论

才子佳人博客

我的故事我讲述

站内百度搜索

最新文章

按关键词搜索

按文章标题搜索

文章分类点击排行

友情链接