才子佳人博客

我的故事我讲述

机器学习与模式识别
 
来源:xjh  编辑:xjh  2018-01-18

机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能,可以分成下面几种类别:

有监督学习从给定的训练样本集中学习出一个决策函数,当新的未知样本到来时,可以根据这个决策函数预测结果。有监督学习的训练集要求是包括输入和输出,也可以说是特征和目标。训练集中的目标是由人标注的。常见的监督学习算法包括分类问题和回归分析。

无监督学习与有监督学习相比,训练集没有人为标注的结果。最常见的无监督学习算法为聚类。

半监督学习介于监督学习与无监督学习之间。

增强学习通过观察来学习做成如何的动作。每个动作都会对环境有所影响,学习对象根据观察到的周围环境的反馈来做出判断。

分类问题也被叫做模式识别,是机器学习一个主要问题。

模式识别主要分为两类:统计模式识别和结构模式识别。统计模式识别把模式类看成是用某个随机向量实现的集合,主要方法包括 Bayes 决策、概率密度估计(参数方法和非参数方法)、特征提取(变换)和选择、聚类分析等。

设计一个模式识别系统通常涉及如下几个不同的步骤的重复:数据获取、预处理、特征提取和特征选择、分类器和后处理。

·数据获取 :一个模式识别系统的输入通常取自一些传感器,比如摄像机或麦克风 。

·预处理:预处理的目的是去除噪声,加强有用的信息,并对由输入设备或其他因素造成的退化现象进行复原,以利于特征提取的进行。

·特征提取和特征选择

一般情况下经过预处理后的数据维数很高,如医学图像中的结构MRI图像,每张MRI图像可以看成一个模式,特征的维数由 MRI图像的像素个数决定,通常一张MRI图像的像素大小为224×256×176,从运算代价和分类准确率考虑,应尽可能地对原始数据的特征维数进行降维处理,通常可以采取特征提取和特征选择。特征选择是指从输入特征集中选择具有明显区分意义的最好子集,可以节省模式分类的运算成本;特征提取是基于原始特征的变换和组合设计新的特征。通常特征提取一般在特征选择前进行,首先从传感数据中提取特征,然后剔除那些辨别能力低的特征。在模式识别领域,特征提取和特征选择经常被混淆使用。

特征提取方法决定了原始 d维特征空间中的一个合适的 m(m≤d)维的特征子空间。在模式识别系统中,线性特征提取方法被广泛使用。例如主成份分析法(Principal component analysis, PCA)和线性鉴别分析法(Fisher Linear Discriminant Analysis, FLDA)。

·分类器

分类器设计(Classifier design)是模式识别系统设计中的一项重要内容,也是处理许多其它问题的核心。系统中的分类器的作用是:根据特征提取器得到的特征向量来给一个被测对象赋一个类标记,分类的难易程度取决于两个因素,其一是来自同一个类别的不同个体之间的特征值的波动。其二是属于不同类别样本的特征值之间的差异。

我们考虑一个分类问题,输入是一个向量,被称为“模式”,每个模式含有n 个成分,这些成分被称为“特征”,这些特征构成一个 n 维的特征空间。假设m 个训练样本集{ x1, x2, ... , xm }∈Rn,样本集对应的标签{ y1, y2, ... ym }。 这些训练样本集被用来训练一个判别函数 y  =D(x),预测未知的新样本 x,按照判别函数的输出将新样本 x分类到相应的类中。

·后处理

后处理器利用分类器的输出结果来确定合适的动作,也可能采用“上下文信息”来改善系统的性能。 


分类:网络日志| 查看评论
相关文章
文章点击排行
本年度文章点击排行
发表评论:
  • 昵称: *
  • 邮箱: *
  • 网址:
  • 评论:(最多100字)
  • 验证码: