紫外光谱水质分析仪中的支持向量机方法
1 引 言
运用紫外光谱数据测量水体中有机污染物浓度是利用了含有C=C或C=O不饱和键的有机物具有吸收特定光谱的特性,这样根据紫外光谱区的丰富光谱信息,建立光谱数据与有机污染物浓度的数学模型,并由该模型的外推能力,根据未知水样的光谱对该水样的有机污染物浓度进行预测。因此,紫外光谱水质分析仪的关键技术在于数学模型的建立以及模型的外推(泛化)能力。
本文将支持向量机方法应用于紫外光谱在线水质分析仪,提出了有机污染物浓度与紫外光谱数据的支持向量机建模方法。由于支持向量机方法是基于结构风险最小化(SRM)准则,与基于经验风险最小化准则(ERM)的传统学习方法如部分最小二乘、神经网络相比,支持向量机方法得到的数学模型,其推广能力要优越于传统学习方法得到的模型。
2 支持向量机建模方法
建立紫外光谱数据与有机污染物浓度的数学模型,就需要一组已知有机污染物浓度的水样作标准样品组(训练样本),根据有机污染物浓度和紫外光谱数据采用回归估计方法估计出两者的数学关系。
假定训练样本集为{(xi,yi),i =1,2,…,l},其中xi∈RN为输入值,yi∈R为对应的目标值,l为样本数。对于紫外光谱测量有机污染物浓度问题,xi表示紫外光谱数据,yi表示对应的有机污染物浓度。定义损失函数为:
计精度相关的设计参数。
在采用支持向量机研究非线性样本集时,通过非线性函数(·)将训练集数据x映射到一个高维特征空间,在这个维数可能为无穷大的特征空间中构造估计函数,假定f(x)为如下形式:
采用拉格朗日乘子法求解上式的二次规划问题,可得到:
有贡献,支持向量由此得名,对应的学习方法称为支持向量机(SVM)。在支持向量中,④和⑤对应的xi称为边界支持向量(BSV),是训练误差超过ε的数据点,②和③对应的xi称为标准支持向量(NSV),是训练误差恰为ε的数据点,非支持向量是训练误差小于ε的数据点。
对于标准支持向量,如果0<αi< C(α*i=0),由式(12)知,ξi=0 ,则由式(10)可得到:
w·(xi)+ b-yi+ε=0 (15)
这样可计算估计函数中的参数b为:
注解2:对于二次规划问题可以得到唯一的全局最优解,因此SVM不存在局部最优问题。
注解3:由式(18)、(19)知,尽管通过非线性函数(·)将样本数据映射到具有高维甚至为无穷维的特征空间,但在计算估计函数时并不需要显式计算该非线性函数,而只需计算核函数K(xi,xj),从而避免高维特征空间引起的维数灾难问题。核函数的选择必须满足Merce条件,常见的核函数有多项式函数、径向基函数、多层感知器函数、样条函数等等。
相关文章
- 2024-04-11在用压力容器射线检测中存在问题的分析
- 2023-02-08涡街流量计信号的高阶统计量特征
- 2023-04-23高g微加速度计的研究
- 2023-08-14图形点阵式液晶显示器模块EDM240128F在小型智能式测量仪器中的应用
- 2022-11-03基于RFID的多义性路径识别系统设计
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。