碧波液压网 欢迎你,游客。 登录 注册

基于虚拟样本的双层圆柱壳体结构噪声源识别研究

版权信息:站内文章仅供学习与参考,如触及到您的版权信息,请与本站联系。

   

    双层圆柱壳体结构在工程上有广泛的用途,研究其声学性能具有十分重要的意义[1, 2]。然而从系统实际工况出发,研究其内部噪声源识别却非常少见。壳体内部包括为数众多的轴承、齿轮、轴系、螺旋桨以及阀门等等,在很多情况下,设备之间的振动信号会互相掩盖或是抵消[3]。此外各个设备运作过程及振动噪声传播机理也比较复杂,因而要精确得到系统的动态数学方,利用基于机理建模的方法求解是很困难的[4]。而以神经网络和决策树为代表的辨识建模方法[5]具有对系统参数依赖性小,非线性映射能力强等优点。但工程实际中由于测点布置与数据采集的困难,往往难以采集足够的噪声源训练样本,从而影响分类器的识别性能。因此可以考虑通过生成虚拟样本(VirtualSample)以改善所面临的小样本困境。

    1 虚拟样本研究

    给定n个独立同分布观测样本: (x1,y1), (x2,y2),,(xn, yn)和分类。根据统计学习理论(StatisticalLearningTheory, STL)[6],此时学习机器的实际风险R是由两部分组成的:一是经验风险Remp(即训练误差),另一部分称作置信范围5,它和学习机器的VC维数h及训练样本数n有关。可以简单地表示为:

RFRemp+5(h /n) (1)

    其中5随着h /n的增加而单调增加。当h /n较大时,置信范围5较大,用经验风险近似真实风险就有较大误差,学习机器的泛化性能较差;反之h /n较小,则置信范围5较小,经验风险最小化的最优解就接近实际的最优解,泛化能力就强。在分类问题中,当我们选定某种分类器结构后,VC维数即已确定,此时较大的训练样本数n会带来更好的分类效果。但实际问题中,由于数据获取成本较高或发生概率较小等原因,往往难以获取足够的样本数量。此时,利用虚拟样本生成技术可望提供一条新的解决思路。

    虚拟样本(VirtualSample)又可译为Synthetic Sam-ple或ArtificialSample。目前尚没有普遍接受的对于虚拟样本的权威定义。本文给出虚拟样本的定义如下:

    (定义1)给定独立同分布(.i .i d)于F(x,y)的n个样本(x1,y1), (x2,y2),,(xn,yn)。可得到一个新的联合概率G(x,y)=7(x1,y1,x2,y2,,,xn,yn)且存在一个较小的EE0满足

$i= [G(x,y) -F(x,y)]2FE P(x,y) (2)

    则称服从联合概率G(x,y)的样本为虚拟样本。

    下面利用VC维理论来分析虚拟样本在分类器泛化性能提升方面所起的作用。由(1)式可知,学习机器的实际风险R是由经验风险Remp和置信范围5组成。当某种分类器结构确定后,VC维数h即已确定,此时在训练集中增加虚拟样本,则训练样本数n变大,置信范围5变小,从而降低实际风险R。但考虑到虚拟样本的引入同时会导致训练误差增大,即经验风险Remp会变大。由此可见,当定义(1)中的G(x,y)SF(x,y)时(如基于Invariance的算法[7]),相当于保持Remp不变的同时,通过增大样本容量来减小置信范围5,从而降低风险R。而当G(x,y)XF(x,y)(如基于噪声叠加的算法[8])时,在训练集中添加虚拟样本后RcempERemp,5cF5,因此此时我们无法简单的判断实际风险R的变化趋势。但由于很多情况下往往会将n的值取得比较大,这就使得置信范围5减小的影响大于经验风险Remp增大的影响,从而同样可以改善分类器的泛化性能。

你没有登陆,无法阅读全文内容

您需要 登录 才可以查看,没有帐号? 立即注册

标签:
点赞   收藏

相关文章

发表评论

请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。

用户名: 验证码:

最新评论