多震源盲分离技术研究
The Research of Multi-Source Data Separation Technology

作者: 王 珂 :中国地质大学研究生院,湖北 武汉;

关键词: 多震源盲分离Multi-Source Blind Signal Separation

摘要:
本文将双震源数据分离当成一个盲信号分离(Blind Signal Separation, BBS)的问题,介绍了盲信号分离基本理论,重点简述了线性瞬时模型的分离方法。对于混合数据个数m和单震源数n相同的情况,本文设计了一种基于去相关的盲信号分离处理方法,并对该分离方法做了数值模拟,证明了方法的有效性。

Abstract: This paper treats the separation of the double-source data as a blind signal separation problem, and introduces the basic theory of blind signal separation. In this paper, for the case where the number m of observed signals and the number n of sources are the same, a simple blind signal separation process is designed and the numerical simulation is carried out to prove the effectiveness of the proposed method.

1. 引言

多震源地震信号分离方法主要是通过分离多个震源激发而产生的混叠地震记录,从而得到混叠记录中的源信号的方法。由于多炮点激发相比单炮激发可以大幅度提高采集效率,降低成本,因此越来越受到重视 [1] 。而对于采集到的混叠信号,将其分离再进一步分析的方式是一种重要的研究方法。

而其中盲源分离(Blind Sourse Separation简称BSS)技术,是一种近几年迅速发展起来的多维信号处理方法。它以统计独立的基本原则建立目标函数,通过优化算法将观测信号分解为若干独立成分,来达到提取有用信息的目的,在通信、医学、勘探等多个领域获得了广泛的应用。本文在介绍其基本原理和具体算法研究的基础上,以该方法对双源地震混叠信号进行分离,发现其可以有效地将独立的源信号进行分离,取得了令人满意的结果。

2. 多震源混合信号概述

我们不妨将接收器接收到的单震源卷积混合数据看成一个独立的地震信号,当多震源激发时,不同震源的卷积混合数据显然是线性叠加的 [2] ,那么我们不妨将多震源地震数据表示为以下形式:

P b l = Γ P (1)

其中 P b l 表示了多震源混合数据,P为单个震源地震数据,Γ为混合算子。用离散的形式表出有:

P b l j = k = 1 N Γ k j P k (2)

其中, j = 1 , 2 , , M ,M表示扫描次数,N为道集数。

而通过多震源波场数据 P b l j ,通过计算得到单震源波场数据 P k 的过程,称作多震源地震波分离。

Γ k j 已知时,实际上它是一个一个线性反演问题,而当混合算子 Γ k j 未知,则此波场分离是一个盲过程,也就是我们上面提到的BSS技术。

3. BSS简介

3.1. BSS基本原理

我们来考虑这样一种情况,现在我们有一组信号,它们由几个不同的源发出,并存在多个接收器,分别接收了不同权重的信号的混合。

具体来说,我们可以假设共有三个源信号及三个接收器,观测信号我们不妨假设为 x 1 ( t ) x 2 ( t ) x 3 ( t ) ;而未知的源信号不妨设为 s 1 ( t ) s 2 ( t ) s 3 ( t ) ;这样,观测信号为原始信号的加权和,不妨设为:

x 1 ( t ) = a 11 s 1 ( t ) + a 12 s 2 ( t ) + a 13 s 3 ( t ) x 2 ( t ) = a 21 s 1 ( t ) + a 22 s 2 ( t ) + a 23 s 3 ( t ) x 3 ( t ) = a 31 s 1 ( t ) + a 32 s 2 ( t ) + a 33 s 3 ( t ) (3)

由于 a i j s i ( t ) 都是未知的,因此我们不能对它们进行直接估计。

我们现在要做的,就是在对于原始信号及其传播的物理过程都知之甚少的情况下,利用接收器的混合信号对原始信号进行估计。这就是盲源分离(BBS)问题。“盲”,意味着我们所知道的原始信号信息很少 [3] 。

而实际上,混叠信号一般可以有两种混叠方式,一种是我们上面提到的线性混合,即:

x i ( t ) i = 1 N a i j s i ( t ) , i = 1 , 2 , , N (4)

另外一种是卷积混合,即混合信号为源信号的不同是时延信号的混叠,即:

x i ( t ) i = 1 N k = 0 P a i j s i ( t k ) , i = 1 , 2 , , N (5)

3.2. 信号预处理

在对我们由接收器得到的混合信号进行ICA前,我们首先要对信号进行预处理,预处理的过程主要由两部分组成:去均值和白化。

3.2.1. 去均值过程

在对我们由接收器得到的混合信号进行ICA前,我们首先要对信号进行预处理,预处理的过程主要由两部分组成:去均值和白化。

由于在大多数的ICA算法中,对原始信号都有信号均值为0的假设,因此我们对具体问题做ICA前,需要首先去均值,即中心化。

因此,我们首先需要设 x ¯ i ( t ) ,使得:

x ¯ i ( t ) = x i ( t ) 1 N i = 1 N x i ( t ) , i = 1 , 2 , , N (6)

3.2.2. 白化过程

白化总是可以实现的,一般可以利用协方差矩阵的特征值分解:

E { x x T } = E D E T (7)

式中, E E { x x T } 的特征向量的正交矩阵, D 是相应的特征向量的对角矩阵。这样,白化过程可以利用以下的白化矩阵来实现:

V = E D 1 / 2 E T (8)

式中,矩阵 D 1 / 2 = d i a g ( d 1 1 2 , , d n 1 2 )

由于白化过程中,新的混合矩阵 A ˜ = V A 是正交的:

E { z z T } = A ˜ E { s s T } A ˜ T = I (9)

这就意味着我们可以把对混合矩阵的搜索范围限制到正交矩阵的空间中。我们可以无须估计原始矩阵 A 的全部 n 2 个参数,只要估计一个正交混合矩阵即可。一个正交混合矩阵包含 n ( n 1 ) / 2 个自由度。即是说,正交矩阵包含的可变参数个数基本上只有不到一半的任意矩阵参数个数。

4. 算法介绍及数据模拟

4.1. 线性混合盲分离算法

关于线性混合盲分离算法有很多,我们在这里提出一种基于二阶统计量的盲分离算法。该盲分离算法也被称为去相关算法,并对源信号一般有一定的要求,即具有统计不相关性、非白性。就双震源混合数据的盲分离问题而言,其系统的输入输出关系可以表示为

{ y 1 ( t ) = x 1 ( t ) ω 1 x 2 ( t ) y 2 ( t ) = x 2 ( t ) ω 2 x 1 ( t ) (10)

r y 1 y 2 ( t 1 , t 1 ) = E [ y 1 ( t 1 ) y 2 ( t 1 ) ] = r x 1 y 2 ( t 1 , t 1 ) ω 1 r x 2 y 2 ( t 1 , t 1 ) = 0 ,得到

ω 1 = r x 1 y 2 ( t 1 , t 1 ) r x 2 y 2 ( t 1 , t 1 ) = r x 1 y 2 ( t 1 , τ 1 ) r x 2 y 2 ( t 1 , τ 1 ) (11)

r y 1 y 2 ( t 2 , t 2 ) = E [ y 1 ( t 2 ) y 2 ( t 2 ) ] = r y 1 x 2 ( t 2 , t 2 ) ω 1 r y 1 x 1 ( t 2 , t 2 ) = 0 ,得到

ω 2 = r y 1 x 2 ( t 2 , t 2 ) r y 1 x 1 ( t 2 , t 2 ) = r y 1 x 2 ( t 2 , τ 2 ) r y 1 x 1 ( t 2 , τ 2 ) (12)

分离矩阵如下:

W = ( 1 ω 1 ω 2 1 ) (13)

对于 ω 1 , ω 2 [ 1 , 1 ] 范围内,我们可以任意赋予初值并迭代。构成了双震源混合数据的盲分离算法。该去相关算法计算简单,但对于初值选择有依赖性,收敛速度较慢。

本文依据白化处理和旋转处理算法,设计了一种新的基于去相关的盲分离方法,分离矩阵 的更新公式表示如下

W ( i j ) W W

W ( i j ) = [ cos θ i j sin θ i j sin θ i j cos θ i j ] (14)

其中, θ i j 为分离信号 y i , y j 之间的角度。通过白化处理和旋转处理可以分别消除数据的二阶相关性以及高阶相关性。

4.2. 算法步骤

假设源信号的相关矩阵 R s s ( 0 ) = E [ S S T ] = I ,即其具有零均值、单位方差、互不相关的性质。本文设计的盲信号分离处理方法,具体需要以下几个步骤来完成:

1) 将观测得到的混合数据用X表示;

2) 求出零时间延迟相关矩阵 R x x ( 0 ) = E [ X X T ]

3) 对 R x x ( 0 ) 进行奇异值分解,得到 R x x ( 0 ) = U A U ,U为正交矩阵,A为对角矩阵;

4) 计算预白化矩阵 B = A 1 / 2 U T ,则得到预白化后和混合数据为 Z = B X ;

5) 初始化盲分离信号Y,选取一对成分 y i , y j ,计算角度 θ i j

6) 如果 θ i j > ε ,其中 ε 1 ,求出 W ( i j ) = [ cos θ i j sin θ i j sin θ i j cos θ i j ] ,更新分离矩阵,

W ( i j ) W W

7) 旋转信号矩阵 Z : Z W ( i j ) Z ,直到 θ i j ε ,否则跳回(5)。

上述步骤中的预白化处理的本质是使其相关矩阵 R x x 变成单位矩阵,进而消除了混合信号的二阶相关性,最终达到分离混合数据的目的。

4.3. 数值模拟

图1中可以看出,混合震源数据是来自2个震源的激发信号,无法按照常规的方法直接进行处理,故需将其按照本文所设计的盲分离方法进行分离处理。混合震源中包含的单震源个数为2,则混合度为2,混合数据预白化处理后,由于混合度较低,经过一次旋转处理后,基本完成了双源数据的分离任务。通过图1图2的对比可以看出:将双震源混合数据(无加性噪音)按照本文设计的盲信号分离处理方法进行处理,其分离结果较好。因此,本文设计的盲信号分离处理方法能够有效地处理混合矩阵未知的双震源混合数据分离问题,成功完成了混合数据的分离任务。

Figure 1. Multi-source data (dual source)

图1. 混合震源数据(双震源)

Figure 2. Separate data

图2. 分离数据

5. 结语

本文将双震源混合数据的分离当成一个盲信号分离问题,在混合数据个数m和单震源数n相同的情况下,本文设计了一种基于去相关的盲源分离算法,成功实现了对混合数据的分离处理。事实上,混合数据通过预白化处理后,观测信号与源信号之间仅存在正交关系,故可以对处理后混合数据进行旋转处理,即可实现盲源分离。本文使用该去相关分离方法对混合数据分离做了数值模拟,证明了该方法的有效性,适用于混合矩阵Γ未知的多震源采集方式。本文提出的盲分离方法较传统的二阶盲分离法,简化了计算,并提高了算法的收敛速度。

参考文献

文章引用: 王 珂 (2018) 多震源盲分离技术研究。 应用数学进展, 7, 356-361. doi: 10.12677/AAM.2018.74044

参考文献

[1] 倪宇东. 可控震源地震勘探采集技术[M]. 北京: 石油工业出版社, 2014.

[2] 李剑锋. 基于盲源分离的地震信号处理方法研究及应用[D]: [硕士学位论文]. 青岛: 中国石油大学(华东), 2012.

[3] Aapohyvarinen, Juhakarhunen, Erkk. 独立成分分析[M]. 北京: 电子工业出版社, 2014.

分享
Top