6.4. 非规范方法的收敛性

6.4.1证明脉络

对于非规范方法, 研究其收敛性的方法与上述规范方法是类似的. 这里只给出脉络并指出一些不同之处:

第一步: 根据 , 我们可以通过构造

定义 6.4.1.1.

度函数

乘积算子 [multiplication operators]

积分算子

最后得到 上的算子

以上构造具有如下性质:

命题 6.4.1.2. 在问题的预先假设下, 有

1.

, 并且有一致的下界 及上界 ;

2.

的算子范数具有一致的上界 , 且 上的紧算子;

3.

下列关系式成立:

注意上述关系式中的系数 是由经验分布 带来的, 而规范方法中之所以没有该系数, 是因为对相似度函数进行了规范化 (回忆 的构造) .

第二步: 根据上面第三个关系式, 与规范方法的分析同理可以得到:

命题 6.4.1.3. 算子 与矩阵 的谱具有如下对应关系:

1.

具有相同的特征值;

2.

关于同一个特征值 的特征函数 及特征向量 具有如下的一一对应关系:

3.

的特征值都是非负的, 且聚点只可能在 中.

同理可以推知 也只有非负特征值, 并且聚点只可能在本性谱 中.

第三步: 与规范方法同理, 可以得到积分算子序列的集体紧收敛性 , 故只需再看乘积算子序列的收敛性: 根据定义及前述结论可得 a.s. 而由集体紧收敛性和依范数收敛性都可以推出紧收敛性, 有

定理 6.4.1.4. 在预先假设下, a.s.

第四步: 与规范方法同理, 由上述紧收敛性即可得到最终结论:

定理 6.4.1.5. 在预先假设下, 对于 的孤立特征值 , 存在其邻域 , 使得当 时, , 且 a.s. 进一步, 令算子 是关于 的谱投影, 是关于 的谱投影, 则 a.s.

是一个单特征值, 则还有特征向量的收敛性: 设 关于 的特征向量, 关于 的特征函数, 则存在一列 , 使得特别地, 对任意 , 集合 收敛到 , 即它们的对称差满足

6.4.2非孤立特征值

注意到非规范方法的收敛性要求 , 这比规范方法中的 要苛刻得多. 并且在实际中, 违反该条件的例子是存在的, 如:

例 6.4.2.1., 概率分布的密度为其中 为常数. 取相似度函数为 , 则 之外的特征值只有单平凡特征值 0.

在这种情形下, 的特征函数并不能提供任何信息进行聚类, 因有如下结论:

命题 6.4.2.2. 假设 , 其中 0 是单特征值. 又设概率分布 不存在点质量, 则矩阵 的第二特征值收敛到 , 且对应的特征函数接近某个 的示性函数或它们的线性组合.

(从略, 详见文章中的 Section 8)

更加不能接受的是, 要验证 这一条件, 我们需要首先知道 , 这显然违背实际问题的设定. 因此, 不仅坏的情形可能出现, 而且我们无法判断是不是出现了这样的情形.

总而言之, 结合之前对 Ncut 的分析, 在实际应用中, 我们倾向于使用规范方法.