6.4. 非规范方法的收敛性
6.4.1证明脉络
对于非规范方法, 研究其收敛性的方法与上述规范方法是类似的. 这里只给出脉络并指出一些不同之处:
第一步: 根据 , 我们可以通过构造
定义 6.4.1.1.
• | 度函数 |
• | 乘积算子 [multiplication operators] |
• | 积分算子 |
• | 最后得到 上的算子 |
以上构造具有如下性质:
命题 6.4.1.2. 在问题的预先假设下, 有
1. | , 并且有一致的下界 及上界 ; |
2. | 的算子范数具有一致的上界 , 且 是 上的紧算子; |
3. | 下列关系式成立: |
注意上述关系式中的系数 是由经验分布 带来的, 而规范方法中之所以没有该系数, 是因为对相似度函数进行了规范化 (回忆 的构造) .
第二步: 根据上面第三个关系式, 与规范方法的分析同理可以得到:
命题 6.4.1.3. 算子 与矩阵 的谱具有如下对应关系:
1. | 具有相同的特征值; |
2. | 关于同一个特征值 的特征函数 及特征向量 具有如下的一一对应关系: |
3. | 的特征值都是非负的, 且聚点只可能在 中. |
第三步: 与规范方法同理, 可以得到积分算子序列的集体紧收敛性 , 故只需再看乘积算子序列的收敛性: 根据定义及前述结论可得即 a.s. 而由集体紧收敛性和依范数收敛性都可以推出紧收敛性, 有
定理 6.4.1.4. 在预先假设下, a.s.
第四步: 与规范方法同理, 由上述紧收敛性即可得到最终结论:
定理 6.4.1.5. 在预先假设下, 对于 的孤立特征值 , 存在其邻域 及 , 使得当 时, , 且 a.s. 进一步, 令算子 是关于 的谱投影, 是关于 的谱投影, 则 a.s.
若 是一个单特征值, 则还有特征向量的收敛性: 设 是 关于 的特征向量, 是 关于 的特征函数, 则存在一列 , 使得特别地, 对任意 , 集合 收敛到 , 即它们的对称差满足
6.4.2非孤立特征值
注意到非规范方法的收敛性要求 , 这比规范方法中的 要苛刻得多. 并且在实际中, 违反该条件的例子是存在的, 如:
例 6.4.2.1. 取 , 概率分布的密度为其中 为常数. 取相似度函数为 , 则 在 之外的特征值只有单平凡特征值 0.
在这种情形下, 的特征函数并不能提供任何信息进行聚类, 因有如下结论:
命题 6.4.2.2. 假设 , 其中 0 是单特征值. 又设概率分布 不存在点质量, 则矩阵 的第二特征值收敛到 , 且对应的特征函数接近某个 的示性函数或它们的线性组合.
更加不能接受的是, 要验证 这一条件, 我们需要首先知道 和 , 这显然违背实际问题的设定. 因此, 不仅坏的情形可能出现, 而且我们无法判断是不是出现了这样的情形.
总而言之, 结合之前对 Ncut 的分析, 在实际应用中, 我们倾向于使用规范方法.