2.1. 矩阵的基本运算

矩阵的加法与数乘

一个 矩阵记为 行第 列的元素 称为矩阵 分量. 我们通常也把矩阵 用其元素记作

定义 2.1.1. 两个 矩阵的加法 定义为如下的 矩阵

如果用分量来表达的话 为对应的分量相加

由命题 1.4.12 我们知道 矩阵一一对应于 的线性映射. 考虑两个线性映射 , 它们的和 定义了一个 的线性映射如果 对应于矩阵 , 对应于矩阵 , 容易看出

定义 2.1.2. 给定一个数 和一个 矩阵我们定义它们的数乘 矩阵

我们用 来表示所有数域 中的 矩阵构成的集合 () . 如果不特别标记数域, 指的是实系数的 矩阵的集合

命题 2.1.3. 在矩阵的加法和数乘下构成一个线性空间.

通过矩阵的分量, 我们可以把矩阵 一一对应于 个实数 . 因此

矩阵的乘法

矩阵之间可以引进乘法运算. 为了说明如何定义矩阵相乘, 我们把一个矩阵 分量表示成一个箭头的样子

我们把 想象成从节点 到另一个节点 的权值.

是一个 矩阵, 是一个 矩阵.

这里 的指标都是从 , 我们可以把中间这个节点连接起来

我们考虑从 出发, 经过中间节点 , 最后到 的过程, 并对所有的中间节点 的位置求和得到一个从 的权值 . 这组新的数字 定义了一个 的矩阵, 记作这个新矩阵 就是矩阵 的乘积.

定义 2.1.4. 是一个 矩阵, 是一个 矩阵. 它们的乘积 定义为 矩阵, 其中 分量为这里 分量, 分量.

我们强调一下, 并不是任意两个矩阵都可以相乘. 这里两个矩阵 可以相乘的前提是 的列数和 的行数一样的, 即 “首尾相接”.

这个公式也表明 分量 , 是 的第 行向量 的第 列向量 对应位置的数字乘起来求和

例子 2.1.5.

我们同样可以把多个矩阵相乘. 设 依次是 矩阵. 则它们的乘积 是一个 矩阵, 其 分量为这里 是矩阵 分量. 我们可以画图表示为

矩阵的乘法满足结合律这里 矩阵, 矩阵, 矩阵. 结合律等价于如下的求和等式

线性映射的复合

我们知道线性映射一一对应于矩阵. 下面我们说明矩阵的乘法对应于线性映射的复合, 这给出了矩阵乘法定义方式的一个自然的解释. 设是两个线性映射. 它们的复合得到一个映射 依然是一个线性映射: 它保加法类似可证 保数乘.

命题 2.1.6. 如果线性映射 对应于 矩阵 , 对应于 矩阵 . 则它们的复合 对应于 矩阵 . 即矩阵的乘法对应于线性映射的复合.

证明: 记 的标准基 的标准基

对应的 矩阵 用矩阵元可以写成

对应的 矩阵 用矩阵元可以写成

我们考虑复合 , 其对应于矩阵它的第 列为因此 对应的矩阵即为矩阵 的乘积 .

我们可以对比一下矩阵乘积的表示法

和映射复合的表示法

矩阵乘法的结合律对应于映射复合的结合律.

我们可以用矩阵把线性映射写成显式的形式. 设 是线性映射, 对应于 矩阵 对于 中任一向量

因此写成向量形式, 线性映射 恰好是把 维列向量 (即 矩阵) 乘以 矩阵 , 得到 维列向量 (即 矩阵) .

总结一下, 线性映射和矩阵的关系可以用矩阵乘法表达为

分块矩阵

分块矩阵是指将矩阵按照某种方式划分成若干个小矩阵 (块) . 分块矩阵是将大矩阵分解为较小矩阵的一种有效方法, 有助于简化计算和表示结构化数据.

一个 矩阵可以分块表示为其中 是块矩阵的元素, 通常是较小的矩阵. 例如, 可以是 矩阵, 其中 是适当选择的维度.

假设我们有两个矩阵 , 它们分别分块表达为: 其中 的维度需要满足乘法的条件. 乘积 也会是一个分块矩阵: 其中每个块的计算可以通过类似的矩阵乘法公式得到:

具体而言, 我们有

注记. 注意到 都是一些矩阵块而不再是数字, 公式里每个矩阵块的乘积表达顺序是重要的. 这里我们需要按照乘积顺序把 的矩阵块写在前面, 的矩阵块写在后面. 例如 的矩阵元是 , 而不能写成 . 类似地矩阵乘法公式对于多个分块也是成立的, 具体细节留给读者证明.

例子 2.1.7. 考虑把如下矩阵进行分块:

按照如上分块计算矩阵乘积 因此我们得到矩阵 的分块表达

例子 2.1.8. 矩阵, 矩阵. 它们的乘积 矩阵. 我们可以通过分块来得到乘积 的行和列的表达.

首先我们把 分块成列向量的样子这里 中的列向量. 则作为分块矩阵, 我们得到如下公式 的第 列的列向量为 .

类似地, 我们把 分块成行向量的样子这里 中的行向量. 则作为分块矩阵, 我们得到如下公式 的第 行的行向量为 .

上面两个公式也可以直接通过矩阵乘法的定义来验证.