2021 年 7 月我给一些高中生讲了几节课, 这是其讲义. 也算是温故而知新.
我的集训队作业中载有这样一道题: 给定正整数 n ; 证明充分大的素数 p 皆满足对任意 b ∈ Z / p , 方程 x n − y n = b 在 Z / p 中有解. 这有个用 Ramsey 理论的证明, 但这里我想讲特征和的方法. 这一方法可以得到此方程的解数与 p 相差小于 n 2 p . 它对多元对角方程i = 1 ∑ r a i x i n i = b 也能给出类似的估计, 得到其解数与 p r − 1 相差 O ( p 2 r − 1 ) . 此外, 现代理论还表明未必对角, 即未必形如上式的 r 元方程也有类似而弱一些的估计.
基本定义及性质 固定素数 p . 模 p 特征 指的是映射 χ : ( Z / p ) × → C × , 满足 χ ( ab ) = χ ( a ) χ ( b ) , 即它保持乘法. 设 g 是模 p 原根, 即 ( Z / p ) × = { 1 , g , … , g p − 2 } , 便有特征 χ 被 χ ( g ) 决定, 因为 χ ( g n ) = χ ( g ) n . 由于 g p − 1 = 1 , χ ( g ) 要取值在 p − 1 次单位根, 故模 p 特征共有 p − 1 个, 在 g 上取值分别为 e p − 1 2 kπi , k = 0 , … , p − 2 .
取值恒为 1 的特征称为平凡特征 , 记作 1 , 其余的称为非平凡特征 . 我们约定平凡特征在 0 处取值为 1 , 非平凡特征在 0 处取值为 0 , 这样就把特征看成 Z / p 到 C 的函数. 显然对特征 χ , a ∈ Z / p ∑ χ ( a ) = { p , 0 , χ = 1. χ = 1. 最经典的非平凡特征是 Legendre 符号 , 即二次剩余符号 ( p a ) = a 2 p − 1 mod p , 当 a 是模 p 二次剩余时取值 1 , 否则取值 − 1 . n 次方等于 1 , 即取值在 n 次单位根的特征称为 n 阶特征 . 由于特征的取值都是 p − 1 次单位根, 故 n 阶特征就是 g cd( n , p − 1 ) 阶特征. 把 n 换成 g cd( n , p − 1 ) 可设 n ∣ p − 1 , 则 n 阶特征共有 n 个, 在一个原根 g 上取值分别为 e n 2 kπi , k = 0 , … , n − 1 . 于是类似地, χ n = 1 ∑ χ ( g m ) = { n , 0 , n ∣ m . n ∤ m .
特征有什么好处呢? 我们先来展示用它计算方程 x 2 + y 2 = 1 模 p 的解数, 其中 p > 2 . 以下用字母 N 来表示方程模 p 的解数, 当 p 不固定时写 N p . 则由于 x 2 = a 在 a 为二次剩余时有两个解, a 为非二次剩余时无解, a = 0 时有一个解, 所以 N ( x 2 = a ) = 1 + ( p a ) . 于是N ( x 2 + y 2 = 1 ) = a + b = 1 ∑ N ( x 2 = a ) N ( y 2 = b ) = a + b = 1 ∑ ( 1 + ( p a ) ) ( 1 + ( p b ) ) = p + a + b = 1 ∑ ( p a ) ( p b ) , 其中最后一个等号是因为 Legendre 符号是非平凡特征, ∑ a ∈ Z / p ( p a ) = 0 . 所以需要求出上式最后一项. 利用特征的乘性以及二次剩余的性质计算a + b = 1 ∑ ( p a ) ( p b ) = a + b = 1 ∑ ( p ab ) = a ∈ Z / p ∑ ( p a ( 1 − a ) ) = a = 0 ∑ ( p ( 1 − a ) / a ) = a = 0 ∑ ( p 1/ a − 1 ) = c = − 1 ∑ ( p c ) = − ( p − 1 ) = − ( − 1 ) 2 p − 1 , 从而N ( x 2 + y 2 = 1 ) = p − ( − 1 ) 2 p − 1 .
相信这段计算已经展示出了特征的方便之处. 为处理一般情形, 需先观察 x n = a 模 p 的解数. 由费马小定理, 模 p 的 n 次方数与 g cd( n , p − 1 ) 次方数一样, 故可将 n 换成 g cd( n , p − 1 ) , 设 n ∣ p − 1 . 仍设 g 为模 p 原根, 则对每个 a ∈ ( Z / p ) × , 存在唯一 k ∈ { 0 , 1 , … , p − 2 } 使 a = g k , 且N ( x n = a ) = { n , 0 , n ∣ k ; n ∤ k ; 所以 N ( x n = a ) = ∑ χ n = 1 χ ( a ) . 注意 a = 0 时这等式也对. 这样便可对 n 1 , … , n r ∣ p − 1 计算N ( a 1 x 1 n 1 + ⋯ + a r x r n r = b ) = c 1 + ⋯ + c r = b ∑ N ( a 1 x 1 n 1 = c 1 ) ⋯ N ( a r x r n r = c r ) = c 1 + ⋯ + c r = b ∑ ( χ n 1 = 1 ∑ χ ( c 1 / a 1 ) ) ⋯ ( χ n r = 1 ∑ χ ( c r / a r ) ) = χ 1 n 1 = ⋯ = χ r n r = 1 ∑ χ 1 ( a 1 ) ⋯ χ r ( a r ) 1 c 1 + ⋯ + c r = b ∑ χ 1 ( c 1 ) ⋯ χ r ( c r ) . 所以为了估计左边, 就需要计算c 1 + ⋯ + c r = b ∑ χ 1 ( c 1 ) ⋯ χ r ( c r ) . 这一求和称为 Jacobi 和 , 记作 J b ( χ 1 , … , χ r ) . 由于 b = 0 时J b ( χ 1 , … , χ r ) = c 1 + ⋯ + c r = b ∑ χ 1 ( c 1 ) ⋯ χ r ( c r ) = d 1 + ⋯ + d r = 1 ∑ χ 1 ( b d 1 ) ⋯ χ r ( b d r ) = ( χ 1 ⋯ χ r ) ( b ) J 1 ( χ 1 , … , χ r ) , 所以实际上只需计算 J 1 和 J 0 . J 1 也简记作 J .
模长估计 接下来估计 Jacobi 和. 主要结论是∣ J ( χ 1 , … , χ r ) ∣ = ⎩ ⎨ ⎧ p r − 1 , 0 , p 2 r − 1 , p 2 r − 1 , ∀ i , χ i = 1. ∃ i , χ i = 1 ; ∃ j , χ j = 1. ∀ i , χ i = 1 ; χ 1 ⋯ χ r = 1. ∀ i , χ i = 1 ; χ 1 ⋯ χ r = 1. 以及∣ J 0 ( χ 1 , … , χ r ) ∣ = ⎩ ⎨ ⎧ p r − 1 , ( p − 1 ) p 2 r − 1 , 0 , ∀ i , χ i = 1. ∀ i , χ i = 1 ; χ 1 ⋯ χ r = 1. χ 1 ⋯ χ r = 1 或 ( ∃ i , χ i = 1 ; ∃ j , χ j = 1 ) . 其中第一种情况很显然: 每个 χ i 都平凡那么求和当然是 p r − 1 . 第二种情况也不困难: 比如 χ r = 1 , 则有J b ( χ 1 , … , χ r ) = c 1 + ⋯ + c r = b ∑ χ 1 ( c 1 ) ⋯ χ r ( c r ) = c 1 , … , c r − 1 ∈ Z / p ∑ χ 1 ( c 1 ) ⋯ χ r − 1 ( c r − 1 ) = i = 1 ∏ r − 1 c i ∈ Z / p ∑ χ i ( c i ) = 0 , 因为存在非平凡的 χ i , 乘积式中有 0 . 困难的是后两种情况, 我们一一处理. 故下设这些特征都非平凡. 首先把 J 0 化归到 J : J 0 ( χ 1 , … , χ r ) = c 1 + ⋯ + c r = 0 ∑ χ 1 ( c 1 ) ⋯ χ r ( c r ) = c r ∈ Z / p ∑ ( c 1 + ⋯ + c r − 1 = − c r ∑ χ 1 ( c 1 ) ⋯ χ r − 1 ( c r − 1 ) ) χ r ( c r ) = c r = 0 ∑ J − c r ( χ 1 , … , χ r − 1 ) χ r ( c r ) = c r = 0 ∑ ( χ 1 ⋯ χ r − 1 ) ( − c r ) J ( χ 1 , … , χ r − 1 ) χ r ( c r ) = χ r ( − 1 ) J ( χ 1 , … , χ r − 1 ) c r = 0 ∑ ( χ 1 ⋯ χ r ) ( − c r ) . 所以J 0 ( χ 1 , … , χ r ) = { ( p − 1 ) χ r ( − 1 ) J ( χ 1 , … , χ r − 1 ) , 0 , χ 1 ⋯ χ r = 1. χ 1 ⋯ χ r = 1. 故只需估计 J . 其次, 类比二次剩余的计算, 可以得到一个简单情形: J ( χ − 1 , χ ) = − χ ( − 1 ) . 这是因为J ( χ − 1 , χ ) = a + b = 1 ∑ χ − 1 ( a ) χ ( b ) = a + b = 1 , a = 0 ∑ χ ( b / a ) = a = 0 ∑ χ (( 1 − a ) / a ) = a = 0 ∑ χ ( 1/ a − 1 ) = c = − 1 ∑ χ ( c ) = − χ ( − 1 ) . 类似地, J 0 ( χ − 1 , χ ) = ( p − 1 ) χ ( − 1 ) . 最后的计算便是 Gauss 的魔法. 他用另一个和式来估计 Jacobi 和. 对特征 χ 以及 k ∈ Z / p , 定义g k ( χ ) = a ∈ Z / p ∑ χ ( a ) ζ p ka , 称为 Gauss 和 , 其中 ζ p = e p 2 πi . 显然对非平凡的 χ , g 0 ( χ ) = 0 . 对 k = 0 , g k ( χ ) = a ∈ Z / p ∑ χ ( a ) ζ p ka = χ ( k ) 1 a ∈ Z / p ∑ χ ( ka ) ζ p ka = χ ( k ) g 1 ( χ ) , 故同样只用算 g 1 . 也把 g 1 记作 g . 由于对非平凡的 χ ,( p − 1 ) ∣ g ( χ ) ∣ 2 = k ∈ Z / p ∑ ∣ g k ( χ ) ∣ 2 = k ∈ Z / p ∑ ⎝ ⎛ a ∈ Z / p ∑ χ ( a ) ζ p ka ⎠ ⎞ ⎝ ⎛ b ∈ Z / p ∑ χ ( b ) ζ p − kb ⎠ ⎞ = a , b ∈ Z / p ∑ χ ( a ) χ ( b ) k ∈ Z / p ∑ ζ p k ( a − b ) = p a = b ∈ Z / p ∑ χ ( a ) χ ( b ) = p ( p − 1 ) , 所以 ∣ g ( χ ) ∣ = p . 然后计算g ( χ 1 ) ⋯ g ( χ r ) = ⎝ ⎛ a 1 ∈ Z / p ∑ χ 1 ( a 1 ) ζ p a 1 ⎠ ⎞ ⋯ ⎝ ⎛ a r ∈ Z / p ∑ χ r ( a r ) ζ p a r ⎠ ⎞ = a 1 , … , a r ∈ Z / p ∑ χ 1 ( a 1 ) ⋯ χ r ( a r ) ζ p a 1 + ⋯ + a r = b ∈ Z / p ∑ ( a 1 + ⋯ + a r = b ∑ χ 1 ( a 1 ) ⋯ χ r ( a r ) ) ζ p b = b ∈ Z / p ∑ J b ( χ 1 , … , χ r ) ζ p b = J 0 ( χ 1 , … , χ r ) + J ( χ 1 , … , χ r ) b = 0 ∑ ( χ 1 ⋯ χ r ) ( b ) ζ p b . 当 χ 1 ⋯ χ r = 1 时, 由前面对 J 0 的计算, J 0 ( χ 1 , … , χ r ) = 0 , 上式给出J ( χ 1 , … , χ r ) = g ( χ 1 ⋯ χ r ) g ( χ 1 ) ⋯ g ( χ r ) , 模长为 p ( p ) r = p 2 r − 1 . 当 χ 1 ⋯ χ r = 1 时, ∑ b = 0 ( χ 1 ⋯ χ r ) ( b ) ζ p b = − 1 , 上式给出J ( χ 1 , … , χ r ) = J 0 ( χ 1 , … , χ r ) − g ( χ 1 ) ⋯ g ( χ r ) . 当 r = 2 时这给出J ( χ − 1 , χ ) = J 0 ( χ − 1 , χ ) − g ( χ − 1 ) g ( χ ) ; 而 J ( χ − 1 , χ ) = − χ ( − 1 ) , J 0 ( χ − 1 , χ ) = ( p − 1 ) χ ( − 1 ) , 从而 g ( χ − 1 ) g ( χ ) = p χ ( − 1 ) . 代入 χ = χ r , 则 χ 1 ⋯ χ r − 1 = χ − 1 , 于是有 g ( χ 1 ⋯ χ r − 1 ) g ( χ r ) = p χ r ( − 1 ) . 现在由前面对 J 0 的计算, J ( χ 1 , … , χ r ) = ( p − 1 ) χ r ( − 1 ) J ( χ 1 , … , χ r − 1 ) − g ( χ 1 ) ⋯ g ( χ r ) = ( p − 1 ) χ r ( − 1 ) g ( χ 1 ⋯ χ r − 1 ) g ( χ 1 ) ⋯ g ( χ r − 1 ) − g ( χ 1 ) ⋯ g ( χ r ) = ( p − 1 ) p g ( χ 1 ) ⋯ g ( χ r ) − g ( χ 1 ) ⋯ g ( χ r ) = − p g ( χ 1 ) ⋯ g ( χ r ) , 模长为 p ( p ) r = p 2 r − 1 . 这样便算出了所有想要的估计.
所以方程的解数也有估计: N ( a 1 x 1 n 1 + ⋯ + a r x r n r = b ) = χ 1 n 1 = ⋯ = χ r n r = 1 ∑ χ 1 ( a 1 ) ⋯ χ r ( a r ) 1 c 1 + ⋯ + c r = b ∑ χ 1 ( c 1 ) ⋯ χ r ( c r ) = χ 1 n 1 = ⋯ = χ r n r = 1 ∑ χ 1 ( a 1 ) ⋯ χ r ( a r ) J b ( χ 1 , … , χ r ) = p r − 1 + χ 1 n 1 = ⋯ = χ r n r = 1 , ∀ i , χ i = 1 ∑ χ 1 ( a 1 ) ⋯ χ r ( a r ) J b ( χ 1 , … , χ r ) , 所以∣ N ( a 1 x 1 n 1 + ⋯ + a r x r n r = b ) − p r − 1 ∣ ≤ { ( n 1 − 1 ) ⋯ ( n r − 1 ) ( p − 1 ) p 2 r − 1 , ( n 1 − 1 ) ⋯ ( n r − 1 ) p 2 r − 1 , b = 0. b = 0. 即当 b = 0 , r ≥ 3 或 b = 0 , r ≥ 2 时, a 1 x 1 n 1 + ⋯ + a r x r n r = b 模 p 的解数关于 p 渐进地是 p r − 1 .
小情形的具体计算 在元数和幂次都比较小的情形, 方程的解数是可以计算的, 一开始对 x 2 + y 2 = 1 的具体计算是个例子. 这里再展示一个例子: p ≡ 1 ( mod 3 ) 时, N ( x 3 + y 3 = 1 ) = p − 2 + A , 其中整数 A 满足 4 p = A 2 + 27 B 2 , A ≡ 1 ( mod 3 ) . 我们仍用 Jacobi 和做计算. 记 ω = 2 1 + − 3 为三次单位根, 取模 p 原根 g , 记 χ 为在 g 上取值 ω 的特征, 则N ( x 3 + y 3 = 1 ) = a + b = 1 ∑ N ( x 3 = a ) N ( y 3 = b ) = a + b = 1 ∑ ( 1 + χ ( a ) + χ 2 ( a )) ( 1 + χ ( b ) + χ 2 ( b )) = p + J ( χ , χ ) + 2 J ( χ , χ 2 ) + J ( χ 2 , χ 2 ) . 由于 χ 3 = 1 , χ 2 = χ − 1 = χ ˉ . 又 χ ( − 1 ) 2 = χ (( − 1 ) 2 ) = 1 且 χ ( − 1 ) 3 = ( χ 3 ) ( − 1 ) = 1 , 有 χ ( − 1 ) = 1 . 所以 J ( χ , χ 2 ) = − χ ( − 1 ) = − 1 , 上式右边就是p − 2 + 2 Re J ( χ , χ ) . 尚需求出 J ( χ , χ ) . 由于 χ 的取值只有 1 , ω , ω 2 = − 1 − ω , 可设 J ( χ , χ ) = a + bω , a , b ∈ Z . 首先由 ∣ J ( χ , χ ) ∣ = p 即知 a 2 − ab + b 2 = p . 其次由 g ( χ ) g ( χ 2 ) = g ( χ ) g ( χ − 1 ) = p χ ( − 1 ) = p , J ( χ , χ ) = g ( χ 2 ) g ( χ ) 2 = p g ( χ ) 3 . 而g ( χ ) 3 = ⎝ ⎛ a ∈ Z / p ∑ χ ( a ) ζ p a ⎠ ⎞ 3 ≡ a ∈ Z / p ∑ χ ( a ) 3 ζ p 3 a = a = 0 ∑ ζ p 3 a = − 1 ( mod 3 ) , p ≡ 1 ( mod 3 ) , 所以 J ( χ , χ ) ≡ − 1 ( mod 3 ) , 即 a ≡ − 1 ( mod 3 ) , b ≡ 0 ( mod 3 ) . 令 A = 2 a − b = 2 Re J ( χ , χ ) , B = b /3 , 则 A 2 + 27 B 2 = 4 p , A ≡ 1 ( mod 3 ) , 即所欲证. 作为竞赛练习, 同学们可试图验证这样的 A 被 p 唯一确定. 这可用环 Z [ ω ] = { a + bω ∣ a , b ∈ Z } 的唯一分解证明, 大概也有纯初等的证法. 感兴趣的同学还可以算算诸如 x 4 + y 2 = 1 , x 1 2 + ⋯ + x r 2 = 1 之类的方程解数.
现代评注 这节是我后加的.
取定有限域 F q 以及素数 ℓ ∤ q . 以 X 记方程i = 1 ∑ r a i x i n i = b 对应的代数簇. 设 n 1 , … , n r , b 都在 F q 上非零, 那么 X 在 F q 上 r − 1 维光滑. Grothendieck 告诉我们Z X ( t ) = det ( 1 − tF ∣ R Γ c ( X , Q ℓ )) , 其中 F 指紧支上同调 R Γ c ( X , Q ℓ ) 的几何 Frobenius 自同态, 如果我没记错.
(接下来反正写出特征和结果的上同调解释.)
参考文献 [1]
Kenneth Ireland, Michael Rosen (1990). A Classical Introduction to Modern Number Theory . Graduate Texts in Mathematics 84 . Springer, New York.
[2]
Reinhardt Kiehl, Rainer Weissauer (2001). Weil Conjectures, Perverse Sheaves and l -adic Fourier Transform . A Series of Modern Surveys in Mathematics 42 . Springer–Verlag Berlin Heidelberg.