我们来看一些稍复杂情况. 假设 f 和 g 都处处连续, 我们想要证明复合
函数 f ○ g 也处处连续. 我们需要集中考虑一个特殊的 x 值. 因此, 假
设 g 在 x = a 上连续. 那么我们需要 f 在哪里连续呢?我们想要证明
因此没有必要去担心 f 在 x = a 上是否连续. 我们需要的是它在 g (a)
上连续, 因为我们要在 g (a) 的附近且在点 g (a) 上评估 f .
下面就是我们面临的情况:g 在 x = a 上连续, 且 f 在 x = g (a) 上
连续, 要证明 f ○ g 在 x = a 上连续. 为了求证, 我们需要在游戏中增
加第三参与者. 事实上, 我将对抗这个新的参与者, 我们称之为
Smiddy, 而 Smiddy 将对抗你.
来看看如何玩游戏吧. 由于 f 在 g (a) 上连续, 我们知道
注意, 我使用 y 作为代替 x 的虚拟变量, 但这没问题 —— 你可以将 y
变成你喜欢的任意字母, 它们表示的是同一个意义. 不管怎样, 我们设 L
= f (g (a)). 然后, 你选取你的 ε > 0, 建立你的容忍区间 (L - ε, L +
ε). 而你要挑战 Smiddy, 舍弃以 y = g (a) 为中心的一个小区间外面
的一切, 以便所剩的函数值都落在你的区间内. 即, Smiddy 应该选取 λ
> 0, 使得 |y - g (a)| < λ 时都有 |f (y) - L| < ε. 因为以上极限是正
确的, 所以 Smiddy 就可以这样做. 为什么要用 λ 代替 δ 呢?因为
Smiddy 非常喜欢它.
现在, 轮到我来对抗 Smiddy 了. 这一次, 我们根据 g 在 x = a 上连续
的事实写出
关键是:Smiddy 使用的是数 λ, 而不是你已经使用的 ε! 因此,
Smiddy 的容忍区间是 (g (a) - λ, g (a) + λ). 现在, 我必须舍弃以 x
= a 为中心的一个小区间外的一切, 以便所剩的函数值落在 Smiddy
的区间内. 因为以上极限是正确的, 所以我可以选择 δ > 0, 使得只要
|x - a| < δ, 就有 |g (x) - g (a)| < λ.
我们要综合考虑. 由于我和 Smiddy 的游戏, 我们知道只要 |x - a| <
δ, 就有 |g (x) - g (a)| < λ. 而你和 Smiddy 的游戏显示, 如果 |y - g
(a)| < λ, 那么 |f (y) - L| < ε. 我们不管 Smiddy, 用 f (g (a)) 替换
L, 用 g (x) 替换 y. 可以看到, 只要 |x - a| < δ, 就有 |f (g (x)) - f (g
(a))| < ε. 这表示, 如果我直接与你对抗, 我总是可以做一次合情理的
移动, 不管 ε 是什么 (只要它为正). 因此, 我们实际上就证明了
其中 g 在 x = a 上连续且 f 在 g (a) 上连续. 当然, 如果 f 和 g 都处
处连续, 那么复合函数 f ○ g 也处处连续.
我们可以对论证进行修正, 以便包括 x → ∞ 或 x → -∞ 而不是 x = a
的情况. 由于右边不能是 g (∞), 故我们必须对陈述稍作修改. 最好的做
法就是
我们也可以对 x → -∞ 的情况做类似的修改. 我把证明的细节留给
你来完成, 但基本思想是你和 Smiddy 的对抗是不变的, 但我和
Smiddy 的对抗会稍有不同:我选取 N 而不是 δ, 且不等式 |x - a| <
δ 必须用 x > N 或 x < N 来替换, 这取决于你所处的情况是 x → ∞
还是 x → -∞.
我们现在可以建立极限
它在 3.4 节出现过. 事实上, 如果你设 f (x) = sin (x) 且 g (x) = 1/x,
除了 g 在 x = 0 上不连续外, f 和 g 都是处处连续的. 因为
我们可以使用上述公式推出结论
更直观的一种表达方式是, 当 x → ∞ 时 1/x → 0, 故当 x → ∞ 时 sin
(1/x) → sin (0) = 0.
A.4.2 介值定理的证明
在 5.1.4 节中, 我们见过介值定理, 它表明如果 f 在 [a, b] 上连续, 且
f (a) < 0 及 f (b) > 0, 那么存在某个数 c 使得 f (c) = 0. 现在, 我们
来看看证明此定理的基本思想.
我们考虑区间 [a, b] 上使得 f (x) < 0 的 x 值的集合. 我们知道 a 在
这个集合中, 因为 f (a) < 0; 而 b 不在这个集合中. 我们想要求出此集
合中最大的数 c, 但这或许不太可能. 例如, 小于 0 的最大数是什么
呢?没有. 对于任意的负数, 你总是可以找到一个接近 0 的负数, 例如,
将你的数除以 2. 另一方面, 我们可以找到此集合中右边穿插的一个数
c. 特别地, 我们可以坚持说此集合中没有哪个元素在 c 的右边, 而且任
意带有端点 c 的开区间至少包括此集合中的一个元素. (这来自于实轴
的一个很好的性质 —— 完备性. ) 以下是我们知道的, 用符号表示:
(1) 对于任意的 x > c, 我们有 f (x) ≥ 0;
(2) 对于任意的区间 (c - δ, c), 其中 δ > 0, 区间内至少存在一点 x 使
得 f (x) < 0. 现在该忙起来了. 以下就是重要的问题:f (c) 是什么?
我们假设它是负的. 在这种情况下, 由于 f (b) > 0, 故 c ≠ b. 因为 f
是连续的, 所以当 x 在 c 的附近时, f (x) 的值应该在 f (c) 的附近; 但
当 x 在 c 的右边一点点时就会有问题, 因为 f (x) 预期应该是正的, 而
f (c) 为负. 更正式地, 你可以选择 ε = -f (c) /2 (它是正的), 那么你的
容忍区间就是 (3f (c) /2, f (c) /2), 它仅由负数组成. 我不能选取任何
位于 [a, b] 中形如 (c - δ, c + δ) 的区间, 因为任何这样的区间都包含
一个大于 c 的 x. 根据上面的条件 (1), 我们知道 f (x) 一定为正, 这表
示它不会位于你的容忍区间. 因此, 不可能有 f (c) < 0. 直观上, 如果
有 f (c) < 0, 那么你的穿插仍然有数在它的右边!
或许 f (c) > 0. 在这种情况下, 我们不可能有 c = a, 因为 f (a) < 0.
现在, 当 x 在 c 的附近时, f (x) 的值应该在 f (c) 附近; 特别地, 它们
应该是正的. 由于上面的条件 (2), 所以这是个问题. 更明确些, 这一次
你可以选择 ε = f (c) /2, 则你的容忍区间是 (f (c) /2, 3f (c) /2). 我需
要尝试找到一个在 [a, b] 中的区间 (c - δ, c + δ), 使得对于我的区间
中的任意 x, f (x) 总是位于你的容忍区间里. 特别地, f (x) > 0. 这意
味着, 对于 (c - δ, c) 中的所有 x 有 f (x) > 0, 这和条件 (2) 是相悖
的. 故 f (c) > 0 也不可能. 如果它是真的, 那么我们可以将穿插再向左
边挪一些, 因此它不会是 c.
剩下的是什么呢?唯一可能就是 f (c) = 0, 因此, 我们证明了该定理.
顺便要说的是, 我们很容易将情况改为 f (a) > 0 及 f (b) < 0 的情况.
你可以稍稍改写一下证明, 或者设 g (x) = -f (x) 并对 g 而不是 f 应用
该定理.
A.4.3 最大 - 最小定理的证明
现在我们来证明 5.1.6 节的最大 - 最小定理. 其基本思想是, 假定我们
有一个在闭区间 [a, b] 上连续的函数 f , 我们断言, 该区间上存在某个
数 c 使 f 达到最大值. 正如我们看到的, 这表示 f (c) 大于或等于其他 f
(x) 的值, 其中 x 在整个区间 [a, b] 上漫游.
证明如下. 我们想要证明的是, 你可以放置某条水平线 y = N , 使得所
有的函数值 f (x) 都位于这条线的下方. 如果做不到这一点, 那么函数
就会在 [a, b] 内的某处变得越来越大, 而不会有最大值. 因此, 我们假
设你画不出这样的一条线. 那么, 对于每一个正数 N , 在 [a, b] 中存在
某个点 x 使得 f (x ) 在水平线 y = N 的上方即我们找到了若干个点
N
N
x , 对于每一个 N , 都有 f (x ) > N . 我们在 x 轴上用 X 将它们标出
N
N
来.
这些标记点在哪里呢?有无穷多个这样的点. 因此, 如果我们将区间
[a, b] 分成两半得到两个新的区间, 它们中的某一个定然包含无穷多个
标记点. 它们可能都包含无穷多个标记点, 但不可能都只包含有限个标
记点, 否则总的标记点将是有限的. 让我们把注意力集中在原始区间中
包含无穷多个标记点的那一半上. 如果它们都如此, 那就选择你最喜欢
的那个 (这没有关系的). 现在, 我们用新的更小的区间重复这个练习:
将它分成两半. 其中之一一定包含无穷多个标记点. 只要你喜欢, 我们
就继续做这个练习, 你会得到一个变得越来越小的区间的集合, 一个套
一个, 并且每一个都包含无穷多个标记点. 我们将这些区间一个一个地
堆在一起, 如图 A-9 所示.
图 A-9
2
直观上, 必有实数存在于所有这些区间之中, 我们称之为数 q. f (q) 是
什么呢?我们可以使用 f 的连续性来获得一些信息. 事实上, 我们知道
2 同样, 我们需要使用实轴的完备性来证明. 事实上, 一定只存在一个这样的数 —— 你知道为
什么吗?
因此, 打个比方, 如果你选取的 ε 是 1, 那么我应该能够找到一个区间
(q - δ, q+ δ), 使得对于所有该区间中的 x 都有 |f (x) - f (q)| < 1. 问
题是, 这个区间 (q - δ, q + δ) 包含了无穷多个标记点! 因为不管 δ
多么小, 我们选择的最后一个小区间都会位于 (q - δ, q + δ) 内. 这才
是问题所在:所有这些标记点都应该在区间 (q - δ, q + δ) 内, 当你对
其中任意一个点取 f 值时, 会得到一个介于 f (q) - 1 和 f (q) + 1 之间
的数. 因此, 不管 f (q) 是什么, 我们都会陷入困境:某些标记点的函数
值会远远大于 f (q) + 1. 一切都将失去控制. 因此, 画不出让整个函数
位于其下方的直线 y = N , 这一假设是错的.
事情还没有结束. 我们有了这条线 y = N , 它位于 y = f (x) 在 [a, b]
的图像的上方, 现在, 我们需要将它向下移动, 直到它接触到该图像以
便求最大值. 因此, 我们选取尽可能小的 N , 使得对于 [a, b] 内的所有
x 有 f (x) ≤ N . (我们再次使用了完备性. ) 现在我们需要证明, 对于某
个 c 有 N = f (c). 为了求证, 我们要重复在标记点中所使用的技巧, 只
是这一次将它们用圈标记出来. 我们选取一个正整数 n, 在 [a, b] 中一
定能够找到某个数 c , 使得 f (c ) > N - 1/n. 如若不然, 我们就应该在
n
n
y = N - 1/n(或更低处) 而不是 y = N 处画那条线. 因此, 存在这样的
一个 c , 且对于每一个正整数 n 都存在. 我们将这些点圈起来. 有无穷
n
多个这样的点, 当你对它们取 f 值时, 其结果会越来越接近 —— 事实
上是任意地接近 ——N . (没有一个值会超过 N , 因为对于所有的 x 有
f (x) ≤ N !) 现在, 我们所要做的就是持续将区间 [a, b] 进行二分, 使
得每一个小区间都包含无穷多个圈起来的点. 和前面一样, 在所有的区
间中都存在一个数 c. 这个数又被圈起来的点所环绕着.
f (c) 是什么呢?它不可能大于 N , 但或许它会小于 N . 我们假设 f (c)
= M , 其中 M < N , 另外设 ε = (N - M) /2. 由于 f 是连续的, 我们实
际上需要
你有你的 ε, 因此我需要找到一个区间 (c - δ, c + δ), 使得对于在我区
间内的 x, f (x) 位于 (M - ε, M + ε) 中. 问题是 M + ε = N - ε, 且不
管我如何选取 δ > 0, 都有无穷多个圈起来的点位于 (c - δ, c + δ) 中.
它们其中一些的函数值可能位于 (M - ε, M + ε) 中, 但由于函数值会
变得接近 N , 因而大多数不会位于 (M - ε, M + ε) 中. 因此, 我不能移
动. 唯一解脱的方法就是 f (c) = N . 这表示 c 是函数取得最大值的点.
这样我们就完成了求证!
要得到定理的最小值的形式, 只需要将定理重新应用到 g (x) = -f (x)
上就可以了. 毕竟, 如果 c 是 g 取得最大值的点, 那么它就是 f 取得最
小值的点.
本书由「ePUBw.COM」整理,ePUBw.COM
提供最新最全的优质电子书下载!!!
A.5 再谈指数函数和对数函数
在 9.2 节中, 我们发展了指数函数和对数函数的理论, 最终的发现就是
和 .
当时还有个不精确的结尾:我们断言
存在, 并称之为 e, 但我们并没有证明过它. 直接证明上述极限存在是
可能的, 但这提供不了任何特别的信息. 反之, 我假设你已经学了积分
和微积分基本定理 (见第 16 章和第 17 章), 从而我可以用一个不同
的方法解决问题. 事实上, 一切都是从对数函数开始的.
我们先根据规则定义一个函数 F ,
对于所有的 x > 0 成立. 这个函数基于另一个函数的积分, 就这类函
数请参见 17.1 节. 现在, 我知道你可以写出
因为 x > 0 且 ln (1) = 0. 问题是, 我们的行动过早了! 如果真要以恰
当的方式求解, 就不能使用 ∫ 1/t dt = ln |t| + C 这一事实. 实际上,
这是我们想要证明的事情之一. 目前为止, 我们不能假设 F (x) = ln
|x| , 那就让我们从证明它开始吧.
让我们写出函数 F 的一些有趣性质. 根据微积分第一基本定理, F 的导
数为
因此, F 可导, 这意味着它是连续的 (见 5.2.11 节). 接下来, 我们设 x
= 1, 从而得
因为若积分上下限相等且函数在那里确实有定义, 则任何函数的积分
都是 0(见 16.3 节). 极限
如何呢?事实上, 根据反常积分的定义 (见 20.2 节), 我们有
反常积分 发散, 我们必须非常小心提到. 最初证明它的发散性
时, 我们使用了公式 ∫ 1/t dt = ln |t| + C, 但我们现在不能这样做!
而是使用了积分判别法来说 和 同时收敛或同时发散;
然后使用 22.4.3 节中的论证来证明该级数发散; 故该积分也发散. 因
此我们有
和 .
由于 F 连续, 介值定理 (见 5.1.4 节) 表明, 一定存在一个数 e 使得 F
(e) = 1. 毕竟, 1 介于 0 和 ∞ 之间! 此外, 对于所有的 x > 0, F' (x)
= 1/x > 0, 我们因此知道 F 总是递增的. 因此, 不可能存在其他的数
c, 使得 F (c) = 1. 我们已经有了 e 的正式定义:
现在, 我们选取一个有理数 α 并定义
使用 17.5.2 节中描述的变形 2 的技巧, 可以看到
(不使用对数函数求导, 假设我们知道 . 如果只知道
对于正整数是成立的, 正如 6.1 节所述, 那么我们来看看是否可以对于
所有的有理数来证明这个事实.) 另一方面, 我们知道 F' (x) = 1/x, 因
此, 上述方程暗示了 G' (x) = αF' (x). 由于 α 是常数, 我们看到 G
(x) = αF (x) + C, 其中 C 是常数. 特别地, 如果我们设 x = 1, 此方
α
程变为 G (1) = αF (1) + C. 现在有 G (1) = F (1 ) = F (1) = 0,
α
α
故 C = 0. 由于 G (x) = F (x ), 我们就证明了 F (x ) = αF (x), 对于
任意有理数 α 及 x > 0 成立. 事实上, 由于 F 连续, 结果对于任意实
α
数 α 一定也适用! 现在我们设 x = e, 会看到 F (e ) = αF (e) = α,
x
因为 F (e) = 1. 我们将 α 变为 x, 这样就证明了 F (e ) = x. 因此, F
x
是 e 的反函数, 这表示 F (x) = ln (x). 因为我们知道 F' (x) = 1/x,
x
这就证明了 . 现在, 如果 y = e , 那么 x = ln (y), 故
x
x
根据链式法则, dy/dx = e . 因此, 我们对 ln (x) 和 e 求了导且证明
了 e 存在!
现在, 我们要做的就是证明
这十分简单:令 y = (1 + h) 1/h , 于是 ln (y) = ln (1 + h) /h. 故根
据 9.4.3 节中使用的论证 (或洛必达法则)
1
+
+
当然, 如果当 h → 0 时 ln (y) → 1, 那么当 h → 0 时 y → e = e.
这就证明了上述极限. 关键是, 一旦你知道 ln (x) 关于 x 的导数是
1/x, 那么其余的一切对你来说就很容易了.
本书由「ePUBw.COM」整理,
ePUBw.COM 提供最新最全的优质电子书下
载!!!
A.6 微分与极限
在这一节, 我们将证明一些涉及微分和极限的结论. 更确切地说, 我们
要处理函数的常数倍、函数的和与差的求导, 以及乘积法则、商法则
与链式求导法则. 然后, 我们将证明极值定理、罗尔定理、中值定理以
及线性化中的误差公式. 最后, 我们会看到分段函数的导数以及洛必达
法则的证明.
A.6.1 函数的常数倍
假设 y 是关于 x 的一个可导函数, c 是某个常数. 我们想要证明
这相当简单. 我们用 y = f (x) 定义 f , 那么上述方程的左边就是
你所要做的就是从分子中提取一个 c 的因子并将它拖到极限之外. 这
是在 A.2.2 节结尾部分证明过的:
右边正好是 cf' (x), 它和 c (dy/dx) 一样. 这样我们就完成了求证.
A.6.2 函数的和与差
假设 u 和 v 都是 x 的可导函数, 我们想要证明的是
以及类似地用减号代替加号. 这几乎没什么可证的. 记 u = f (x) 及 v
= g (x), 那么上述方程的左边就是
你所要做的就是重新整理这个和, 并拆分极限, 这是在 A.2.1 节中证明
过的, 上述极限等于
这就是 f' (x) + g' (x), 它等于我们想要证明的方程的右边. 用减号替
换加号的情况也同样简单!
A.6.3 乘积法则的证明
对于乘积法则和商法则的证明, 我们将继续使用记号 dy/dx 而不是 f'
(x), 因为使用前者更易于理解概念. 正如 5.2.7 节所述, 我们有
其中 Δy 是将 x 变为 x + Δx 时 y 的变化量.
因此, 我们想要证明的乘积法则说的就是
假设我们将 x 变为 x + Δx, 那么 u 就变为 u + Δu, v 就变为 v +
Δv. 而 uv 就变为 (u + Δu) (v + Δv). 这个变化量有多大呢?我们取
原来的量与新的量的差来看看:
展开并化简, 得到
现在用该式除以 Δx. 对于最后一项, 我们要多除以一个 Δx, 再乘以这
个量使方程两边保持平衡. 结果是
如果你取当 Δx → 0 时的极限, 那么所有的比率都会趋于相应的导数,
但最后一个 Δx 的因子会趋于 0, 即
由于最后一项为 0, 我们就证明了乘积法则. 现在, 你应该尝试写
出一个使用 f (x) 记号 (形式 1) 的证明了.
A.6.4 商法则的证明
现在我们想要证明
同样, 当 x 变为 x + Δx 时, 我们知道 u 和 v 就会分别变为 u + Δu
及 v + Δv. 而 u/v 就变为 (u + Δu) / (v + Δv). 这个变化量是
我们对上式通分并消除 uv - uv, 得到
将上式除以 Δx, 再用 Δx 和分母中的 Δv 的项相乘并相除, 得到
现在令 Δx → 0. 所有的分式都变为导数, 并且分母中的最后一个因子
趋于 0, 因此我们得到结果
由于分母中的最后一项是 0, 我们证明了商法则.
A.6.5 链式求导法则的证明
假设 y 是 u 的可导函数, 而 u 本身是 x 的可导函数. 我们想要证明
第一眼看上去这也没什么, 可使用 Δ 记号写出
并取极限. 不幸的是, Δu 有时可能为 0, 而这会导致整个等式无效. 因
此, 我们使用函数记号. 令 f 和 g 都是可导的, 并设 h (x) = f (g (x)).
我们想要证明
如果 g 在 x 附近是常数, 那么 h 也是, 因此等式两边都是 0. 否则, 我
们知道
用该分式乘以并除以 g (x + Δx) - g (x), 对于无穷多个在 0 附近的
Δx 值, 这一定是非零的, 然后我们将极限拆分得到
右边的极限就是 g' (x), 但左边是什么呢?求解技巧是设 ε = g (x +
Δx) - g (x). 那么, 左边极限的分子中的量 g (x + Δx) 可以被写作 g
(x) + ε, (你知道这是为什么吗?) 而分母正是 ε 本身. 因此我们有
现在, 当 Δx → 0 时, ε 会怎样呢?由于 g 可导, 由 5.2.11 节可知 g
连续. 特别地, 有
如果从两边减去 g (x), 那么你会看到, 当 Δx → 0 时 ε → 0. 这表示,
在 h' (x) 的表达式中, 我们可以用 ε → 0 替换 Δx → 0, 得到
第一项正是 f' (g (x)), 故 h' (x) = f' (g (x)) g (x). 这样, 我们就证明
了链式求导法则.
A.6.6 极值定理的证明
在 11.1.2 节中, 我们陈述了极值定理. 它说的是, 如果 f 在 x = c 有
一个局部最大值或局部最小值, 那么 x = c 是 f 的一个临界点. 这表
示, 或者 f' (c) 不存在, 或者 f' (c) = 0.
为了证明这一点, 我们首先假设 f 在 x = c 有一个局部最小值. 如果 f'
(c) 不存在, 那么它就是一个临界点, 这正是我们所希望的. 另一方面,
如果 f' (c) 存在, 那么
由于 f 在 c 上有一个局部最小值, 因而我们知道当 c + h 非常接近 c
时, f (c + h) ≥ f (c). 当然, 只有当 h 接近于 0 时, c + h 才会非常
接近 c. 对于这样的 h, 上述分式中的分子 f (c + h) - f (c) 一定是非
负的. 当 h > 0 时, 量
是正的 (或 0); 但是当 h < 0 时, 此量是负的 (或 0). 因此右极限
一定大于或等于 0, 而同样的左极限是小于或等于 0. 由于双侧极限存
在, 故左极限等于右极限; 唯一的可能性就是它们都是 0. 这就证明了
f' (c) = 0, 故 x = c 是 f 的一个临界点.
如果 f 在 x = c 有一个局部最大值会如何呢?我把这个论证过程
留给你来完成. 唯一的区别就是, 当 h 接近于 0 时, 量 f (c + h) - f
(c) 是负的 (或 0).
A.6.7 罗尔定理的证明
假设 f 在 [a, b] 上连续, 在 (a, b) 内可导, 且满足条件 f (a) = f (b).
接下来, 我们想要证明在 (a, b) 内存在一个数 c, 使得 f' (c) = 0. 为
了求证, 我们使用最大-最小值定理来说明 f 在 [a, b] 上有一个全局最
大值和一个全局最小值. 如果最大值或最小值中任一个出现在 (a, b)
内的某个数 c 上, 那么极值定理告诉我们 f' (c) = 0. (我们知道 f' (c)
存在, 因为 f 在 (a, b) 内可导. ) 其他的唯一可能性就是全局最大值和
全局最小值都出现在端点 a 和 b 上. 在这种情况下, 由于 f (a) = f
(b), 该函数一定为常数, 因此, (a, b) 内的每一个数 c 都满足 f' (c) =
0. 这就是完整的证明!
A.6.8 中值定理的证明
现在, 我们知 f 在 [a, b] 上连续, 在 (a, b) 内可导, 但我们不假设 f
(a) = f (b). 中值定理表明, 在 (a, b) 内存在某个 c 满足
为了证明这一点, 我们定义一个新的函数 g :
它看起来有点复杂, 但实际上我们只是从 f (x) 中减去了线性函数 x -
a 的一个常数倍, 并称之为 g. 因此, 函数 g 也在 [a, b] 上连续且 (a,
b) 内可导, 且可知
因此, 我们证明了 g (a) = g (b), 这表示我们可以应用罗尔定理了! 结
果是, 存在一个数 c 使得 g' (c) = 0. 现在, 我们只需要对 g 求导来看
看这对于 f 意味着什么. 由于量 f (b) - f (a) 和 b - a 都是常数, 我们
得到
现在, 将 x = c 代入. 由于 g' (c) = 0, 我们有
这表示
这正好是我们想要证明的!
A.6.9 线性化的误差
让我们来整理另外一个不精确的结果. 在 13.2 节, 我们看到函数 f 关
于 x = a 的线性化 L, 其中 a 是 f 定义域内的某个数:
如果 x 在 a 的附近, 我们可以使用 L (x) 来估算 f (x) 的值. 我们的错
误可能有多大呢?根据 13.2.4 节的公式, 如果 f'' 在 x 和 a 之间存
在, 那么
|误差| = ,
这里的 c 是介于 x 和 a 之间的某个数. 我们来证明这个公式. 首先,
我们称误差项为 r (x); 由于 r (x) 是 f (x) 的真值和猜测值的差, 故猜
测值就是线性化 L (x) = f (a) + f' (a) (x - a). 我们有
现在, 聪明的做法是将 x 固定为一个常数并且令 a 为变量. 由此启发
得到
因此, 只有 t = a 时, 才有误差 r (x). 即, 误差为 g (a). 注意
我们求 g 关于 t 的导数. 项 f (x) 是常数, 故其导数为 0. 此外, 我们需
要用乘积法则来处理 f' (t) (x - t). 总之, 我们得到
特别地, 我们有
目前为止, 我们所做的一切都是非常合理的. 现在, 我们必须做一些看
起来有些疯狂的事情. 请记住, 我们想要证明误差是 , 其中
c 介于 x 和 a 之间. 由于误差是 g (a), 这就暗示了 g (t) 形如 K (x -
2
t) , 其中 K 是某个不依赖于 t 而只依赖于 x 和 a 的数. 即使这不完
全正确, 但它或许可以解释我们为什么会令
你看, 当对它关于 t 求导时, 保持 x 为常数, 会得到
这又怎么样?我们可以使用中值定理 (见 11.3 节) 得到
对于某个介于 x 和 a 之间的 c 成立. 我们可以使用上述等式对 h'
(c)、h (x) 及 h (a) 做替换:
因为 g (x) = 0. 因为 g' (c) = -f'' (c) (x - c), 最后一个方程可以重新
整理为
我们的任务快完成了, 但仍然有一个问题. 我们不能处理因子 (x - c),
因为在我们的误差项中没有它! 唯一一种消除它的可能就是左边等于
2
0, 即应该选取 K 使得 g (a) - K (x - a) = 0. 事实上, 如果 K = g
2
(a) / (x - a) , 那么上述方程变为
由于 x ≠ a 且 x ≠ c, 我们一定会有
这表示 . 由于 g (a) = r (x) 是我们要找的误差, 因
此我们完成了证明.
A.6.10 分段函数的导数
假定 f 以分段的形式定义为
(你可以将 x > a 改为 x ≥ a, 将 x ≤ a 改为 x < a ; 这无关紧要. )
不管怎样, 在 6.6 节中, 我们考虑了一个问题, 就是 f 是否在 a 上可
导. 我们假设如果函数 f 和 f 在 x = a 处互相匹配, 则它们的导数
2
1
和 在 x = a 处也互相匹配, 那么 f 在 a 上可导. 我们如何来证明
呢?首先要注意 f 和 f 在 x = a 处互相匹配的意思是
1
2
这就确保了 f 至少是连续的. 现在, 我们还要假设它们的导数也互相匹
配, 这意味着 f 在最接近 a 的右侧是可导的, f 在最接近 a 的左侧是
2
1
可导的, 以及
其中 L 是某个很好的有限数. 因此, 我们来考虑
其中 h 是某个很小的数且 h ≠ 0. 如果 h > 0, 那么我们可以应用中
值定理 (见 11.3 节) 得到
其中 c 是介于 a 和 a + h 之间的某个数. (这里我们需要 f 在 [a, a +
+
h] 上的连续性. ) 根据三明治定理, 当 h → 0 时, 数 c 就被夹在 a 和
+
+
a + h 之间, 故当 h → 0 时有 c → a . 我们现在看到
同理得左极限, 只是我们要使用 代替 :
左极限和右极限都等于 L, 因此, 我们证明了 f' (a) 存在且它也等于 L.
A.6.11 洛必达法则的证明
我们来证明洛必达法则 (见第 14 章). 确切地说, 假设我们有两个函数
f 和 g, 它们在某个包含点 a 的区间上可导 (但或许不在 a 本身), 且 f
(a) = g (a) = 0; 此外, 除了可能在 a 处, g' (x) ≠ 0. 那么, 我们需要
证明
假设右边的极限存在. 我们需要一个形式略有不同的中值定理, 它被称
为柯西中值定理:如果 f 和 g 在 [a, b] 上连续, 在 (a, b) 内可导, 且
在 (a, b) 上 g' (x) -= 0, 那么, 在 (a, b) 内存在某个 C 使得
我们首先来证明它, 然后用它来证明洛必达法则. 顺便提一句, 请注意,
如果对于所有的 x 有 g (x) = x, 那么 g' (x) = 1, 并且上述方程变为
这正好是常规的中值定理! 尽管如此, 它对我们没有太多帮助. 让我们
回到原始方程中去看看右边的分母吧, 即 g (B) - g (A). 这不可能等于
0; 要是那样的话, 则 g (B) = g (A), 这表示根据罗尔定理 (见 11.2
节), 对于在 (a, b) 内的某个 C, g' (C) = 0. 因此, 右边有意义. 现在,
我们定义一个新的函数 h:
对于在 (a, b) 内的所有的 x 成立. (将这个函数与 A.6.8 节中的常规
中值定理的证明中的函数 g 做比较. ) 不管怎样, 我们来写出有关这个
函数的某些事实吧. 首先, 计算 h (A) 和 h (B). 我们有
而
故 h (A) = h (B). 此外, 注意 h 是可导的, 并且由于 A 和 B 都是常
数, 我们有
由于 h (A) = h (B), 我们可以使用罗尔定理来推出结论:在 (a, b)
内存在一个数 C, 使得 h' (C) = 0. 这意味着
如果你重新整理这个方程, 就会得到我们想要的结果
现在, 我们来证明洛必达法则. 由于 f (a) = g (a) = 0, 我们有
如果 x > a, 那么在区间 [a, x] 上, 我们可以使用柯西中值定理 (就是
我们刚刚证明的) 来说明
对于在 (a, x) 内的某个 c 成立. 否则, 如果 x < a, 那么我们会有相同
的结果, 只是 c 在 (x, a) 中. (注意, 我们使用的事实是, 除了可能在 a
外, g' 不为 0; 这是柯西中值定理的一个条件. ) 当然, 数 c 依赖于 x
的值; 而我们看到, 当 x → a 时, 也会有 c → a. 因此, 我们有
所剩的工作就是将 c 看成虚拟变量并将它改为 x, 这样, 我们就完成了
洛必达法则的证明.
嗯, 其实证明不算完整. 我们还没有证明 ∞/∞ 的情况, 也没有证
明 x → ∞ (或 -∞) 时的情况. 如果你敢于挑战, 就请尝试将上述证明应
用到这些情况中吧, 这是一个极棒的练习.
本书由「ePUBw.COM」整理,
ePUBw.COM 提供最新最全的优质电子书下
载!!!
A.7 泰勒近似定理的证明
现在, 我们来看看如何证明 24.1.3 节中的泰勒近似定理吧. 该定
理说的是:如果 f 在 x = a 处是光滑的, 那么, 在所有 N 次或 N 次以
下的多项式中, 对于在 a 附近的 x 的 f (x) 的最佳近似就是 N 阶泰勒
多项式 P 它由下式给出:
N
我们的计划是, 证明该定理是如何从 24.1.4 节的完整泰勒定理中推导
出来的. 我省略了完整泰勒定理的证明, 因为从大多数教科书或在搜索
引擎上输入 “泰勒定理的证明” 能找到. 你不容易找到的是这个近似定
理的证明, 因此我们就来看看它吧.
首先, 让我们设 a = 0 来简化这个问题. 由于我们假设完整泰勒定理
已经被证明了, 因此可知 f (x) = P (x) + R (x), 其中
N
N
是一个 N 次多项式, 也知
其中 c 介于 0 和 x 之间. (请记住, 我们设了 a = 0, 因此, 形如 (x -
n
n
a) 的因子就变为 x , 形如 f (n) (a) 的量就变为 f (n) (0). ) 我们想要
证明的就是:
在所有 N 次或 N 次以下的多项式中, P 是在 0 附近 f 的最佳近
N
似.
到底如何证明类似的陈述呢?上下文中的 “最佳” 又意味着什么呢?
求解技巧是, 另外选取一个次数不超过 N 的多项式, 我们称之为 Q. 由
于 Q 不同于 P , 所以 Q 至少有一个系数不同于 P 中的相应系数.
N
N
我们想要证明 P (x) 比 Q(x) 更接近 f (x), 至少当 x 接近 0 时如此.
N
为了看到这两个量有多么接近, 你需查看一下这两个量的差. 因此, 我
们真正想要证明的就是不等式 |f (x) - P (x)| < |f (x) - Q(x)|, 此时
N
取 x 接近 0. 如果这是正确的, 那么就可以推出结论 —- P (x) 确实
N
比 Q(x) 更接近理想值 f (x).
为了得到这个不等式, 我们来分别看看两边的情况. 左边是 f (x) - P N
(x) 的绝对值, 这实际上就是余项 R . 我们已经有一个 R 的表达式,
N
N
它包括三个因子, 即 f (N +1) (c)、x N +1 及 1/ (N + 1)!. 我们知道 c
介于 0 和 x 之间, 当 x → 0 时, 根据三明治定理一定有 c → 0. 由于
我们假定 f 非常光滑, 函数 f (N +1) 是连续的. 因此, 当 x → 0 时有 c
→ 0, 故得出 f (N +1) (c) ~ f (N +1) (0). 将这三个因子写在一起并取
绝对值, 我们有
其中 x → 0. 事实上, 我们可以令 C = f (N +1) (0) / (N + 1)!, 要注意
C 只是某个不依赖于 x 的常数. 因此, 我们有
, 当 x → 0 时.
这太棒了. 现在, 我们来看看要证明的不等式的右边. 这个量是 |f (x) -
Q (x)|. 我们写出 f (x) = P (x) + R (x), 从而
N
N
其中, 我们通过设 S (x) = P (x) - Q (x) 将 P (x) 和 Q (x) 放在一
N
N
起. 让我们来好好看看 S. 它是两个次数不超过 N 的不同多项式的差.
因此, S 是一个次数小于或等于 N 的多项式, 但它不是零多项式. 我们
m
假设, 如果用 x 的幂来写 S (x), 它就好像 S(x) = a x + … , 其中
m
m
a x 是最低次数项. 数 m 必然介于 0 和 N 之间, 因为 S 的次数小
m
于或等于 N . 我们知道 S 的行为很像它的最低次数项的行为 (见
m
21.4.1 节). 即, 当 x → 0 时, S (x) ~ a x . 另一方面, 我们需要看
m
看 S (x) + R (x), 因为这是我们想要的不等式的右边. 我们已经看到
N
了, 当 x → 0 时 R (x) ~ Cx N+1 , 故 S (x) + R (x) 中的最低次数
N
N
m
m
项的行为仍会像 a x 一样 (请记住, m ≤ N , 故 x 是一个次数低
m
于 x N +1 的项). 综述, 我们有
, 当 x → 0 时.
太棒了! 我们想要证明不等式
当 x 接近 0 时是成立的. 我们知道, 当 x → 0 时, |f (x) - P (x)| ~
N
m
|C||x| N+1 及 |f (x) - Q (x)| ~ |a ||x| . 由于 m < N + 1(及 |C|
m
m
与 |a | 都是常数), 易知当 x 很小时, |C||x| N+1 比 |a ||x| 小得多.
m
m
事实上, 这两个量的比率是
其中 C = |C| / |a | 只是另一个常数. 当 x → 0 时, 右边的量趋于 0.
1
m
因此, 当 x 接近 0 时, 以上不等式实际上是成立的. 最终我们完成了泰
勒近似定理的证明!
事实上, 有一点我们没有考虑:假设 a = 0. 为了由此推出一般情
况, 你只需在上述证明过程中每一处都用被平移的量 (x - a) 替换量 x.
你只需要注意, (x - a) → 0 和 x → a 是同一个意思. 我把证明细节留
给你来完成. 如果你能通过上述证明做到这点, 那你就太棒了.
本书由「ePUBw.COM」整理,
ePUBw.COM 提供最新最全的优质电子书下
载!!!
附录 B 估算积分
看到定积分时, 我们习惯于通过反导数以及微积分第二基本定理来给
出一个确切的答案. 可实际上, 求解一个有用的反导数可能会很困难或
者根本不可能. 有时候, 最好的选择是求出一个积分值的近似. 因此,
我们将讨论估算定积分的三种技巧, 以下就是最后这个附录的内容:
使用条纹、梯形法则及辛普森法则估算定积分;
估算上述近似中的误差.
本书由「ePUBw.COM」整理,
ePUBw.COM 提供最新最全的优质电子书下
载!!!
B.1 使用条纹估算积分
以下是一个完全合理的定积分:
它相当于由 x 轴、曲线 y = e -x 2 以及直线 x = 0 与 x = 2 所围成区
域的面积, 如图 B-1 所示.
图 B-1
求这样的区域面积或许看起来偏于技术性, 但它有非常大的实际意义.
1
上述曲线通常被认为是钟形曲线, 而且它是概率论学习的基础. 因此,
特别烦扰的是, 没有简单的好方法来写出反导数
1 技术上说, 钟形曲线 (或正态分布) 实际上是由方程 给出的.
实际上, 你可以使用麦克劳林级数把这个积分写成一个无穷级数, 但这
也不是简单的好方法. 当前的严峻现实是, 无法将本节最开始的那个定
积分的确切值以简洁的方式写出来. (在 16.5.1 节中, 我们已经讨论了
这一点. ) 另一方面, 我们可以使用黎曼积分的定义求出这个积分的近
似值, 即一个估算. 实际上, 在 16.2 节, 我们讨论了划分、区间以及黎
曼和. 由于积分是黎曼和的极限, 不取极限, 我们就可以得到一个近似.
因此, 为了估算积分
可以将区间 [a, b] 做一个形如
的划分, 然后在 [x , x ] 中选取一点 c , 在 [x , x ] 中选取一点 c ,
1
2
1
0
1
2
以此类推直到在 [x n-1 , x ] 中选取一点 c . 那时, 就可以写出
n
n
这就是说, 积分近似等于它的一个黎曼和.
所有这一切看起来都很抽象. 我们来看看它在上例中是如何起作用
的吧. 我们要从 0 到 2 积分, 因此需要区间 [0, 2] 上的一个划分. 该区
间上最简单的划分就是这个区间 [0, 2], 这相当于选择 n = 1、x = 0
0
及 x = 2. 我们只需要在 [0, 2] 内选取 c . 求出的近似很大程度上依
1
1
赖于这个选取! 例如, 如果选取 c = 0、c = 1 或 c = 2, 那么近似
1
1
1
就会分别对应图 B-2 所示区域的面积.
图 B-2
很明显, 第一个估算过高了, 而第三个则估算过低了. 中间的那个不算
太糟, 但它仍不完美. 为了计算这三个估算值, 我们使用公式
我们用 1 替换 n, 替换 f (c ), 0 替换 x , 并用 2 替换 x , 得到
1
0
1
4
当 c 是 0、1 或 2 时, 这些值分别是 2、2/e ≈ 0.736 及 2/e ≈
1
0.037. 正如你看到的, 这三个估算有很大的差别!
现在我们来看看, 使用更多的条纹是否可以做得更好. 假设我们取
了 [0, 2] 上的一个五条划分
因此, n = 5, x = 0, , x = 1, , , x = 2. 假设我
2
0
5
们选取的数 c 是每一个小区间的左端点, 这就表示 c = 0, , c 3
j
1
= 1, , . 将这些数代入上述近似公式中, 可得
如果你喜欢, 可以再做一些简化, 或者使用计算器或计算机得出其
近似到小数点后四位的结果 1.0865. 现在, 你的任务是, 求使用每一个
小区间的右端点而不是左端点时的估算值.
均匀划分
取均匀划分总会是很方便的. 这表示, 每一个小区间都有相同的宽度,
并且要计算出其宽度也不是很难的事情. 如果积分区间是 [a, b], 那么
其长度是 b - a 单位, 因此如果将该区间 n 等分, 那么每一个小区间的
长度是 (b - a) /n 单位. 我们称这个量为 h, 故 h = (b - a) /n. 此外,
出现在黎曼和定义中的表达式 (x - x ) 正是第 j 个条纹的宽度, 因此
j-1
j
它正是 h. 我们的表达式
可以简化为
你仍然需要选取数 c , 但这一次就简单多了. 例如, 我们使用 10
j
个等宽的条纹来估算积分
每一条的宽度是 h = (2 - 0) /10, 即 1/5, 而且 n = 10. 因此, 我们有
这些区间的宽度都是 1/5, 因此从 0 开始, 我们看到了如下的划分:
如果我们令 c 为每一个小区间的右端点, 那么就有 , , 以此
j
类推直到 c = 2. 我们将这些数代入上述公式中, 得到
10
在这个和中有 10 项. 由于函数 f 在 0 和 2 之间是递减的, 而且我们使
用了每一条的右端点, 因而以上就是估算过低的情况. (你知道为什么
吗?) 不管怎样, 你可以使用计算器或计算机来求上面的和, 大约是
0.783 670(近似到小数点后六位).
如果使用每一个小区间的中点, 而不是左端点或右端点, 情况又会怎样
呢?我们知道, 的中点是 , 的中点是 , 以此类推. 因此,
另一个可能的近似是
这大约是 0.882 202.
本书由「ePUBw.COM」整理,ePUBw.COM
提供最新最全的优质电子书下载!!!
B.2 梯形法则
涉及选取数 c 的问题是很困难的. 大多数情况下, 人们或者选择左端点
j
或者选择右端点, 中点也是个常见的 (并且合理的) 选择. 这里还有一种
估算积分的方法, 它不需要选择 (当然是在你决定使用这种方法的时
候!) 但会给出更好的估算. 它被称作梯形法则.
其基本思想非常简单:我们允许条纹的上边不平行于底边. 每一条纹的
上边都是连接曲线 y = f (x) 上的两个相应点的线段. 图 B-3 就是说明
这两种方法间区别的图像.
图 B-3
让我们来好好看看其中的一条新条纹, 如图 B-4 所示.
图 B-4
由于有两条边是平行的, 故该条纹是一个梯形. 底边长是 (x - x ) 单
j
j-1
位, 而平行的边的高度为 f (x ) 单位和 f (x ) 单位. 根据梯形面积公
j-1
j
式, 这个梯形条纹的面积是 平方单位. 如果我
们确保划分都是均匀的, 那么如同上一节, 可知 x - x 就是 (b - a)
j-1
j
/n. 这恰好就是条纹的宽度 (单位), 我们称之为 h, 因此, 一个条纹的面
积变为
平方单位. 余下的工作就是把所有的梯形条纹面积都加在一起. 我们可
以只将一个 Σ 符号放在以上量的外面, 提取常数因子 h/2, 即
事实上, 我们可以把这个表达式再简化一些. 你看, 除了最左边和最右
边的条纹, 其他的相邻条纹都共用一条边, 如图 B-5 所示.
图 B-5
这意味着, 我们可以将很多项合并. 特别地, 除了 x 和 x 之外, 形如 f
n
0
(x ) 的每一项都被用到两次. 例如 n = 4 时, 我们有
j
因此, 我们可以将和式中除第一项和最后一项外的所有项合并, 得到
同样的技巧适用于一般情况, 因此有
让我们应用它来求下面积分的近似值:
我们取 n = 5. 由于 [0, 2] 的长度为 2 单位, 从而每一条的宽度为
单位, 且划分是
根据梯形法则, 我们有
如果你愿意, 也可以将右边简化为
你可以使用计算器或计算机来计算, 结果近似到小数点后六位是 0.881
131. 这比我们在 B.1 节结尾部分求出的估算 1.08 65 略小一点, 但
它很接近 B.1.1 节结尾部分的估算 0.882 202.
本书由「ePUBw.COM」整理,ePUBw.COM
提供最新最全的优质电子书下载!!!
B.3 辛普森法则
为什么要止步于梯形法则呢?梯形仍然有一个笨拙的线形上边. 在条纹
的上边使用曲线而不是线段, 我们可以做得更好. 以下就是操作细节.
首先, 我们来看看相邻的两个条纹, 不用线段连接上边, 而是用一个二
次曲线, 如图 B-6 所示.
图 B-6
正如我们将在 B.3.1 节中看到的, 阴影部分的面积是
平方单位, 其中我们又设了 h = (b - a) /n. 现在, 如果对每一对条纹重
复这个操作, 再将所有的面积相加, 就会得到近似. 如同梯形法则的情
况, 相邻的两个条纹共用一条边, 因此会有一些量被重复一次. 例如, 如
果有四个条纹, 那么面积和将是
我们把形如 f (x ) 的两项合并起来变为 2f (x ), 因此面积和是
2
2
如果有更多的条纹依然会有相同样式的结果. 如果 j 是偶数, f (x ) 的系
j
数等于 2; 如果 j 是奇数, f (x ) 的系数等于 4——f (x ) 和 f (x ) 除
j
n
0
外, 它们的系数都是 1.总之, 我们有:
我们拿它和上一节的梯形法则比较一下. 代替形如 1, 2, 2, ..., 2, 2, 1
的系数, 这一次系数形如 1, 4, 2, 4, 2, ..., 2, 4, 2, 4, 1. 还要注意的
是, 前面分母中的常数为 3 而不是 2.
应用辛普森法则很容易. 我们回到原来的那个例子中: