The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.
Discover the best professional documents and content resources in AnyFlip Document Base.
Search
Published by johntss124, 2021-08-25 03:29:56

普林斯顿微积分读本(修订版) (图灵数学·统计学丛书)

我们来看一些稍复杂情况. 假设 f 和 g 都处处连续, 我们想要证明复合

函数 f ○ g 也处处连续. 我们需要集中考虑一个特殊的 x 值. 因此, 假


设 g 在 x = a 上连续. 那么我们需要 f 在哪里连续呢?我们想要证明








因此没有必要去担心 f 在 x = a 上是否连续. 我们需要的是它在 g (a)


上连续, 因为我们要在 g (a) 的附近且在点 g (a) 上评估 f .



下面就是我们面临的情况:g 在 x = a 上连续, 且 f 在 x = g (a) 上


连续, 要证明 f ○ g 在 x = a 上连续. 为了求证, 我们需要在游戏中增


加第三参与者. 事实上, 我将对抗这个新的参与者, 我们称之为

Smiddy, 而 Smiddy 将对抗你.




来看看如何玩游戏吧. 由于 f 在 g (a) 上连续, 我们知道








注意, 我使用 y 作为代替 x 的虚拟变量, 但这没问题 —— 你可以将 y


变成你喜欢的任意字母, 它们表示的是同一个意义. 不管怎样, 我们设 L

= f (g (a)). 然后, 你选取你的 ε > 0, 建立你的容忍区间 (L - ε, L +


ε). 而你要挑战 Smiddy, 舍弃以 y = g (a) 为中心的一个小区间外面


的一切, 以便所剩的函数值都落在你的区间内. 即, Smiddy 应该选取 λ


> 0, 使得 |y - g (a)| < λ 时都有 |f (y) - L| < ε. 因为以上极限是正

确的, 所以 Smiddy 就可以这样做. 为什么要用 λ 代替 δ 呢?因为


Smiddy 非常喜欢它.



现在, 轮到我来对抗 Smiddy 了. 这一次, 我们根据 g 在 x = a 上连续


的事实写出







关键是:Smiddy 使用的是数 λ, 而不是你已经使用的 ε! 因此,


Smiddy 的容忍区间是 (g (a) - λ, g (a) + λ). 现在, 我必须舍弃以 x


= a 为中心的一个小区间外的一切, 以便所剩的函数值落在 Smiddy


的区间内. 因为以上极限是正确的, 所以我可以选择 δ > 0, 使得只要

|x - a| < δ, 就有 |g (x) - g (a)| < λ.




我们要综合考虑. 由于我和 Smiddy 的游戏, 我们知道只要 |x - a| <


δ, 就有 |g (x) - g (a)| < λ. 而你和 Smiddy 的游戏显示, 如果 |y - g

(a)| < λ, 那么 |f (y) - L| < ε. 我们不管 Smiddy, 用 f (g (a)) 替换


L, 用 g (x) 替换 y. 可以看到, 只要 |x - a| < δ, 就有 |f (g (x)) - f (g


(a))| < ε. 这表示, 如果我直接与你对抗, 我总是可以做一次合情理的

移动, 不管 ε 是什么 (只要它为正). 因此, 我们实际上就证明了








其中 g 在 x = a 上连续且 f 在 g (a) 上连续. 当然, 如果 f 和 g 都处


处连续, 那么复合函数 f ○ g 也处处连续.

我们可以对论证进行修正, 以便包括 x → ∞ 或 x → -∞ 而不是 x = a

的情况. 由于右边不能是 g (∞), 故我们必须对陈述稍作修改. 最好的做


法就是










我们也可以对 x → -∞ 的情况做类似的修改. 我把证明的细节留给

你来完成, 但基本思想是你和 Smiddy 的对抗是不变的, 但我和


Smiddy 的对抗会稍有不同:我选取 N 而不是 δ, 且不等式 |x - a| <


δ 必须用 x > N 或 x < N 来替换, 这取决于你所处的情况是 x → ∞


还是 x → -∞.



我们现在可以建立极限










它在 3.4 节出现过. 事实上, 如果你设 f (x) = sin (x) 且 g (x) = 1/x,

除了 g 在 x = 0 上不连续外, f 和 g 都是处处连续的. 因为









我们可以使用上述公式推出结论

更直观的一种表达方式是, 当 x → ∞ 时 1/x → 0, 故当 x → ∞ 时 sin


(1/x) → sin (0) = 0.



A.4.2 介值定理的证明




在 5.1.4 节中, 我们见过介值定理, 它表明如果 f 在 [a, b] 上连续, 且


f (a) < 0 及 f (b) > 0, 那么存在某个数 c 使得 f (c) = 0. 现在, 我们


来看看证明此定理的基本思想.



我们考虑区间 [a, b] 上使得 f (x) < 0 的 x 值的集合. 我们知道 a 在


这个集合中, 因为 f (a) < 0; 而 b 不在这个集合中. 我们想要求出此集


合中最大的数 c, 但这或许不太可能. 例如, 小于 0 的最大数是什么


呢?没有. 对于任意的负数, 你总是可以找到一个接近 0 的负数, 例如,

将你的数除以 2. 另一方面, 我们可以找到此集合中右边穿插的一个数


c. 特别地, 我们可以坚持说此集合中没有哪个元素在 c 的右边, 而且任

意带有端点 c 的开区间至少包括此集合中的一个元素. (这来自于实轴


的一个很好的性质 —— 完备性. ) 以下是我们知道的, 用符号表示:




(1) 对于任意的 x > c, 我们有 f (x) ≥ 0;



(2) 对于任意的区间 (c - δ, c), 其中 δ > 0, 区间内至少存在一点 x 使


得 f (x) < 0. 现在该忙起来了. 以下就是重要的问题:f (c) 是什么?


我们假设它是负的. 在这种情况下, 由于 f (b) > 0, 故 c ≠ b. 因为 f

是连续的, 所以当 x 在 c 的附近时, f (x) 的值应该在 f (c) 的附近; 但

当 x 在 c 的右边一点点时就会有问题, 因为 f (x) 预期应该是正的, 而

f (c) 为负. 更正式地, 你可以选择 ε = -f (c) /2 (它是正的), 那么你的


容忍区间就是 (3f (c) /2, f (c) /2), 它仅由负数组成. 我不能选取任何


位于 [a, b] 中形如 (c - δ, c + δ) 的区间, 因为任何这样的区间都包含

一个大于 c 的 x. 根据上面的条件 (1), 我们知道 f (x) 一定为正, 这表


示它不会位于你的容忍区间. 因此, 不可能有 f (c) < 0. 直观上, 如果


有 f (c) < 0, 那么你的穿插仍然有数在它的右边!




或许 f (c) > 0. 在这种情况下, 我们不可能有 c = a, 因为 f (a) < 0.

现在, 当 x 在 c 的附近时, f (x) 的值应该在 f (c) 附近; 特别地, 它们


应该是正的. 由于上面的条件 (2), 所以这是个问题. 更明确些, 这一次


你可以选择 ε = f (c) /2, 则你的容忍区间是 (f (c) /2, 3f (c) /2). 我需

要尝试找到一个在 [a, b] 中的区间 (c - δ, c + δ), 使得对于我的区间


中的任意 x, f (x) 总是位于你的容忍区间里. 特别地, f (x) > 0. 这意


味着, 对于 (c - δ, c) 中的所有 x 有 f (x) > 0, 这和条件 (2) 是相悖


的. 故 f (c) > 0 也不可能. 如果它是真的, 那么我们可以将穿插再向左

边挪一些, 因此它不会是 c.




剩下的是什么呢?唯一可能就是 f (c) = 0, 因此, 我们证明了该定理.

顺便要说的是, 我们很容易将情况改为 f (a) > 0 及 f (b) < 0 的情况.


你可以稍稍改写一下证明, 或者设 g (x) = -f (x) 并对 g 而不是 f 应用


该定理.

A.4.3 最大 - 最小定理的证明




现在我们来证明 5.1.6 节的最大 - 最小定理. 其基本思想是, 假定我们


有一个在闭区间 [a, b] 上连续的函数 f , 我们断言, 该区间上存在某个

数 c 使 f 达到最大值. 正如我们看到的, 这表示 f (c) 大于或等于其他 f


(x) 的值, 其中 x 在整个区间 [a, b] 上漫游.



证明如下. 我们想要证明的是, 你可以放置某条水平线 y = N , 使得所


有的函数值 f (x) 都位于这条线的下方. 如果做不到这一点, 那么函数


就会在 [a, b] 内的某处变得越来越大, 而不会有最大值. 因此, 我们假


设你画不出这样的一条线. 那么, 对于每一个正数 N , 在 [a, b] 中存在

某个点 x 使得 f (x ) 在水平线 y = N 的上方即我们找到了若干个点
N
N
x , 对于每一个 N , 都有 f (x ) > N . 我们在 x 轴上用 X 将它们标出
N
N
来.




这些标记点在哪里呢?有无穷多个这样的点. 因此, 如果我们将区间

[a, b] 分成两半得到两个新的区间, 它们中的某一个定然包含无穷多个


标记点. 它们可能都包含无穷多个标记点, 但不可能都只包含有限个标


记点, 否则总的标记点将是有限的. 让我们把注意力集中在原始区间中


包含无穷多个标记点的那一半上. 如果它们都如此, 那就选择你最喜欢

的那个 (这没有关系的). 现在, 我们用新的更小的区间重复这个练习:


将它分成两半. 其中之一一定包含无穷多个标记点. 只要你喜欢, 我们


就继续做这个练习, 你会得到一个变得越来越小的区间的集合, 一个套

一个, 并且每一个都包含无穷多个标记点. 我们将这些区间一个一个地


堆在一起, 如图 A-9 所示.
















图 A-9



2
直观上, 必有实数存在于所有这些区间之中, 我们称之为数 q. f (q) 是

什么呢?我们可以使用 f 的连续性来获得一些信息. 事实上, 我们知道



2 同样, 我们需要使用实轴的完备性来证明. 事实上, 一定只存在一个这样的数 —— 你知道为


什么吗?








因此, 打个比方, 如果你选取的 ε 是 1, 那么我应该能够找到一个区间

(q - δ, q+ δ), 使得对于所有该区间中的 x 都有 |f (x) - f (q)| < 1. 问


题是, 这个区间 (q - δ, q + δ) 包含了无穷多个标记点! 因为不管 δ


多么小, 我们选择的最后一个小区间都会位于 (q - δ, q + δ) 内. 这才

是问题所在:所有这些标记点都应该在区间 (q - δ, q + δ) 内, 当你对


其中任意一个点取 f 值时, 会得到一个介于 f (q) - 1 和 f (q) + 1 之间


的数. 因此, 不管 f (q) 是什么, 我们都会陷入困境:某些标记点的函数

值会远远大于 f (q) + 1. 一切都将失去控制. 因此, 画不出让整个函数


位于其下方的直线 y = N , 这一假设是错的.



事情还没有结束. 我们有了这条线 y = N , 它位于 y = f (x) 在 [a, b]


的图像的上方, 现在, 我们需要将它向下移动, 直到它接触到该图像以

便求最大值. 因此, 我们选取尽可能小的 N , 使得对于 [a, b] 内的所有


x 有 f (x) ≤ N . (我们再次使用了完备性. ) 现在我们需要证明, 对于某


个 c 有 N = f (c). 为了求证, 我们要重复在标记点中所使用的技巧, 只


是这一次将它们用圈标记出来. 我们选取一个正整数 n, 在 [a, b] 中一

定能够找到某个数 c , 使得 f (c ) > N - 1/n. 如若不然, 我们就应该在
n
n
y = N - 1/n(或更低处) 而不是 y = N 处画那条线. 因此, 存在这样的


一个 c , 且对于每一个正整数 n 都存在. 我们将这些点圈起来. 有无穷
n

多个这样的点, 当你对它们取 f 值时, 其结果会越来越接近 —— 事实

上是任意地接近 ——N . (没有一个值会超过 N , 因为对于所有的 x 有


f (x) ≤ N !) 现在, 我们所要做的就是持续将区间 [a, b] 进行二分, 使


得每一个小区间都包含无穷多个圈起来的点. 和前面一样, 在所有的区


间中都存在一个数 c. 这个数又被圈起来的点所环绕着.



f (c) 是什么呢?它不可能大于 N , 但或许它会小于 N . 我们假设 f (c)


= M , 其中 M < N , 另外设 ε = (N - M) /2. 由于 f 是连续的, 我们实

际上需要

你有你的 ε, 因此我需要找到一个区间 (c - δ, c + δ), 使得对于在我区

间内的 x, f (x) 位于 (M - ε, M + ε) 中. 问题是 M + ε = N - ε, 且不


管我如何选取 δ > 0, 都有无穷多个圈起来的点位于 (c - δ, c + δ) 中.


它们其中一些的函数值可能位于 (M - ε, M + ε) 中, 但由于函数值会

变得接近 N , 因而大多数不会位于 (M - ε, M + ε) 中. 因此, 我不能移


动. 唯一解脱的方法就是 f (c) = N . 这表示 c 是函数取得最大值的点.


这样我们就完成了求证!




要得到定理的最小值的形式, 只需要将定理重新应用到 g (x) = -f (x)

上就可以了. 毕竟, 如果 c 是 g 取得最大值的点, 那么它就是 f 取得最


小值的点.




本书由「ePUBw.COM」整理,ePUBw.COM



提供最新最全的优质电子书下载!!!

A.5 再谈指数函数和对数函数






在 9.2 节中, 我们发展了指数函数和对数函数的理论, 最终的发现就是




和 .




当时还有个不精确的结尾:我们断言








存在, 并称之为 e, 但我们并没有证明过它. 直接证明上述极限存在是


可能的, 但这提供不了任何特别的信息. 反之, 我假设你已经学了积分


和微积分基本定理 (见第 16 章和第 17 章), 从而我可以用一个不同


的方法解决问题. 事实上, 一切都是从对数函数开始的.



我们先根据规则定义一个函数 F ,










对于所有的 x > 0 成立. 这个函数基于另一个函数的积分, 就这类函

数请参见 17.1 节. 现在, 我知道你可以写出

因为 x > 0 且 ln (1) = 0. 问题是, 我们的行动过早了! 如果真要以恰


当的方式求解, 就不能使用 ∫ 1/t dt = ln |t| + C 这一事实. 实际上,

这是我们想要证明的事情之一. 目前为止, 我们不能假设 F (x) = ln


|x| , 那就让我们从证明它开始吧.




让我们写出函数 F 的一些有趣性质. 根据微积分第一基本定理, F 的导

数为










因此, F 可导, 这意味着它是连续的 (见 5.2.11 节). 接下来, 我们设 x


= 1, 从而得










因为若积分上下限相等且函数在那里确实有定义, 则任何函数的积分

都是 0(见 16.3 节). 极限








如何呢?事实上, 根据反常积分的定义 (见 20.2 节), 我们有










反常积分 发散, 我们必须非常小心提到. 最初证明它的发散性


时, 我们使用了公式 ∫ 1/t dt = ln |t| + C, 但我们现在不能这样做!

而是使用了积分判别法来说 和 同时收敛或同时发散;


然后使用 22.4.3 节中的论证来证明该级数发散; 故该积分也发散. 因


此我们有



和 .




由于 F 连续, 介值定理 (见 5.1.4 节) 表明, 一定存在一个数 e 使得 F

(e) = 1. 毕竟, 1 介于 0 和 ∞ 之间! 此外, 对于所有的 x > 0, F' (x)


= 1/x > 0, 我们因此知道 F 总是递增的. 因此, 不可能存在其他的数


c, 使得 F (c) = 1. 我们已经有了 e 的正式定义:












现在, 我们选取一个有理数 α 并定义










使用 17.5.2 节中描述的变形 2 的技巧, 可以看到











(不使用对数函数求导, 假设我们知道 . 如果只知道

对于正整数是成立的, 正如 6.1 节所述, 那么我们来看看是否可以对于

所有的有理数来证明这个事实.) 另一方面, 我们知道 F' (x) = 1/x, 因


此, 上述方程暗示了 G' (x) = αF' (x). 由于 α 是常数, 我们看到 G

(x) = αF (x) + C, 其中 C 是常数. 特别地, 如果我们设 x = 1, 此方


α
程变为 G (1) = αF (1) + C. 现在有 G (1) = F (1 ) = F (1) = 0,

α
α
故 C = 0. 由于 G (x) = F (x ), 我们就证明了 F (x ) = αF (x), 对于
任意有理数 α 及 x > 0 成立. 事实上, 由于 F 连续, 结果对于任意实


α
数 α 一定也适用! 现在我们设 x = e, 会看到 F (e ) = αF (e) = α,

x
因为 F (e) = 1. 我们将 α 变为 x, 这样就证明了 F (e ) = x. 因此, F

x
是 e 的反函数, 这表示 F (x) = ln (x). 因为我们知道 F' (x) = 1/x,
x
这就证明了 . 现在, 如果 y = e , 那么 x = ln (y), 故









x
x
根据链式法则, dy/dx = e . 因此, 我们对 ln (x) 和 e 求了导且证明
了 e 存在!



现在, 我们要做的就是证明









这十分简单:令 y = (1 + h) 1/h , 于是 ln (y) = ln (1 + h) /h. 故根

据 9.4.3 节中使用的论证 (或洛必达法则)

1
+
+
当然, 如果当 h → 0 时 ln (y) → 1, 那么当 h → 0 时 y → e = e.
这就证明了上述极限. 关键是, 一旦你知道 ln (x) 关于 x 的导数是

1/x, 那么其余的一切对你来说就很容易了.




本书由「ePUBw.COM」整理,



ePUBw.COM 提供最新最全的优质电子书下




载!!!

A.6 微分与极限






在这一节, 我们将证明一些涉及微分和极限的结论. 更确切地说, 我们

要处理函数的常数倍、函数的和与差的求导, 以及乘积法则、商法则


与链式求导法则. 然后, 我们将证明极值定理、罗尔定理、中值定理以


及线性化中的误差公式. 最后, 我们会看到分段函数的导数以及洛必达

法则的证明.




A.6.1 函数的常数倍




假设 y 是关于 x 的一个可导函数, c 是某个常数. 我们想要证明










这相当简单. 我们用 y = f (x) 定义 f , 那么上述方程的左边就是









你所要做的就是从分子中提取一个 c 的因子并将它拖到极限之外. 这

是在 A.2.2 节结尾部分证明过的:

右边正好是 cf' (x), 它和 c (dy/dx) 一样. 这样我们就完成了求证.




A.6.2 函数的和与差




假设 u 和 v 都是 x 的可导函数, 我们想要证明的是









以及类似地用减号代替加号. 这几乎没什么可证的. 记 u = f (x) 及 v

= g (x), 那么上述方程的左边就是










你所要做的就是重新整理这个和, 并拆分极限, 这是在 A.2.1 节中证明


过的, 上述极限等于









这就是 f' (x) + g' (x), 它等于我们想要证明的方程的右边. 用减号替

换加号的情况也同样简单!




A.6.3 乘积法则的证明




对于乘积法则和商法则的证明, 我们将继续使用记号 dy/dx 而不是 f'


(x), 因为使用前者更易于理解概念. 正如 5.2.7 节所述, 我们有

其中 Δy 是将 x 变为 x + Δx 时 y 的变化量.




因此, 我们想要证明的乘积法则说的就是









假设我们将 x 变为 x + Δx, 那么 u 就变为 u + Δu, v 就变为 v +


Δv. 而 uv 就变为 (u + Δu) (v + Δv). 这个变化量有多大呢?我们取

原来的量与新的量的差来看看:







展开并化简, 得到








现在用该式除以 Δx. 对于最后一项, 我们要多除以一个 Δx, 再乘以这


个量使方程两边保持平衡. 结果是









如果你取当 Δx → 0 时的极限, 那么所有的比率都会趋于相应的导数,

但最后一个 Δx 的因子会趋于 0, 即

由于最后一项为 0, 我们就证明了乘积法则. 现在, 你应该尝试写


出一个使用 f (x) 记号 (形式 1) 的证明了.



A.6.4 商法则的证明




现在我们想要证明










同样, 当 x 变为 x + Δx 时, 我们知道 u 和 v 就会分别变为 u + Δu


及 v + Δv. 而 u/v 就变为 (u + Δu) / (v + Δv). 这个变化量是









我们对上式通分并消除 uv - uv, 得到









将上式除以 Δx, 再用 Δx 和分母中的 Δv 的项相乘并相除, 得到










现在令 Δx → 0. 所有的分式都变为导数, 并且分母中的最后一个因子


趋于 0, 因此我们得到结果

由于分母中的最后一项是 0, 我们证明了商法则.




A.6.5 链式求导法则的证明




假设 y 是 u 的可导函数, 而 u 本身是 x 的可导函数. 我们想要证明









第一眼看上去这也没什么, 可使用 Δ 记号写出









并取极限. 不幸的是, Δu 有时可能为 0, 而这会导致整个等式无效. 因


此, 我们使用函数记号. 令 f 和 g 都是可导的, 并设 h (x) = f (g (x)).

我们想要证明







如果 g 在 x 附近是常数, 那么 h 也是, 因此等式两边都是 0. 否则, 我


们知道









用该分式乘以并除以 g (x + Δx) - g (x), 对于无穷多个在 0 附近的


Δx 值, 这一定是非零的, 然后我们将极限拆分得到

右边的极限就是 g' (x), 但左边是什么呢?求解技巧是设 ε = g (x +


Δx) - g (x). 那么, 左边极限的分子中的量 g (x + Δx) 可以被写作 g

(x) + ε, (你知道这是为什么吗?) 而分母正是 ε 本身. 因此我们有









现在, 当 Δx → 0 时, ε 会怎样呢?由于 g 可导, 由 5.2.11 节可知 g


连续. 特别地, 有








如果从两边减去 g (x), 那么你会看到, 当 Δx → 0 时 ε → 0. 这表示,


在 h' (x) 的表达式中, 我们可以用 ε → 0 替换 Δx → 0, 得到









第一项正是 f' (g (x)), 故 h' (x) = f' (g (x)) g (x). 这样, 我们就证明


了链式求导法则.




A.6.6 极值定理的证明




在 11.1.2 节中, 我们陈述了极值定理. 它说的是, 如果 f 在 x = c 有

一个局部最大值或局部最小值, 那么 x = c 是 f 的一个临界点. 这表


示, 或者 f' (c) 不存在, 或者 f' (c) = 0.

为了证明这一点, 我们首先假设 f 在 x = c 有一个局部最小值. 如果 f'


(c) 不存在, 那么它就是一个临界点, 这正是我们所希望的. 另一方面,

如果 f' (c) 存在, 那么









由于 f 在 c 上有一个局部最小值, 因而我们知道当 c + h 非常接近 c


时, f (c + h) ≥ f (c). 当然, 只有当 h 接近于 0 时, c + h 才会非常


接近 c. 对于这样的 h, 上述分式中的分子 f (c + h) - f (c) 一定是非


负的. 当 h > 0 时, 量









是正的 (或 0); 但是当 h < 0 时, 此量是负的 (或 0). 因此右极限









一定大于或等于 0, 而同样的左极限是小于或等于 0. 由于双侧极限存


在, 故左极限等于右极限; 唯一的可能性就是它们都是 0. 这就证明了


f' (c) = 0, 故 x = c 是 f 的一个临界点.




如果 f 在 x = c 有一个局部最大值会如何呢?我把这个论证过程


留给你来完成. 唯一的区别就是, 当 h 接近于 0 时, 量 f (c + h) - f


(c) 是负的 (或 0).

A.6.7 罗尔定理的证明




假设 f 在 [a, b] 上连续, 在 (a, b) 内可导, 且满足条件 f (a) = f (b).


接下来, 我们想要证明在 (a, b) 内存在一个数 c, 使得 f' (c) = 0. 为

了求证, 我们使用最大-最小值定理来说明 f 在 [a, b] 上有一个全局最


大值和一个全局最小值. 如果最大值或最小值中任一个出现在 (a, b)


内的某个数 c 上, 那么极值定理告诉我们 f' (c) = 0. (我们知道 f' (c)


存在, 因为 f 在 (a, b) 内可导. ) 其他的唯一可能性就是全局最大值和

全局最小值都出现在端点 a 和 b 上. 在这种情况下, 由于 f (a) = f


(b), 该函数一定为常数, 因此, (a, b) 内的每一个数 c 都满足 f' (c) =


0. 这就是完整的证明!




A.6.8 中值定理的证明




现在, 我们知 f 在 [a, b] 上连续, 在 (a, b) 内可导, 但我们不假设 f


(a) = f (b). 中值定理表明, 在 (a, b) 内存在某个 c 满足









为了证明这一点, 我们定义一个新的函数 g :

它看起来有点复杂, 但实际上我们只是从 f (x) 中减去了线性函数 x -


a 的一个常数倍, 并称之为 g. 因此, 函数 g 也在 [a, b] 上连续且 (a,

b) 内可导, 且可知














因此, 我们证明了 g (a) = g (b), 这表示我们可以应用罗尔定理了! 结

果是, 存在一个数 c 使得 g' (c) = 0. 现在, 我们只需要对 g 求导来看


看这对于 f 意味着什么. 由于量 f (b) - f (a) 和 b - a 都是常数, 我们


得到









现在, 将 x = c 代入. 由于 g' (c) = 0, 我们有









这表示










这正好是我们想要证明的!



A.6.9 线性化的误差

让我们来整理另外一个不精确的结果. 在 13.2 节, 我们看到函数 f 关


于 x = a 的线性化 L, 其中 a 是 f 定义域内的某个数:







如果 x 在 a 的附近, 我们可以使用 L (x) 来估算 f (x) 的值. 我们的错

误可能有多大呢?根据 13.2.4 节的公式, 如果 f'' 在 x 和 a 之间存


在, 那么





|误差| = ,



这里的 c 是介于 x 和 a 之间的某个数. 我们来证明这个公式. 首先,


我们称误差项为 r (x); 由于 r (x) 是 f (x) 的真值和猜测值的差, 故猜


测值就是线性化 L (x) = f (a) + f' (a) (x - a). 我们有







现在, 聪明的做法是将 x 固定为一个常数并且令 a 为变量. 由此启发


得到







因此, 只有 t = a 时, 才有误差 r (x). 即, 误差为 g (a). 注意







我们求 g 关于 t 的导数. 项 f (x) 是常数, 故其导数为 0. 此外, 我们需


要用乘积法则来处理 f' (t) (x - t). 总之, 我们得到

特别地, 我们有







目前为止, 我们所做的一切都是非常合理的. 现在, 我们必须做一些看


起来有些疯狂的事情. 请记住, 我们想要证明误差是 , 其中


c 介于 x 和 a 之间. 由于误差是 g (a), 这就暗示了 g (t) 形如 K (x -


2
t) , 其中 K 是某个不依赖于 t 而只依赖于 x 和 a 的数. 即使这不完

全正确, 但它或许可以解释我们为什么会令







你看, 当对它关于 t 求导时, 保持 x 为常数, 会得到







这又怎么样?我们可以使用中值定理 (见 11.3 节) 得到









对于某个介于 x 和 a 之间的 c 成立. 我们可以使用上述等式对 h'


(c)、h (x) 及 h (a) 做替换:

因为 g (x) = 0. 因为 g' (c) = -f'' (c) (x - c), 最后一个方程可以重新


整理为







我们的任务快完成了, 但仍然有一个问题. 我们不能处理因子 (x - c),


因为在我们的误差项中没有它! 唯一一种消除它的可能就是左边等于

2
0, 即应该选取 K 使得 g (a) - K (x - a) = 0. 事实上, 如果 K = g

2
(a) / (x - a) , 那么上述方程变为









由于 x ≠ a 且 x ≠ c, 我们一定会有










这表示 . 由于 g (a) = r (x) 是我们要找的误差, 因

此我们完成了证明.




A.6.10 分段函数的导数




假定 f 以分段的形式定义为

(你可以将 x > a 改为 x ≥ a, 将 x ≤ a 改为 x < a ; 这无关紧要. )


不管怎样, 在 6.6 节中, 我们考虑了一个问题, 就是 f 是否在 a 上可

导. 我们假设如果函数 f 和 f 在 x = a 处互相匹配, 则它们的导数
2
1
和 在 x = a 处也互相匹配, 那么 f 在 a 上可导. 我们如何来证明


呢?首先要注意 f 和 f 在 x = a 处互相匹配的意思是
1
2






这就确保了 f 至少是连续的. 现在, 我们还要假设它们的导数也互相匹


配, 这意味着 f 在最接近 a 的右侧是可导的, f 在最接近 a 的左侧是
2
1
可导的, 以及








其中 L 是某个很好的有限数. 因此, 我们来考虑









其中 h 是某个很小的数且 h ≠ 0. 如果 h > 0, 那么我们可以应用中


值定理 (见 11.3 节) 得到









其中 c 是介于 a 和 a + h 之间的某个数. (这里我们需要 f 在 [a, a +

+
h] 上的连续性. ) 根据三明治定理, 当 h → 0 时, 数 c 就被夹在 a 和

+
+
a + h 之间, 故当 h → 0 时有 c → a . 我们现在看到

同理得左极限, 只是我们要使用 代替 :









左极限和右极限都等于 L, 因此, 我们证明了 f' (a) 存在且它也等于 L.




A.6.11 洛必达法则的证明




我们来证明洛必达法则 (见第 14 章). 确切地说, 假设我们有两个函数


f 和 g, 它们在某个包含点 a 的区间上可导 (但或许不在 a 本身), 且 f


(a) = g (a) = 0; 此外, 除了可能在 a 处, g' (x) ≠ 0. 那么, 我们需要


证明









假设右边的极限存在. 我们需要一个形式略有不同的中值定理, 它被称


为柯西中值定理:如果 f 和 g 在 [a, b] 上连续, 在 (a, b) 内可导, 且


在 (a, b) 上 g' (x) -= 0, 那么, 在 (a, b) 内存在某个 C 使得









我们首先来证明它, 然后用它来证明洛必达法则. 顺便提一句, 请注意,


如果对于所有的 x 有 g (x) = x, 那么 g' (x) = 1, 并且上述方程变为

这正好是常规的中值定理! 尽管如此, 它对我们没有太多帮助. 让我们


回到原始方程中去看看右边的分母吧, 即 g (B) - g (A). 这不可能等于


0; 要是那样的话, 则 g (B) = g (A), 这表示根据罗尔定理 (见 11.2


节), 对于在 (a, b) 内的某个 C, g' (C) = 0. 因此, 右边有意义. 现在,

我们定义一个新的函数 h:










对于在 (a, b) 内的所有的 x 成立. (将这个函数与 A.6.8 节中的常规


中值定理的证明中的函数 g 做比较. ) 不管怎样, 我们来写出有关这个


函数的某些事实吧. 首先, 计算 h (A) 和 h (B). 我们有




















故 h (A) = h (B). 此外, 注意 h 是可导的, 并且由于 A 和 B 都是常


数, 我们有









由于 h (A) = h (B), 我们可以使用罗尔定理来推出结论:在 (a, b)


内存在一个数 C, 使得 h' (C) = 0. 这意味着










如果你重新整理这个方程, 就会得到我们想要的结果









现在, 我们来证明洛必达法则. 由于 f (a) = g (a) = 0, 我们有










如果 x > a, 那么在区间 [a, x] 上, 我们可以使用柯西中值定理 (就是


我们刚刚证明的) 来说明









对于在 (a, x) 内的某个 c 成立. 否则, 如果 x < a, 那么我们会有相同


的结果, 只是 c 在 (x, a) 中. (注意, 我们使用的事实是, 除了可能在 a

外, g' 不为 0; 这是柯西中值定理的一个条件. ) 当然, 数 c 依赖于 x


的值; 而我们看到, 当 x → a 时, 也会有 c → a. 因此, 我们有









所剩的工作就是将 c 看成虚拟变量并将它改为 x, 这样, 我们就完成了


洛必达法则的证明.





嗯, 其实证明不算完整. 我们还没有证明 ∞/∞ 的情况, 也没有证

明 x → ∞ (或 -∞) 时的情况. 如果你敢于挑战, 就请尝试将上述证明应


用到这些情况中吧, 这是一个极棒的练习.




本书由「ePUBw.COM」整理,



ePUBw.COM 提供最新最全的优质电子书下



载!!!

A.7 泰勒近似定理的证明






现在, 我们来看看如何证明 24.1.3 节中的泰勒近似定理吧. 该定

理说的是:如果 f 在 x = a 处是光滑的, 那么, 在所有 N 次或 N 次以


下的多项式中, 对于在 a 附近的 x 的 f (x) 的最佳近似就是 N 阶泰勒


多项式 P 它由下式给出:
N












我们的计划是, 证明该定理是如何从 24.1.4 节的完整泰勒定理中推导


出来的. 我省略了完整泰勒定理的证明, 因为从大多数教科书或在搜索


引擎上输入 “泰勒定理的证明” 能找到. 你不容易找到的是这个近似定


理的证明, 因此我们就来看看它吧.



首先, 让我们设 a = 0 来简化这个问题. 由于我们假设完整泰勒定理


已经被证明了, 因此可知 f (x) = P (x) + R (x), 其中
N
N









是一个 N 次多项式, 也知

其中 c 介于 0 和 x 之间. (请记住, 我们设了 a = 0, 因此, 形如 (x -

n
n
a) 的因子就变为 x , 形如 f (n) (a) 的量就变为 f (n) (0). ) 我们想要
证明的就是:




在所有 N 次或 N 次以下的多项式中, P 是在 0 附近 f 的最佳近
N

似.



到底如何证明类似的陈述呢?上下文中的 “最佳” 又意味着什么呢?


求解技巧是, 另外选取一个次数不超过 N 的多项式, 我们称之为 Q. 由


于 Q 不同于 P , 所以 Q 至少有一个系数不同于 P 中的相应系数.
N
N
我们想要证明 P (x) 比 Q(x) 更接近 f (x), 至少当 x 接近 0 时如此.
N

为了看到这两个量有多么接近, 你需查看一下这两个量的差. 因此, 我


们真正想要证明的就是不等式 |f (x) - P (x)| < |f (x) - Q(x)|, 此时
N

取 x 接近 0. 如果这是正确的, 那么就可以推出结论 —- P (x) 确实
N

比 Q(x) 更接近理想值 f (x).



为了得到这个不等式, 我们来分别看看两边的情况. 左边是 f (x) - P N


(x) 的绝对值, 这实际上就是余项 R . 我们已经有一个 R 的表达式,
N
N
它包括三个因子, 即 f (N +1) (c)、x N +1 及 1/ (N + 1)!. 我们知道 c


介于 0 和 x 之间, 当 x → 0 时, 根据三明治定理一定有 c → 0. 由于

我们假定 f 非常光滑, 函数 f (N +1) 是连续的. 因此, 当 x → 0 时有 c

→ 0, 故得出 f (N +1) (c) ~ f (N +1) (0). 将这三个因子写在一起并取


绝对值, 我们有










其中 x → 0. 事实上, 我们可以令 C = f (N +1) (0) / (N + 1)!, 要注意

C 只是某个不依赖于 x 的常数. 因此, 我们有




, 当 x → 0 时.




这太棒了. 现在, 我们来看看要证明的不等式的右边. 这个量是 |f (x) -

Q (x)|. 我们写出 f (x) = P (x) + R (x), 从而
N
N






其中, 我们通过设 S (x) = P (x) - Q (x) 将 P (x) 和 Q (x) 放在一
N
N
起. 让我们来好好看看 S. 它是两个次数不超过 N 的不同多项式的差.


因此, S 是一个次数小于或等于 N 的多项式, 但它不是零多项式. 我们

m
假设, 如果用 x 的幂来写 S (x), 它就好像 S(x) = a x + … , 其中
m
m
a x 是最低次数项. 数 m 必然介于 0 和 N 之间, 因为 S 的次数小
m
于或等于 N . 我们知道 S 的行为很像它的最低次数项的行为 (见


m
21.4.1 节). 即, 当 x → 0 时, S (x) ~ a x . 另一方面, 我们需要看
m
看 S (x) + R (x), 因为这是我们想要的不等式的右边. 我们已经看到
N

了, 当 x → 0 时 R (x) ~ Cx N+1 , 故 S (x) + R (x) 中的最低次数
N
N

m
m
项的行为仍会像 a x 一样 (请记住, m ≤ N , 故 x 是一个次数低
m
于 x N +1 的项). 综述, 我们有



, 当 x → 0 时.




太棒了! 我们想要证明不等式







当 x 接近 0 时是成立的. 我们知道, 当 x → 0 时, |f (x) - P (x)| ~
N

m
|C||x| N+1 及 |f (x) - Q (x)| ~ |a ||x| . 由于 m < N + 1(及 |C|
m
m
与 |a | 都是常数), 易知当 x 很小时, |C||x| N+1 比 |a ||x| 小得多.
m
m
事实上, 这两个量的比率是










其中 C = |C| / |a | 只是另一个常数. 当 x → 0 时, 右边的量趋于 0.
1
m
因此, 当 x 接近 0 时, 以上不等式实际上是成立的. 最终我们完成了泰


勒近似定理的证明!




事实上, 有一点我们没有考虑:假设 a = 0. 为了由此推出一般情


况, 你只需在上述证明过程中每一处都用被平移的量 (x - a) 替换量 x.


你只需要注意, (x - a) → 0 和 x → a 是同一个意思. 我把证明细节留


给你来完成. 如果你能通过上述证明做到这点, 那你就太棒了.

本书由「ePUBw.COM」整理,



ePUBw.COM 提供最新最全的优质电子书下



载!!!

附录 B 估算积分





看到定积分时, 我们习惯于通过反导数以及微积分第二基本定理来给

出一个确切的答案. 可实际上, 求解一个有用的反导数可能会很困难或


者根本不可能. 有时候, 最好的选择是求出一个积分值的近似. 因此,


我们将讨论估算定积分的三种技巧, 以下就是最后这个附录的内容:




使用条纹、梯形法则及辛普森法则估算定积分;



估算上述近似中的误差.




本书由「ePUBw.COM」整理,



ePUBw.COM 提供最新最全的优质电子书下




载!!!

B.1 使用条纹估算积分





以下是一个完全合理的定积分:











它相当于由 x 轴、曲线 y = e -x 2 以及直线 x = 0 与 x = 2 所围成区

域的面积, 如图 B-1 所示.
























图 B-1



求这样的区域面积或许看起来偏于技术性, 但它有非常大的实际意义.


1
上述曲线通常被认为是钟形曲线, 而且它是概率论学习的基础. 因此,

特别烦扰的是, 没有简单的好方法来写出反导数



1 技术上说, 钟形曲线 (或正态分布) 实际上是由方程 给出的.

实际上, 你可以使用麦克劳林级数把这个积分写成一个无穷级数, 但这

也不是简单的好方法. 当前的严峻现实是, 无法将本节最开始的那个定


积分的确切值以简洁的方式写出来. (在 16.5.1 节中, 我们已经讨论了


这一点. ) 另一方面, 我们可以使用黎曼积分的定义求出这个积分的近

似值, 即一个估算. 实际上, 在 16.2 节, 我们讨论了划分、区间以及黎


曼和. 由于积分是黎曼和的极限, 不取极限, 我们就可以得到一个近似.


因此, 为了估算积分










可以将区间 [a, b] 做一个形如







的划分, 然后在 [x , x ] 中选取一点 c , 在 [x , x ] 中选取一点 c ,
1
2
1
0
1
2
以此类推直到在 [x n-1 , x ] 中选取一点 c . 那时, 就可以写出
n
n





这就是说, 积分近似等于它的一个黎曼和.



所有这一切看起来都很抽象. 我们来看看它在上例中是如何起作用


的吧. 我们要从 0 到 2 积分, 因此需要区间 [0, 2] 上的一个划分. 该区


间上最简单的划分就是这个区间 [0, 2], 这相当于选择 n = 1、x = 0
0

及 x = 2. 我们只需要在 [0, 2] 内选取 c . 求出的近似很大程度上依
1
1

赖于这个选取! 例如, 如果选取 c = 0、c = 1 或 c = 2, 那么近似
1
1
1
就会分别对应图 B-2 所示区域的面积.












图 B-2




很明显, 第一个估算过高了, 而第三个则估算过低了. 中间的那个不算


太糟, 但它仍不完美. 为了计算这三个估算值, 我们使用公式










我们用 1 替换 n, 替换 f (c ), 0 替换 x , 并用 2 替换 x , 得到
1
0
1







4
当 c 是 0、1 或 2 时, 这些值分别是 2、2/e ≈ 0.736 及 2/e ≈
1
0.037. 正如你看到的, 这三个估算有很大的差别!



现在我们来看看, 使用更多的条纹是否可以做得更好. 假设我们取


了 [0, 2] 上的一个五条划分

因此, n = 5, x = 0, , x = 1, , , x = 2. 假设我
2
0
5
们选取的数 c 是每一个小区间的左端点, 这就表示 c = 0, , c 3
j
1
= 1, , . 将这些数代入上述近似公式中, 可得


























如果你喜欢, 可以再做一些简化, 或者使用计算器或计算机得出其


近似到小数点后四位的结果 1.0865. 现在, 你的任务是, 求使用每一个


小区间的右端点而不是左端点时的估算值.



均匀划分




取均匀划分总会是很方便的. 这表示, 每一个小区间都有相同的宽度,


并且要计算出其宽度也不是很难的事情. 如果积分区间是 [a, b], 那么

其长度是 b - a 单位, 因此如果将该区间 n 等分, 那么每一个小区间的


长度是 (b - a) /n 单位. 我们称这个量为 h, 故 h = (b - a) /n. 此外,


出现在黎曼和定义中的表达式 (x - x ) 正是第 j 个条纹的宽度, 因此
j-1
j
它正是 h. 我们的表达式

可以简化为











你仍然需要选取数 c , 但这一次就简单多了. 例如, 我们使用 10
j

个等宽的条纹来估算积分









每一条的宽度是 h = (2 - 0) /10, 即 1/5, 而且 n = 10. 因此, 我们有











这些区间的宽度都是 1/5, 因此从 0 开始, 我们看到了如下的划分:









如果我们令 c 为每一个小区间的右端点, 那么就有 , , 以此
j

类推直到 c = 2. 我们将这些数代入上述公式中, 得到
10

在这个和中有 10 项. 由于函数 f 在 0 和 2 之间是递减的, 而且我们使

用了每一条的右端点, 因而以上就是估算过低的情况. (你知道为什么


吗?) 不管怎样, 你可以使用计算器或计算机来求上面的和, 大约是


0.783 670(近似到小数点后六位).



如果使用每一个小区间的中点, 而不是左端点或右端点, 情况又会怎样


呢?我们知道, 的中点是 , 的中点是 , 以此类推. 因此,


另一个可能的近似是










这大约是 0.882 202.



本书由「ePUBw.COM」整理,ePUBw.COM



提供最新最全的优质电子书下载!!!

B.2 梯形法则





涉及选取数 c 的问题是很困难的. 大多数情况下, 人们或者选择左端点
j

或者选择右端点, 中点也是个常见的 (并且合理的) 选择. 这里还有一种


估算积分的方法, 它不需要选择 (当然是在你决定使用这种方法的时


候!) 但会给出更好的估算. 它被称作梯形法则.



其基本思想非常简单:我们允许条纹的上边不平行于底边. 每一条纹的


上边都是连接曲线 y = f (x) 上的两个相应点的线段. 图 B-3 就是说明


这两种方法间区别的图像.
















图 B-3



让我们来好好看看其中的一条新条纹, 如图 B-4 所示.

图 B-4




由于有两条边是平行的, 故该条纹是一个梯形. 底边长是 (x - x ) 单
j
j-1
位, 而平行的边的高度为 f (x ) 单位和 f (x ) 单位. 根据梯形面积公
j-1
j
式, 这个梯形条纹的面积是 平方单位. 如果我


们确保划分都是均匀的, 那么如同上一节, 可知 x - x 就是 (b - a)
j-1
j
/n. 这恰好就是条纹的宽度 (单位), 我们称之为 h, 因此, 一个条纹的面


积变为

平方单位. 余下的工作就是把所有的梯形条纹面积都加在一起. 我们可

以只将一个 Σ 符号放在以上量的外面, 提取常数因子 h/2, 即











事实上, 我们可以把这个表达式再简化一些. 你看, 除了最左边和最右


边的条纹, 其他的相邻条纹都共用一条边, 如图 B-5 所示.




































图 B-5




这意味着, 我们可以将很多项合并. 特别地, 除了 x 和 x 之外, 形如 f
n
0
(x ) 的每一项都被用到两次. 例如 n = 4 时, 我们有
j

因此, 我们可以将和式中除第一项和最后一项外的所有项合并, 得到









同样的技巧适用于一般情况, 因此有














让我们应用它来求下面积分的近似值:









我们取 n = 5. 由于 [0, 2] 的长度为 2 单位, 从而每一条的宽度为


单位, 且划分是









根据梯形法则, 我们有










如果你愿意, 也可以将右边简化为

你可以使用计算器或计算机来计算, 结果近似到小数点后六位是 0.881

131. 这比我们在 B.1 节结尾部分求出的估算 1.08 65 略小一点, 但


它很接近 B.1.1 节结尾部分的估算 0.882 202.




本书由「ePUBw.COM」整理,ePUBw.COM



提供最新最全的优质电子书下载!!!

B.3 辛普森法则





为什么要止步于梯形法则呢?梯形仍然有一个笨拙的线形上边. 在条纹


的上边使用曲线而不是线段, 我们可以做得更好. 以下就是操作细节.


首先, 我们来看看相邻的两个条纹, 不用线段连接上边, 而是用一个二

次曲线, 如图 B-6 所示.






































图 B-6



正如我们将在 B.3.1 节中看到的, 阴影部分的面积是

平方单位, 其中我们又设了 h = (b - a) /n. 现在, 如果对每一对条纹重

复这个操作, 再将所有的面积相加, 就会得到近似. 如同梯形法则的情


况, 相邻的两个条纹共用一条边, 因此会有一些量被重复一次. 例如, 如


果有四个条纹, 那么面积和将是









我们把形如 f (x ) 的两项合并起来变为 2f (x ), 因此面积和是
2
2







如果有更多的条纹依然会有相同样式的结果. 如果 j 是偶数, f (x ) 的系
j

数等于 2; 如果 j 是奇数, f (x ) 的系数等于 4——f (x ) 和 f (x ) 除
j
n
0
外, 它们的系数都是 1.总之, 我们有:













我们拿它和上一节的梯形法则比较一下. 代替形如 1, 2, 2, ..., 2, 2, 1


的系数, 这一次系数形如 1, 4, 2, 4, 2, ..., 2, 4, 2, 4, 1. 还要注意的


是, 前面分母中的常数为 3 而不是 2.



应用辛普森法则很容易. 我们回到原来的那个例子中:


Click to View FlipBook Version