The words you are searching are inside this book. To get more targeted content, please make full-text search by clicking here.

Home Explore 普林斯顿微积分读本（修订版） (图灵数学·统计学丛书)

View in Fullscreen

Like this book? You can publish your book online for free in a few minutes!

Related Publications

Discover the best professional documents and content resources in AnyFlip Document Base.

Published by johntss124, 2021-08-25 03:29:56

普林斯顿微积分读本（修订版） (图灵数学·统计学丛书)

Pages:

我们来看一些稍复杂情况. 假设 f 和 g 都处处连续, 我们想要证明复合

函数 f ○ g 也处处连续. 我们需要集中考虑一个特殊的 x 值. 因此, 假

设 g 在 x = a 上连续. 那么我们需要 f 在哪里连续呢？我们想要证明

因此没有必要去担心 f 在 x = a 上是否连续. 我们需要的是它在 g (a)

上连续, 因为我们要在 g (a) 的附近且在点 g (a) 上评估 f .

下面就是我们面临的情况：g 在 x = a 上连续, 且 f 在 x = g (a) 上

连续, 要证明 f ○ g 在 x = a 上连续. 为了求证, 我们需要在游戏中增

加第三参与者. 事实上, 我将对抗这个新的参与者, 我们称之为

Smiddy, 而 Smiddy 将对抗你.

来看看如何玩游戏吧. 由于 f 在 g (a) 上连续, 我们知道

注意, 我使用 y 作为代替 x 的虚拟变量, 但这没问题 —— 你可以将 y

变成你喜欢的任意字母, 它们表示的是同一个意义. 不管怎样, 我们设 L

= f (g (a)). 然后, 你选取你的 ε > 0, 建立你的容忍区间 (L - ε, L +

ε). 而你要挑战 Smiddy, 舍弃以 y = g (a) 为中心的一个小区间外面

的一切, 以便所剩的函数值都落在你的区间内. 即, Smiddy 应该选取 λ

> 0, 使得 |y - g (a)| < λ 时都有 |f (y) - L| < ε. 因为以上极限是正

确的, 所以 Smiddy 就可以这样做. 为什么要用 λ 代替 δ 呢？因为

Smiddy 非常喜欢它.

现在, 轮到我来对抗 Smiddy 了. 这一次, 我们根据 g 在 x = a 上连续

的事实写出

关键是：Smiddy 使用的是数 λ, 而不是你已经使用的 ε! 因此,

Smiddy 的容忍区间是 (g (a) - λ, g (a) + λ). 现在, 我必须舍弃以 x

= a 为中心的一个小区间外的一切, 以便所剩的函数值落在 Smiddy

的区间内. 因为以上极限是正确的, 所以我可以选择 δ > 0, 使得只要

|x - a| < δ, 就有 |g (x) - g (a)| < λ.

我们要综合考虑. 由于我和 Smiddy 的游戏, 我们知道只要 |x - a| <

δ, 就有 |g (x) - g (a)| < λ. 而你和 Smiddy 的游戏显示, 如果 |y - g

(a)| < λ, 那么 |f (y) - L| < ε. 我们不管 Smiddy, 用 f (g (a)) 替换

L, 用 g (x) 替换 y. 可以看到, 只要 |x - a| < δ, 就有 |f (g (x)) - f (g

(a))| < ε. 这表示, 如果我直接与你对抗, 我总是可以做一次合情理的

移动, 不管 ε 是什么 (只要它为正). 因此, 我们实际上就证明了

其中 g 在 x = a 上连续且 f 在 g (a) 上连续. 当然, 如果 f 和 g 都处

处连续, 那么复合函数 f ○ g 也处处连续.

我们可以对论证进行修正, 以便包括 x → ∞ 或 x → -∞ 而不是 x = a

的情况. 由于右边不能是 g (∞), 故我们必须对陈述稍作修改. 最好的做

法就是

我们也可以对 x → -∞ 的情况做类似的修改. 我把证明的细节留给

你来完成, 但基本思想是你和 Smiddy 的对抗是不变的, 但我和

Smiddy 的对抗会稍有不同：我选取 N 而不是 δ, 且不等式 |x - a| <

δ 必须用 x > N 或 x < N 来替换, 这取决于你所处的情况是 x → ∞

还是 x → -∞.

我们现在可以建立极限

它在 3.4 节出现过. 事实上, 如果你设 f (x) = sin (x) 且 g (x) = 1/x,

除了 g 在 x = 0 上不连续外, f 和 g 都是处处连续的. 因为

我们可以使用上述公式推出结论

更直观的一种表达方式是, 当 x → ∞ 时 1/x → 0, 故当 x → ∞ 时 sin

(1/x) → sin (0) = 0.

A.4.2 介值定理的证明

在 5.1.4 节中, 我们见过介值定理, 它表明如果 f 在 [a, b] 上连续, 且

f (a) < 0 及 f (b) > 0, 那么存在某个数 c 使得 f (c) = 0. 现在, 我们

来看看证明此定理的基本思想.

我们考虑区间 [a, b] 上使得 f (x) < 0 的 x 值的集合. 我们知道 a 在

这个集合中, 因为 f (a) < 0; 而 b 不在这个集合中. 我们想要求出此集

合中最大的数 c, 但这或许不太可能. 例如, 小于 0 的最大数是什么

呢？没有. 对于任意的负数, 你总是可以找到一个接近 0 的负数, 例如,

将你的数除以 2. 另一方面, 我们可以找到此集合中右边穿插的一个数

c. 特别地, 我们可以坚持说此集合中没有哪个元素在 c 的右边, 而且任

意带有端点 c 的开区间至少包括此集合中的一个元素. (这来自于实轴

的一个很好的性质 —— 完备性. ) 以下是我们知道的, 用符号表示：

(1) 对于任意的 x > c, 我们有 f (x) ≥ 0;

(2) 对于任意的区间 (c - δ, c), 其中 δ > 0, 区间内至少存在一点 x 使

得 f (x) < 0. 现在该忙起来了. 以下就是重要的问题：f (c) 是什么？

我们假设它是负的. 在这种情况下, 由于 f (b) > 0, 故 c ≠ b. 因为 f

是连续的, 所以当 x 在 c 的附近时, f (x) 的值应该在 f (c) 的附近; 但

当 x 在 c 的右边一点点时就会有问题, 因为 f (x) 预期应该是正的, 而

f (c) 为负. 更正式地, 你可以选择 ε = -f (c) /2 (它是正的), 那么你的

容忍区间就是 (3f (c) /2, f (c) /2), 它仅由负数组成. 我不能选取任何

位于 [a, b] 中形如 (c - δ, c + δ) 的区间, 因为任何这样的区间都包含

一个大于 c 的 x. 根据上面的条件 (1), 我们知道 f (x) 一定为正, 这表

示它不会位于你的容忍区间. 因此, 不可能有 f (c) < 0. 直观上, 如果

有 f (c) < 0, 那么你的穿插仍然有数在它的右边!

或许 f (c) > 0. 在这种情况下, 我们不可能有 c = a, 因为 f (a) < 0.

现在, 当 x 在 c 的附近时, f (x) 的值应该在 f (c) 附近; 特别地, 它们

应该是正的. 由于上面的条件 (2), 所以这是个问题. 更明确些, 这一次

你可以选择 ε = f (c) /2, 则你的容忍区间是 (f (c) /2, 3f (c) /2). 我需

要尝试找到一个在 [a, b] 中的区间 (c - δ, c + δ), 使得对于我的区间

中的任意 x, f (x) 总是位于你的容忍区间里. 特别地, f (x) > 0. 这意

味着, 对于 (c - δ, c) 中的所有 x 有 f (x) > 0, 这和条件 (2) 是相悖

的. 故 f (c) > 0 也不可能. 如果它是真的, 那么我们可以将穿插再向左

边挪一些, 因此它不会是 c.

剩下的是什么呢？唯一可能就是 f (c) = 0, 因此, 我们证明了该定理.

顺便要说的是, 我们很容易将情况改为 f (a) > 0 及 f (b) < 0 的情况.

你可以稍稍改写一下证明, 或者设 g (x) = -f (x) 并对 g 而不是 f 应用

该定理.

A.4.3 最大 - 最小定理的证明

现在我们来证明 5.1.6 节的最大 - 最小定理. 其基本思想是, 假定我们

有一个在闭区间 [a, b] 上连续的函数 f , 我们断言, 该区间上存在某个

数 c 使 f 达到最大值. 正如我们看到的, 这表示 f (c) 大于或等于其他 f

(x) 的值, 其中 x 在整个区间 [a, b] 上漫游.

证明如下. 我们想要证明的是, 你可以放置某条水平线 y = N , 使得所

有的函数值 f (x) 都位于这条线的下方. 如果做不到这一点, 那么函数

就会在 [a, b] 内的某处变得越来越大, 而不会有最大值. 因此, 我们假

设你画不出这样的一条线. 那么, 对于每一个正数 N , 在 [a, b] 中存在

某个点 x 使得 f (x ) 在水平线 y = N 的上方即我们找到了若干个点
N
N
x , 对于每一个 N , 都有 f (x ) > N . 我们在 x 轴上用 X 将它们标出
N
N
来.

这些标记点在哪里呢？有无穷多个这样的点. 因此, 如果我们将区间

[a, b] 分成两半得到两个新的区间, 它们中的某一个定然包含无穷多个

标记点. 它们可能都包含无穷多个标记点, 但不可能都只包含有限个标

记点, 否则总的标记点将是有限的. 让我们把注意力集中在原始区间中

包含无穷多个标记点的那一半上. 如果它们都如此, 那就选择你最喜欢

的那个 (这没有关系的). 现在, 我们用新的更小的区间重复这个练习：

将它分成两半. 其中之一一定包含无穷多个标记点. 只要你喜欢, 我们

就继续做这个练习, 你会得到一个变得越来越小的区间的集合, 一个套

一个, 并且每一个都包含无穷多个标记点. 我们将这些区间一个一个地

堆在一起, 如图 A-9 所示.

图 A-9

2
直观上, 必有实数存在于所有这些区间之中, 我们称之为数 q. f (q) 是

什么呢？我们可以使用 f 的连续性来获得一些信息. 事实上, 我们知道

2 同样, 我们需要使用实轴的完备性来证明. 事实上, 一定只存在一个这样的数 —— 你知道为

什么吗?

因此, 打个比方, 如果你选取的 ε 是 1, 那么我应该能够找到一个区间

(q - δ, q+ δ), 使得对于所有该区间中的 x 都有 |f (x) - f (q)| < 1. 问

题是, 这个区间 (q - δ, q + δ) 包含了无穷多个标记点! 因为不管 δ

多么小, 我们选择的最后一个小区间都会位于 (q - δ, q + δ) 内. 这才

是问题所在：所有这些标记点都应该在区间 (q - δ, q + δ) 内, 当你对

其中任意一个点取 f 值时, 会得到一个介于 f (q) - 1 和 f (q) + 1 之间

的数. 因此, 不管 f (q) 是什么, 我们都会陷入困境：某些标记点的函数

值会远远大于 f (q) + 1. 一切都将失去控制. 因此, 画不出让整个函数

位于其下方的直线 y = N , 这一假设是错的.

事情还没有结束. 我们有了这条线 y = N , 它位于 y = f (x) 在 [a, b]

的图像的上方, 现在, 我们需要将它向下移动, 直到它接触到该图像以

便求最大值. 因此, 我们选取尽可能小的 N , 使得对于 [a, b] 内的所有

x 有 f (x) ≤ N . (我们再次使用了完备性. ) 现在我们需要证明, 对于某

个 c 有 N = f (c). 为了求证, 我们要重复在标记点中所使用的技巧, 只

是这一次将它们用圈标记出来. 我们选取一个正整数 n, 在 [a, b] 中一

定能够找到某个数 c , 使得 f (c ) > N - 1/n. 如若不然, 我们就应该在
n
n
y = N - 1/n(或更低处) 而不是 y = N 处画那条线. 因此, 存在这样的

一个 c , 且对于每一个正整数 n 都存在. 我们将这些点圈起来. 有无穷
n

多个这样的点, 当你对它们取 f 值时, 其结果会越来越接近 —— 事实

上是任意地接近 ——N . (没有一个值会超过 N , 因为对于所有的 x 有

f (x) ≤ N !) 现在, 我们所要做的就是持续将区间 [a, b] 进行二分, 使

得每一个小区间都包含无穷多个圈起来的点. 和前面一样, 在所有的区

间中都存在一个数 c. 这个数又被圈起来的点所环绕着.

f (c) 是什么呢？它不可能大于 N , 但或许它会小于 N . 我们假设 f (c)

= M , 其中 M < N , 另外设 ε = (N - M) /2. 由于 f 是连续的, 我们实

际上需要

你有你的 ε, 因此我需要找到一个区间 (c - δ, c + δ), 使得对于在我区

间内的 x, f (x) 位于 (M - ε, M + ε) 中. 问题是 M + ε = N - ε, 且不

管我如何选取 δ > 0, 都有无穷多个圈起来的点位于 (c - δ, c + δ) 中.

它们其中一些的函数值可能位于 (M - ε, M + ε) 中, 但由于函数值会

变得接近 N , 因而大多数不会位于 (M - ε, M + ε) 中. 因此, 我不能移

动. 唯一解脱的方法就是 f (c) = N . 这表示 c 是函数取得最大值的点.

这样我们就完成了求证!

要得到定理的最小值的形式, 只需要将定理重新应用到 g (x) = -f (x)

上就可以了. 毕竟, 如果 c 是 g 取得最大值的点, 那么它就是 f 取得最

小值的点.

本书由「ePUBw.COM」整理，ePUBw.COM

提供最新最全的优质电子书下载！！！

A.5 再谈指数函数和对数函数

在 9.2 节中, 我们发展了指数函数和对数函数的理论, 最终的发现就是

和 .

当时还有个不精确的结尾：我们断言

存在, 并称之为 e, 但我们并没有证明过它. 直接证明上述极限存在是

可能的, 但这提供不了任何特别的信息. 反之, 我假设你已经学了积分

和微积分基本定理 (见第 16 章和第 17 章), 从而我可以用一个不同

的方法解决问题. 事实上, 一切都是从对数函数开始的.

我们先根据规则定义一个函数 F ,

对于所有的 x > 0 成立. 这个函数基于另一个函数的积分, 就这类函

数请参见 17.1 节. 现在, 我知道你可以写出

因为 x > 0 且 ln (1) = 0. 问题是, 我们的行动过早了! 如果真要以恰

当的方式求解, 就不能使用 ∫ 1/t dt = ln |t| + C 这一事实. 实际上,

这是我们想要证明的事情之一. 目前为止, 我们不能假设 F (x) = ln

|x| , 那就让我们从证明它开始吧.

让我们写出函数 F 的一些有趣性质. 根据微积分第一基本定理, F 的导

数为

因此, F 可导, 这意味着它是连续的 (见 5.2.11 节). 接下来, 我们设 x

= 1, 从而得

因为若积分上下限相等且函数在那里确实有定义, 则任何函数的积分

都是 0(见 16.3 节). 极限

如何呢？事实上, 根据反常积分的定义 (见 20.2 节), 我们有

反常积分发散, 我们必须非常小心提到. 最初证明它的发散性

时, 我们使用了公式 ∫ 1/t dt = ln |t| + C, 但我们现在不能这样做!

而是使用了积分判别法来说和同时收敛或同时发散;

然后使用 22.4.3 节中的论证来证明该级数发散; 故该积分也发散. 因

此我们有

和 .

由于 F 连续, 介值定理 (见 5.1.4 节) 表明, 一定存在一个数 e 使得 F

(e) = 1. 毕竟, 1 介于 0 和 ∞ 之间! 此外, 对于所有的 x > 0, F' (x)

= 1/x > 0, 我们因此知道 F 总是递增的. 因此, 不可能存在其他的数

c, 使得 F (c) = 1. 我们已经有了 e 的正式定义：

现在, 我们选取一个有理数 α 并定义

使用 17.5.2 节中描述的变形 2 的技巧, 可以看到

(不使用对数函数求导, 假设我们知道 . 如果只知道

对于正整数是成立的, 正如 6.1 节所述, 那么我们来看看是否可以对于

所有的有理数来证明这个事实.) 另一方面, 我们知道 F' (x) = 1/x, 因

此, 上述方程暗示了 G' (x) = αF' (x). 由于 α 是常数, 我们看到 G

(x) = αF (x) + C, 其中 C 是常数. 特别地, 如果我们设 x = 1, 此方

α
程变为 G (1) = αF (1) + C. 现在有 G (1) = F (1 ) = F (1) = 0,

α
α
故 C = 0. 由于 G (x) = F (x ), 我们就证明了 F (x ) = αF (x), 对于
任意有理数 α 及 x > 0 成立. 事实上, 由于 F 连续, 结果对于任意实

α
数 α 一定也适用! 现在我们设 x = e, 会看到 F (e ) = αF (e) = α,

x
因为 F (e) = 1. 我们将 α 变为 x, 这样就证明了 F (e ) = x. 因此, F

x
是 e 的反函数, 这表示 F (x) = ln (x). 因为我们知道 F' (x) = 1/x,
x
这就证明了 . 现在, 如果 y = e , 那么 x = ln (y), 故

x
x
根据链式法则, dy/dx = e . 因此, 我们对 ln (x) 和 e 求了导且证明
了 e 存在!

现在, 我们要做的就是证明

这十分简单：令 y = (1 + h) 1/h , 于是 ln (y) = ln (1 + h) /h. 故根

据 9.4.3 节中使用的论证 (或洛必达法则)

1
+
+
当然, 如果当 h → 0 时 ln (y) → 1, 那么当 h → 0 时 y → e = e.
这就证明了上述极限. 关键是, 一旦你知道 ln (x) 关于 x 的导数是

1/x, 那么其余的一切对你来说就很容易了.

本书由「ePUBw.COM」整理，

ePUBw.COM 提供最新最全的优质电子书下

载！！！

A.6 微分与极限

在这一节, 我们将证明一些涉及微分和极限的结论. 更确切地说, 我们

要处理函数的常数倍、函数的和与差的求导, 以及乘积法则、商法则

与链式求导法则. 然后, 我们将证明极值定理、罗尔定理、中值定理以

及线性化中的误差公式. 最后, 我们会看到分段函数的导数以及洛必达

法则的证明.

A.6.1 函数的常数倍

假设 y 是关于 x 的一个可导函数, c 是某个常数. 我们想要证明

这相当简单. 我们用 y = f (x) 定义 f , 那么上述方程的左边就是

你所要做的就是从分子中提取一个 c 的因子并将它拖到极限之外. 这

是在 A.2.2 节结尾部分证明过的：

右边正好是 cf' (x), 它和 c (dy/dx) 一样. 这样我们就完成了求证.

A.6.2 函数的和与差

假设 u 和 v 都是 x 的可导函数, 我们想要证明的是

以及类似地用减号代替加号. 这几乎没什么可证的. 记 u = f (x) 及 v

= g (x), 那么上述方程的左边就是

你所要做的就是重新整理这个和, 并拆分极限, 这是在 A.2.1 节中证明

过的, 上述极限等于

这就是 f' (x) + g' (x), 它等于我们想要证明的方程的右边. 用减号替

换加号的情况也同样简单!

A.6.3 乘积法则的证明

对于乘积法则和商法则的证明, 我们将继续使用记号 dy/dx 而不是 f'

(x), 因为使用前者更易于理解概念. 正如 5.2.7 节所述, 我们有

其中 Δy 是将 x 变为 x + Δx 时 y 的变化量.

因此, 我们想要证明的乘积法则说的就是

假设我们将 x 变为 x + Δx, 那么 u 就变为 u + Δu, v 就变为 v +

Δv. 而 uv 就变为 (u + Δu) (v + Δv). 这个变化量有多大呢？我们取

原来的量与新的量的差来看看：

展开并化简, 得到

现在用该式除以 Δx. 对于最后一项, 我们要多除以一个 Δx, 再乘以这

个量使方程两边保持平衡. 结果是

如果你取当 Δx → 0 时的极限, 那么所有的比率都会趋于相应的导数,

但最后一个 Δx 的因子会趋于 0, 即

由于最后一项为 0, 我们就证明了乘积法则. 现在, 你应该尝试写

出一个使用 f (x) 记号 (形式 1) 的证明了.

A.6.4 商法则的证明

现在我们想要证明

同样, 当 x 变为 x + Δx 时, 我们知道 u 和 v 就会分别变为 u + Δu

及 v + Δv. 而 u/v 就变为 (u + Δu) / (v + Δv). 这个变化量是

我们对上式通分并消除 uv - uv, 得到

将上式除以 Δx, 再用 Δx 和分母中的 Δv 的项相乘并相除, 得到

现在令 Δx → 0. 所有的分式都变为导数, 并且分母中的最后一个因子

趋于 0, 因此我们得到结果

由于分母中的最后一项是 0, 我们证明了商法则.

A.6.5 链式求导法则的证明

假设 y 是 u 的可导函数, 而 u 本身是 x 的可导函数. 我们想要证明

第一眼看上去这也没什么, 可使用 Δ 记号写出

并取极限. 不幸的是, Δu 有时可能为 0, 而这会导致整个等式无效. 因

此, 我们使用函数记号. 令 f 和 g 都是可导的, 并设 h (x) = f (g (x)).

我们想要证明

如果 g 在 x 附近是常数, 那么 h 也是, 因此等式两边都是 0. 否则, 我

们知道

用该分式乘以并除以 g (x + Δx) - g (x), 对于无穷多个在 0 附近的

Δx 值, 这一定是非零的, 然后我们将极限拆分得到

右边的极限就是 g' (x), 但左边是什么呢？求解技巧是设 ε = g (x +

Δx) - g (x). 那么, 左边极限的分子中的量 g (x + Δx) 可以被写作 g

(x) + ε, (你知道这是为什么吗？) 而分母正是 ε 本身. 因此我们有

现在, 当 Δx → 0 时, ε 会怎样呢？由于 g 可导, 由 5.2.11 节可知 g

连续. 特别地, 有

如果从两边减去 g (x), 那么你会看到, 当 Δx → 0 时 ε → 0. 这表示,

在 h' (x) 的表达式中, 我们可以用 ε → 0 替换 Δx → 0, 得到

第一项正是 f' (g (x)), 故 h' (x) = f' (g (x)) g (x). 这样, 我们就证明

了链式求导法则.

A.6.6 极值定理的证明

在 11.1.2 节中, 我们陈述了极值定理. 它说的是, 如果 f 在 x = c 有

一个局部最大值或局部最小值, 那么 x = c 是 f 的一个临界点. 这表

示, 或者 f' (c) 不存在, 或者 f' (c) = 0.

为了证明这一点, 我们首先假设 f 在 x = c 有一个局部最小值. 如果 f'

(c) 不存在, 那么它就是一个临界点, 这正是我们所希望的. 另一方面,

如果 f' (c) 存在, 那么

由于 f 在 c 上有一个局部最小值, 因而我们知道当 c + h 非常接近 c

时, f (c + h) ≥ f (c). 当然, 只有当 h 接近于 0 时, c + h 才会非常

接近 c. 对于这样的 h, 上述分式中的分子 f (c + h) - f (c) 一定是非

负的. 当 h > 0 时, 量

是正的 (或 0); 但是当 h < 0 时, 此量是负的 (或 0). 因此右极限

一定大于或等于 0, 而同样的左极限是小于或等于 0. 由于双侧极限存

在, 故左极限等于右极限; 唯一的可能性就是它们都是 0. 这就证明了

f' (c) = 0, 故 x = c 是 f 的一个临界点.

如果 f 在 x = c 有一个局部最大值会如何呢？我把这个论证过程

留给你来完成. 唯一的区别就是, 当 h 接近于 0 时, 量 f (c + h) - f

(c) 是负的 (或 0).

A.6.7 罗尔定理的证明

假设 f 在 [a, b] 上连续, 在 (a, b) 内可导, 且满足条件 f (a) = f (b).

接下来, 我们想要证明在 (a, b) 内存在一个数 c, 使得 f' (c) = 0. 为

了求证, 我们使用最大-最小值定理来说明 f 在 [a, b] 上有一个全局最

大值和一个全局最小值. 如果最大值或最小值中任一个出现在 (a, b)

内的某个数 c 上, 那么极值定理告诉我们 f' (c) = 0. (我们知道 f' (c)

存在, 因为 f 在 (a, b) 内可导. ) 其他的唯一可能性就是全局最大值和

全局最小值都出现在端点 a 和 b 上. 在这种情况下, 由于 f (a) = f

(b), 该函数一定为常数, 因此, (a, b) 内的每一个数 c 都满足 f' (c) =

0. 这就是完整的证明!

A.6.8 中值定理的证明

现在, 我们知 f 在 [a, b] 上连续, 在 (a, b) 内可导, 但我们不假设 f

(a) = f (b). 中值定理表明, 在 (a, b) 内存在某个 c 满足

为了证明这一点, 我们定义一个新的函数 g ：

它看起来有点复杂, 但实际上我们只是从 f (x) 中减去了线性函数 x -

a 的一个常数倍, 并称之为 g. 因此, 函数 g 也在 [a, b] 上连续且 (a,

b) 内可导, 且可知

因此, 我们证明了 g (a) = g (b), 这表示我们可以应用罗尔定理了! 结

果是, 存在一个数 c 使得 g' (c) = 0. 现在, 我们只需要对 g 求导来看

看这对于 f 意味着什么. 由于量 f (b) - f (a) 和 b - a 都是常数, 我们

得到

现在, 将 x = c 代入. 由于 g' (c) = 0, 我们有

这表示

这正好是我们想要证明的!

A.6.9 线性化的误差

让我们来整理另外一个不精确的结果. 在 13.2 节, 我们看到函数 f 关

于 x = a 的线性化 L, 其中 a 是 f 定义域内的某个数：

如果 x 在 a 的附近, 我们可以使用 L (x) 来估算 f (x) 的值. 我们的错

误可能有多大呢？根据 13.2.4 节的公式, 如果 f'' 在 x 和 a 之间存

在, 那么

|误差| = ,

这里的 c 是介于 x 和 a 之间的某个数. 我们来证明这个公式. 首先,

我们称误差项为 r (x); 由于 r (x) 是 f (x) 的真值和猜测值的差, 故猜

测值就是线性化 L (x) = f (a) + f' (a) (x - a). 我们有

现在, 聪明的做法是将 x 固定为一个常数并且令 a 为变量. 由此启发

得到

因此, 只有 t = a 时, 才有误差 r (x). 即, 误差为 g (a). 注意

我们求 g 关于 t 的导数. 项 f (x) 是常数, 故其导数为 0. 此外, 我们需

要用乘积法则来处理 f' (t) (x - t). 总之, 我们得到

特别地, 我们有

目前为止, 我们所做的一切都是非常合理的. 现在, 我们必须做一些看

起来有些疯狂的事情. 请记住, 我们想要证明误差是 , 其中

c 介于 x 和 a 之间. 由于误差是 g (a), 这就暗示了 g (t) 形如 K (x -

2
t) , 其中 K 是某个不依赖于 t 而只依赖于 x 和 a 的数. 即使这不完

全正确, 但它或许可以解释我们为什么会令

你看, 当对它关于 t 求导时, 保持 x 为常数, 会得到

这又怎么样？我们可以使用中值定理 (见 11.3 节) 得到

对于某个介于 x 和 a 之间的 c 成立. 我们可以使用上述等式对 h'

(c)、h (x) 及 h (a) 做替换：

因为 g (x) = 0. 因为 g' (c) = -f'' (c) (x - c), 最后一个方程可以重新

整理为

我们的任务快完成了, 但仍然有一个问题. 我们不能处理因子 (x - c),

因为在我们的误差项中没有它! 唯一一种消除它的可能就是左边等于

2
0, 即应该选取 K 使得 g (a) - K (x - a) = 0. 事实上, 如果 K = g

2
(a) / (x - a) , 那么上述方程变为

由于 x ≠ a 且 x ≠ c, 我们一定会有

这表示 . 由于 g (a) = r (x) 是我们要找的误差, 因

此我们完成了证明.

A.6.10 分段函数的导数

假定 f 以分段的形式定义为

(你可以将 x > a 改为 x ≥ a, 将 x ≤ a 改为 x < a ; 这无关紧要. )

不管怎样, 在 6.6 节中, 我们考虑了一个问题, 就是 f 是否在 a 上可

导. 我们假设如果函数 f 和 f 在 x = a 处互相匹配, 则它们的导数
2
1
和在 x = a 处也互相匹配, 那么 f 在 a 上可导. 我们如何来证明

呢？首先要注意 f 和 f 在 x = a 处互相匹配的意思是
1
2

这就确保了 f 至少是连续的. 现在, 我们还要假设它们的导数也互相匹

配, 这意味着 f 在最接近 a 的右侧是可导的, f 在最接近 a 的左侧是
2
1
可导的, 以及

其中 L 是某个很好的有限数. 因此, 我们来考虑

其中 h 是某个很小的数且 h ≠ 0. 如果 h > 0, 那么我们可以应用中

值定理 (见 11.3 节) 得到

其中 c 是介于 a 和 a + h 之间的某个数. (这里我们需要 f 在 [a, a +

+
h] 上的连续性. ) 根据三明治定理, 当 h → 0 时, 数 c 就被夹在 a 和

+
+
a + h 之间, 故当 h → 0 时有 c → a . 我们现在看到

同理得左极限, 只是我们要使用代替：

左极限和右极限都等于 L, 因此, 我们证明了 f' (a) 存在且它也等于 L.

A.6.11 洛必达法则的证明

我们来证明洛必达法则 (见第 14 章). 确切地说, 假设我们有两个函数

f 和 g, 它们在某个包含点 a 的区间上可导 (但或许不在 a 本身), 且 f

(a) = g (a) = 0; 此外, 除了可能在 a 处, g' (x) ≠ 0. 那么, 我们需要

证明

假设右边的极限存在. 我们需要一个形式略有不同的中值定理, 它被称

为柯西中值定理：如果 f 和 g 在 [a, b] 上连续, 在 (a, b) 内可导, 且

在 (a, b) 上 g' (x) -= 0, 那么, 在 (a, b) 内存在某个 C 使得

我们首先来证明它, 然后用它来证明洛必达法则. 顺便提一句, 请注意,

如果对于所有的 x 有 g (x) = x, 那么 g' (x) = 1, 并且上述方程变为

这正好是常规的中值定理! 尽管如此, 它对我们没有太多帮助. 让我们

回到原始方程中去看看右边的分母吧, 即 g (B) - g (A). 这不可能等于

0; 要是那样的话, 则 g (B) = g (A), 这表示根据罗尔定理 (见 11.2

节), 对于在 (a, b) 内的某个 C, g' (C) = 0. 因此, 右边有意义. 现在,

我们定义一个新的函数 h：

对于在 (a, b) 内的所有的 x 成立. (将这个函数与 A.6.8 节中的常规

中值定理的证明中的函数 g 做比较. ) 不管怎样, 我们来写出有关这个

函数的某些事实吧. 首先, 计算 h (A) 和 h (B). 我们有

而

故 h (A) = h (B). 此外, 注意 h 是可导的, 并且由于 A 和 B 都是常

数, 我们有

由于 h (A) = h (B), 我们可以使用罗尔定理来推出结论：在 (a, b)

内存在一个数 C, 使得 h' (C) = 0. 这意味着

如果你重新整理这个方程, 就会得到我们想要的结果

现在, 我们来证明洛必达法则. 由于 f (a) = g (a) = 0, 我们有

如果 x > a, 那么在区间 [a, x] 上, 我们可以使用柯西中值定理 (就是

我们刚刚证明的) 来说明

对于在 (a, x) 内的某个 c 成立. 否则, 如果 x < a, 那么我们会有相同

的结果, 只是 c 在 (x, a) 中. (注意, 我们使用的事实是, 除了可能在 a

外, g' 不为 0; 这是柯西中值定理的一个条件. ) 当然, 数 c 依赖于 x

的值; 而我们看到, 当 x → a 时, 也会有 c → a. 因此, 我们有

所剩的工作就是将 c 看成虚拟变量并将它改为 x, 这样, 我们就完成了

洛必达法则的证明.

嗯, 其实证明不算完整. 我们还没有证明 ∞/∞ 的情况, 也没有证

明 x → ∞ (或 -∞) 时的情况. 如果你敢于挑战, 就请尝试将上述证明应

用到这些情况中吧, 这是一个极棒的练习.

本书由「ePUBw.COM」整理，

ePUBw.COM 提供最新最全的优质电子书下

载！！！

A.7 泰勒近似定理的证明

现在, 我们来看看如何证明 24.1.3 节中的泰勒近似定理吧. 该定

理说的是：如果 f 在 x = a 处是光滑的, 那么, 在所有 N 次或 N 次以

下的多项式中, 对于在 a 附近的 x 的 f (x) 的最佳近似就是 N 阶泰勒

多项式 P 它由下式给出：
N

我们的计划是, 证明该定理是如何从 24.1.4 节的完整泰勒定理中推导

出来的. 我省略了完整泰勒定理的证明, 因为从大多数教科书或在搜索

引擎上输入 “泰勒定理的证明” 能找到. 你不容易找到的是这个近似定

理的证明, 因此我们就来看看它吧.

首先, 让我们设 a = 0 来简化这个问题. 由于我们假设完整泰勒定理

已经被证明了, 因此可知 f (x) = P (x) + R (x), 其中
N
N

是一个 N 次多项式, 也知

其中 c 介于 0 和 x 之间. (请记住, 我们设了 a = 0, 因此, 形如 (x -

n
n
a) 的因子就变为 x , 形如 f (n) (a) 的量就变为 f (n) (0). ) 我们想要
证明的就是：

在所有 N 次或 N 次以下的多项式中, P 是在 0 附近 f 的最佳近
N

似.

到底如何证明类似的陈述呢？上下文中的 “最佳” 又意味着什么呢？

求解技巧是, 另外选取一个次数不超过 N 的多项式, 我们称之为 Q. 由

于 Q 不同于 P , 所以 Q 至少有一个系数不同于 P 中的相应系数.
N
N
我们想要证明 P (x) 比 Q(x) 更接近 f (x), 至少当 x 接近 0 时如此.
N

为了看到这两个量有多么接近, 你需查看一下这两个量的差. 因此, 我

们真正想要证明的就是不等式 |f (x) - P (x)| < |f (x) - Q(x)|, 此时
N

取 x 接近 0. 如果这是正确的, 那么就可以推出结论 —- P (x) 确实
N

比 Q(x) 更接近理想值 f (x).

为了得到这个不等式, 我们来分别看看两边的情况. 左边是 f (x) - P N

(x) 的绝对值, 这实际上就是余项 R . 我们已经有一个 R 的表达式,
N
N
它包括三个因子, 即 f (N +1) (c)、x N +1 及 1/ (N + 1)!. 我们知道 c

介于 0 和 x 之间, 当 x → 0 时, 根据三明治定理一定有 c → 0. 由于

我们假定 f 非常光滑, 函数 f (N +1) 是连续的. 因此, 当 x → 0 时有 c

→ 0, 故得出 f (N +1) (c) ~ f (N +1) (0). 将这三个因子写在一起并取

绝对值, 我们有

其中 x → 0. 事实上, 我们可以令 C = f (N +1) (0) / (N + 1)!, 要注意

C 只是某个不依赖于 x 的常数. 因此, 我们有

, 当 x → 0 时.

这太棒了. 现在, 我们来看看要证明的不等式的右边. 这个量是 |f (x) -

Q (x)|. 我们写出 f (x) = P (x) + R (x), 从而
N
N

其中, 我们通过设 S (x) = P (x) - Q (x) 将 P (x) 和 Q (x) 放在一
N
N
起. 让我们来好好看看 S. 它是两个次数不超过 N 的不同多项式的差.

因此, S 是一个次数小于或等于 N 的多项式, 但它不是零多项式. 我们

m
假设, 如果用 x 的幂来写 S (x), 它就好像 S(x) = a x + … , 其中
m
m
a x 是最低次数项. 数 m 必然介于 0 和 N 之间, 因为 S 的次数小
m
于或等于 N . 我们知道 S 的行为很像它的最低次数项的行为 (见

m
21.4.1 节). 即, 当 x → 0 时, S (x) ~ a x . 另一方面, 我们需要看
m
看 S (x) + R (x), 因为这是我们想要的不等式的右边. 我们已经看到
N

了, 当 x → 0 时 R (x) ~ Cx N+1 , 故 S (x) + R (x) 中的最低次数
N
N

m
m
项的行为仍会像 a x 一样 (请记住, m ≤ N , 故 x 是一个次数低
m
于 x N +1 的项). 综述, 我们有

, 当 x → 0 时.

太棒了! 我们想要证明不等式

当 x 接近 0 时是成立的. 我们知道, 当 x → 0 时, |f (x) - P (x)| ~
N

m
|C||x| N+1 及 |f (x) - Q (x)| ~ |a ||x| . 由于 m < N + 1(及 |C|
m
m
与 |a | 都是常数), 易知当 x 很小时, |C||x| N+1 比 |a ||x| 小得多.
m
m
事实上, 这两个量的比率是

其中 C = |C| / |a | 只是另一个常数. 当 x → 0 时, 右边的量趋于 0.
1
m
因此, 当 x 接近 0 时, 以上不等式实际上是成立的. 最终我们完成了泰

勒近似定理的证明!

事实上, 有一点我们没有考虑：假设 a = 0. 为了由此推出一般情

况, 你只需在上述证明过程中每一处都用被平移的量 (x - a) 替换量 x.

你只需要注意, (x - a) → 0 和 x → a 是同一个意思. 我把证明细节留

给你来完成. 如果你能通过上述证明做到这点, 那你就太棒了.

本书由「ePUBw.COM」整理，

ePUBw.COM 提供最新最全的优质电子书下

载！！！

附录 B 估算积分

看到定积分时, 我们习惯于通过反导数以及微积分第二基本定理来给

出一个确切的答案. 可实际上, 求解一个有用的反导数可能会很困难或

者根本不可能. 有时候, 最好的选择是求出一个积分值的近似. 因此,

我们将讨论估算定积分的三种技巧, 以下就是最后这个附录的内容：

使用条纹、梯形法则及辛普森法则估算定积分;

估算上述近似中的误差.

本书由「ePUBw.COM」整理，

ePUBw.COM 提供最新最全的优质电子书下

载！！！

B.1 使用条纹估算积分

以下是一个完全合理的定积分：

它相当于由 x 轴、曲线 y = e -x 2 以及直线 x = 0 与 x = 2 所围成区

域的面积, 如图 B-1 所示.

图 B-1

求这样的区域面积或许看起来偏于技术性, 但它有非常大的实际意义.

1
上述曲线通常被认为是钟形曲线, 而且它是概率论学习的基础. 因此,

特别烦扰的是, 没有简单的好方法来写出反导数

1 技术上说, 钟形曲线 (或正态分布) 实际上是由方程给出的.

实际上, 你可以使用麦克劳林级数把这个积分写成一个无穷级数, 但这

也不是简单的好方法. 当前的严峻现实是, 无法将本节最开始的那个定

积分的确切值以简洁的方式写出来. (在 16.5.1 节中, 我们已经讨论了

这一点. ) 另一方面, 我们可以使用黎曼积分的定义求出这个积分的近

似值, 即一个估算. 实际上, 在 16.2 节, 我们讨论了划分、区间以及黎

曼和. 由于积分是黎曼和的极限, 不取极限, 我们就可以得到一个近似.

因此, 为了估算积分

可以将区间 [a, b] 做一个形如

的划分, 然后在 [x , x ] 中选取一点 c , 在 [x , x ] 中选取一点 c ,
1
2
1
0
1
2
以此类推直到在 [x n-1 , x ] 中选取一点 c . 那时, 就可以写出
n
n

这就是说, 积分近似等于它的一个黎曼和.

所有这一切看起来都很抽象. 我们来看看它在上例中是如何起作用

的吧. 我们要从 0 到 2 积分, 因此需要区间 [0, 2] 上的一个划分. 该区

间上最简单的划分就是这个区间 [0, 2], 这相当于选择 n = 1、x = 0
0

及 x = 2. 我们只需要在 [0, 2] 内选取 c . 求出的近似很大程度上依
1
1

赖于这个选取! 例如, 如果选取 c = 0、c = 1 或 c = 2, 那么近似
1
1
1
就会分别对应图 B-2 所示区域的面积.

图 B-2

很明显, 第一个估算过高了, 而第三个则估算过低了. 中间的那个不算

太糟, 但它仍不完美. 为了计算这三个估算值, 我们使用公式

我们用 1 替换 n, 替换 f (c ), 0 替换 x , 并用 2 替换 x , 得到
1
0
1

4
当 c 是 0、1 或 2 时, 这些值分别是 2、2/e ≈ 0.736 及 2/e ≈
1
0.037. 正如你看到的, 这三个估算有很大的差别!

现在我们来看看, 使用更多的条纹是否可以做得更好. 假设我们取

了 [0, 2] 上的一个五条划分

因此, n = 5, x = 0, , x = 1, , , x = 2. 假设我
2
0
5
们选取的数 c 是每一个小区间的左端点, 这就表示 c = 0, , c 3
j
1
= 1, , . 将这些数代入上述近似公式中, 可得

如果你喜欢, 可以再做一些简化, 或者使用计算器或计算机得出其

近似到小数点后四位的结果 1.0865. 现在, 你的任务是, 求使用每一个

小区间的右端点而不是左端点时的估算值.

均匀划分

取均匀划分总会是很方便的. 这表示, 每一个小区间都有相同的宽度,

并且要计算出其宽度也不是很难的事情. 如果积分区间是 [a, b], 那么

其长度是 b - a 单位, 因此如果将该区间 n 等分, 那么每一个小区间的

长度是 (b - a) /n 单位. 我们称这个量为 h, 故 h = (b - a) /n. 此外,

出现在黎曼和定义中的表达式 (x - x ) 正是第 j 个条纹的宽度, 因此
j-1
j
它正是 h. 我们的表达式

可以简化为

你仍然需要选取数 c , 但这一次就简单多了. 例如, 我们使用 10
j

个等宽的条纹来估算积分

每一条的宽度是 h = (2 - 0) /10, 即 1/5, 而且 n = 10. 因此, 我们有

这些区间的宽度都是 1/5, 因此从 0 开始, 我们看到了如下的划分：

如果我们令 c 为每一个小区间的右端点, 那么就有 , , 以此
j

类推直到 c = 2. 我们将这些数代入上述公式中, 得到
10

在这个和中有 10 项. 由于函数 f 在 0 和 2 之间是递减的, 而且我们使

用了每一条的右端点, 因而以上就是估算过低的情况. (你知道为什么

吗？) 不管怎样, 你可以使用计算器或计算机来求上面的和, 大约是

0.783 670(近似到小数点后六位).

如果使用每一个小区间的中点, 而不是左端点或右端点, 情况又会怎样

呢？我们知道, 的中点是 , 的中点是 , 以此类推. 因此,

另一个可能的近似是

这大约是 0.882 202.

本书由「ePUBw.COM」整理，ePUBw.COM

提供最新最全的优质电子书下载！！！

B.2 梯形法则

涉及选取数 c 的问题是很困难的. 大多数情况下, 人们或者选择左端点
j

或者选择右端点, 中点也是个常见的 (并且合理的) 选择. 这里还有一种

估算积分的方法, 它不需要选择 (当然是在你决定使用这种方法的时

候!) 但会给出更好的估算. 它被称作梯形法则.

其基本思想非常简单：我们允许条纹的上边不平行于底边. 每一条纹的

上边都是连接曲线 y = f (x) 上的两个相应点的线段. 图 B-3 就是说明

这两种方法间区别的图像.

图 B-3

让我们来好好看看其中的一条新条纹, 如图 B-4 所示.

图 B-4

由于有两条边是平行的, 故该条纹是一个梯形. 底边长是 (x - x ) 单
j
j-1
位, 而平行的边的高度为 f (x ) 单位和 f (x ) 单位. 根据梯形面积公
j-1
j
式, 这个梯形条纹的面积是平方单位. 如果我

们确保划分都是均匀的, 那么如同上一节, 可知 x - x 就是 (b - a)
j-1
j
/n. 这恰好就是条纹的宽度 (单位), 我们称之为 h, 因此, 一个条纹的面

积变为

平方单位. 余下的工作就是把所有的梯形条纹面积都加在一起. 我们可

以只将一个 Σ 符号放在以上量的外面, 提取常数因子 h/2, 即

事实上, 我们可以把这个表达式再简化一些. 你看, 除了最左边和最右

边的条纹, 其他的相邻条纹都共用一条边, 如图 B-5 所示.

图 B-5

这意味着, 我们可以将很多项合并. 特别地, 除了 x 和 x 之外, 形如 f
n
0
(x ) 的每一项都被用到两次. 例如 n = 4 时, 我们有
j

因此, 我们可以将和式中除第一项和最后一项外的所有项合并, 得到

同样的技巧适用于一般情况, 因此有

让我们应用它来求下面积分的近似值：

我们取 n = 5. 由于 [0, 2] 的长度为 2 单位, 从而每一条的宽度为

单位, 且划分是

根据梯形法则, 我们有

如果你愿意, 也可以将右边简化为

你可以使用计算器或计算机来计算, 结果近似到小数点后六位是 0.881

131. 这比我们在 B.1 节结尾部分求出的估算 1.08 65 略小一点, 但

它很接近 B.1.1 节结尾部分的估算 0.882 202.

本书由「ePUBw.COM」整理，ePUBw.COM

提供最新最全的优质电子书下载！！！

B.3 辛普森法则

为什么要止步于梯形法则呢？梯形仍然有一个笨拙的线形上边. 在条纹

的上边使用曲线而不是线段, 我们可以做得更好. 以下就是操作细节.

首先, 我们来看看相邻的两个条纹, 不用线段连接上边, 而是用一个二

次曲线, 如图 B-6 所示.

图 B-6

正如我们将在 B.3.1 节中看到的, 阴影部分的面积是

平方单位, 其中我们又设了 h = (b - a) /n. 现在, 如果对每一对条纹重

复这个操作, 再将所有的面积相加, 就会得到近似. 如同梯形法则的情

况, 相邻的两个条纹共用一条边, 因此会有一些量被重复一次. 例如, 如

果有四个条纹, 那么面积和将是

我们把形如 f (x ) 的两项合并起来变为 2f (x ), 因此面积和是
2
2

如果有更多的条纹依然会有相同样式的结果. 如果 j 是偶数, f (x ) 的系
j

数等于 2; 如果 j 是奇数, f (x ) 的系数等于 4——f (x ) 和 f (x ) 除
j
n
0
外, 它们的系数都是 1.总之, 我们有：

我们拿它和上一节的梯形法则比较一下. 代替形如 1, 2, 2, ..., 2, 2, 1

的系数, 这一次系数形如 1, 4, 2, 4, 2, ..., 2, 4, 2, 4, 1. 还要注意的

是, 前面分母中的常数为 3 而不是 2.

应用辛普森法则很容易. 我们回到原来的那个例子中：

Pages:

Click to View FlipBook Version