失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 导数与高阶导数

导数与高阶导数

时间:2019-10-22 04:58:52

相关推荐

导数与高阶导数

导数与高阶导数

我们的讨论都是针对一元实函数,但这个过程对 F n → V \mathbb{F}^n\to V Fn→V的函数都是很有用的,其中 F ∈ { R , C } , V \mathbb{F}\in\{\R,\mathbb{C}\},V F∈{R,C},V是 F − \mathbb{F}- F−线性空间。

1. 导数与微分

f f f在 x 0 x_0 x0​附近以变化量 Δ x \Delta x Δx变化时,我们想通过自变量的变化 Δ x \Delta x Δx反映函数值的变化 f ( x 0 + Δ x ) − f ( x 0 ) f(x_0+\Delta x)-f(x_0) f(x0​+Δx)−f(x0​),特别地,我们想通过简单的线性映射拟合这一关系,尽管这可能不太准确,但我们只要求这在 x 0 x_0 x0​的局部是近似的就可以了,这就催生了微分的概念。

设 f : B ( x 0 , δ ) = ( x 0 − δ , x 0 + δ ) → R f:B(x_0,\delta)=(x_0-\delta,x_0+\delta)\to\R f:B(x0​,δ)=(x0​−δ,x0​+δ)→R,那么下面两个命题是等价的:

( 1 ) (1) (1) 下面的极限存在:

lim ⁡ Δ x → 0 f ( x 0 + Δ x ) − f ( x 0 ) Δ x \lim_{\Delta x\to0}\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x} Δx→0lim​Δxf(x0​+Δx)−f(x0​)​

( 2 ) (2) (2) 存在线性映射 T ∈ L ( R ) T\in\mathcal{L}(\R) T∈L(R),由于 R \R R上的线性算子就是实数的数乘,我们把数乘的系数记作 A ∈ R A\in\R A∈R,从而 T : R → R , x ↦ A x T:\R\to\R,x\mapsto Ax T:R→R,x↦Ax,我们有:

f ( x 0 + Δ x ) = f ( x 0 ) + A Δ x + o ( Δ x ) 或 lim ⁡ Δ x → 0 f ( x 0 + Δ x ) − f ( x 0 ) − A Δ x Δ x = 0 f(x_0+\Delta x)=f(x_0)+A\Delta x+o(\Delta x)~~~~或~~~~\lim_{\Delta x\to0}\frac{f(x_0+\Delta x)-f(x_0)-A\Delta x}{\Delta x}=0 f(x0​+Δx)=f(x0​)+AΔx+o(Δx)或Δx→0lim​Δxf(x0​+Δx)−f(x0​)−AΔx​=0

我们先来证明这一点。假设 ( 1 ) (1) (1)成立,我们取 A = lim ⁡ Δ x → 0 f ( x 0 + Δ x ) − f ( x 0 ) Δ x A=\lim_{\Delta x\to0}\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x} A=limΔx→0​Δxf(x0​+Δx)−f(x0​)​,从而有

lim ⁡ Δ x → 0 f ( x 0 + Δ x ) − f ( x 0 ) − A Δ x Δ x = lim ⁡ Δ x → 0 f ( x 0 + Δ x ) − f ( x 0 ) Δ x − A = 0 \lim_{\Delta x\to0}\frac{f(x_0+\Delta x)-f(x_0)-A\Delta x}{\Delta x}=\lim_{\Delta x\to0}\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x}-A=0 Δx→0lim​Δxf(x0​+Δx)−f(x0​)−AΔx​=Δx→0lim​Δxf(x0​+Δx)−f(x0​)​−A=0

从而 x ↦ A x x\mapsto Ax x↦Ax就是我们要找的线性映射。反过来,假设 ( 2 ) (2) (2)成立,根据上面的式子同样得出 ( 1 ) (1) (1)式中的极限是存在的并且就等于 A A A。因此上面两个命题是等价的。

假设 f f f满足 ( 1 ) , ( 2 ) (1),(2) (1),(2)中的一条,我们就称 f f f在 x 0 x_0 x0​处是可微的,并且我们把 ( 1 ) (1) (1)中的极限值记为 f ′ ( x 0 ) f'(x_0) f′(x0​)或者 d d x f ( x 0 ) \frac{d}{dx}f(x_0) dxd​f(x0​),称为 f f f在 x 0 x_0 x0​处的导数,把 ( 2 ) (2) (2)中的线性映射 T T T记为 d f ( x 0 ) df(x_0) df(x0​),称为 f f f在 x 0 x_0 x0​处的微分。因此如果我们用 Δ x \Delta x Δx来表示一个自由的自变量,就有下面的表达式成立:

d f ( x 0 ) : R → R , Δ x ↦ f ′ ( x 0 ) Δ x df(x_0):\R\to\R,\Delta x\mapsto f'(x_0)\Delta x df(x0​):R→R,Δx↦f′(x0​)Δx

我们往往就会写成 d f ( x 0 ) = f ′ ( x 0 ) Δ x df(x_0)=f'(x_0)\Delta x df(x0​)=f′(x0​)Δx,这里我们隐含地把用线性映射 d f ( x 0 ) df(x_0) df(x0​)的符号来代表它在自变量 Δ x \Delta x Δx处的映射值,也就是说更严谨的记号其实是 ( d f ( x 0 ) ) ( Δ x ) = f ′ ( x 0 ) Δ x (df(x_0))(\Delta x)=f'(x_0)\Delta x (df(x0​))(Δx)=f′(x0​)Δx,但我们通常会采取前一种写法。

这样,我们就可以通过 d f ( x 0 ) = f ′ ( x 0 ) Δ x df(x_0)=f'(x_0)\Delta x df(x0​)=f′(x0​)Δx这一方式把变化量 f ( x 0 + Δ x ) − f ( x 0 ) f(x_0+\Delta x)-f(x_0) f(x0​+Δx)−f(x0​)表为了关于 Δ x \Delta x Δx的线性函数,而这个表示的误差是一个 Δ x \Delta x Δx的高阶无穷小量 o ( Δ x ) o(\Delta x) o(Δx)。 这里我们需要的是微分的概念,但求导提供了求微分的一种有效方法。

现在,假定函数 f f f在开区间 I = ( a , b ) I=(a,b) I=(a,b)上每一点都可微,我们就可以把 f ′ : x 0 ↦ f ′ ( x 0 ) f':x_0\mapsto f'(x_0) f′:x0​↦f′(x0​)视为 I I I上的函数,这时我们可以将 d d x \frac{d}{dx} dxd​视为一个求导算符,把函数 f f f变换为它的导函数 f ′ f' f′,也就是:

d d x : f ↦ d d x f = f ′ \frac{d}{dx}:~f\mapsto \frac{d}{dx}f=f' dxd​:f↦dxd​f=f′

利用极限的定义,我们容易证明这样的结论:如果 f , g f,g f,g在 I I I上都处处可微,那么 f + g f+g f+g和 λ f \lambda f λf( λ ∈ R \lambda\in\R λ∈R)在 I I I上也处处可微并且 ( f + g ) ′ = f ′ + g ′ , ( λ f ) ′ = λ f ′ (f+g)'=f'+g',~(\lambda f)'=\lambda f' (f+g)′=f′+g′,(λf)′=λf′,这说明如果我们用 C 1 ( I ) C^1(I) C1(I)表示 I I I上所有具有连续的导函数的函数构成的集合,那么 C 1 ( I ) C^1(I) C1(I)是一个 R − \R- R−线性空间,因此 d d x \frac{d}{dx} dxd​就是 C 1 ( I ) → C ( I ) C^1(I)\to C(I) C1(I)→C(I)上的线性算子,这里 C ( I ) C(I) C(I)是 I I I上的连续函数构成的集合,也就是我们有:

d d x ∈ L ( C 1 ( I ) , C ( I ) ) : f ↦ d d x f = f ′ \frac{d}{dx}\in\mathcal{L}(C^1(I),C(I)):f\mapsto\frac{d}{dx}f=f' dxd​∈L(C1(I),C(I)):f↦dxd​f=f′

现在让我们把目光转向微分。我们知道, f f f在某点的微分是一个线性映射,假设 f f f在开区间 I I I上处处可微,我们也可以把 d f ( ⋅ ) df(\cdot) df(⋅)视为把 x 0 x_0 x0​映射为 d f ( x 0 ) df(x_0) df(x0​)这个线性映射的映射。为了避免讨论”映射的映射“同时又不太损害我们所要讨论内容的深度,我们固定 Δ x \Delta x Δx为某个定值,此时

d f : I → R , x 0 ↦ d f ( x 0 ) = f ′ ( x 0 ) Δ x df:I\to\R,~x_0\mapsto df(x_0)=f'(x_0)\Delta x df:I→R,x0​↦df(x0​)=f′(x0​)Δx

上面的 d f ( x 0 ) df(x_0) df(x0​)实际上是 ( d f ( x 0 ) ) ( Δ x ) (df(x_0))(\Delta x) (df(x0​))(Δx)的简写。我们注意到上面的式子的右侧也是一个函数可以视为函数 Δ x ⋅ f ′ \Delta x\cdot f' Δx⋅f′(这是函数 f ′ f' f′的数乘,注意我们已经固定了 Δ x \Delta x Δx),因此从函数的角度来说我们有这样的等式:

d f = f ′ Δ x = d d x f Δ x df=f'\Delta x=\frac{d}{dx}f~\Delta x df=f′Δx=dxd​fΔx

我们考虑 R \R R上的恒等映射 id : x ↦ x \text{id}:x\mapsto x id:x↦x,出于习惯我们就用 x x x来代表这个函数,对它求微分,利用上面的式子有

d id = d x = x ′ Δ x = 1 ⋅ Δ x = Δ x d~\text{id}=dx=x'\Delta x=1\cdot\Delta x=\Delta x did=dx=x′Δx=1⋅Δx=Δx

就得到了等式 d x = Δ x dx=\Delta x dx=Δx,所以我们就可以把 Δ x \Delta x Δx视为恒等映射 x x x在任意一点的微分 d x dx dx,这对我们认识复合函数的微分是有好处的。现在上面的式子变为:

d f = f ′ d x = d d x f d x df=f'dx=\frac{d}{dx}f~dx df=f′dx=dxd​fdx

我们要注意 d x = Δ x dx=\Delta x dx=Δx是一个常数因为 Δ x \Delta x Δx已经被固定住了,所以上面的式子表示 f f f的微分就是其导数的 d x dx dx倍,因此从线性映射的数乘的角度来讲,求微分映射相当于先作用求导映射再乘上常数 d x dx dx,从这个角度我们有:

d = d x ⋅ d d x d=dx\cdot\frac{d}{dx} d=dx⋅dxd​

这个等式看起来就好像把分母上的 d x dx dx约掉了一样,但事实上 d d x \frac{d}{dx} dxd​是一个整体的记号表示一个线性算子,这个等式描述了一个线性算子是另一个线性算子的数乘。

我们最后来考虑一下复合函数的微分,假设 f : I → J , g : J → R f:I\to J,~g:J\to\R f:I→J,g:J→R,并且 f f f在 x 0 x_0 x0​处可微, g g g在 f ( x 0 ) f(x_0) f(x0​)处可微,那么 g ∘ f g\circ f g∘f在 x 0 x_0 x0​处可微并且我们可以计算出这个微分。设 Δ x \Delta x Δx是一个自由变量,那么:

( g ∘ f ) ( x 0 + Δ x ) − ( g ∘ f ) ( x 0 ) = g ( f ( x 0 + Δ x ) ) − g ( f ( x 0 ) ) = g ( f ( x 0 ) + f ′ ( x 0 ) Δ x + o ( Δ x ) ) − g ( f ( x 0 ) ) = g ′ ( f ( x 0 ) ) ( f ′ ( x 0 ) Δ x + o ( Δ x ) ) + o ( f ′ ( x 0 ) Δ x + o ( Δ x ) ) = g ′ ( f ( x 0 ) ) f ′ ( x 0 ) Δ x + o ( Δ x ) (g\circ f)(x_0+\Delta x)-(g\circ f)(x_0)=g(f(x_0+\Delta x))-g(f(x_0))\\ =g(f(x_0)+f'(x_0)\Delta x+o(\Delta x))-g(f(x_0))\\ =g'(f(x_0))(f'(x_0)\Delta x+o(\Delta x))+o(f'(x_0)\Delta x+o(\Delta x))\\ =g'(f(x_0))f'(x_0)\Delta x+o(\Delta x) (g∘f)(x0​+Δx)−(g∘f)(x0​)=g(f(x0​+Δx))−g(f(x0​))=g(f(x0​)+f′(x0​)Δx+o(Δx))−g(f(x0​))=g′(f(x0​))(f′(x0​)Δx+o(Δx))+o(f′(x0​)Δx+o(Δx))=g′(f(x0​))f′(x0​)Δx+o(Δx)

根据微分的定义我们有

d ( g ∘ f ) ( x 0 ) = g ′ ( f ( x 0 ) ) f ′ ( x 0 ) d x d(g\circ f)(x_0)=g'(f(x_0))f'(x_0)dx d(g∘f)(x0​)=g′(f(x0​))f′(x0​)dx

注意到 f ′ ( x 0 ) d x = d f ( x 0 ) f'(x_0)dx=df(x_0) f′(x0​)dx=df(x0​),所以上面的式子也可以写成

d ( g ∘ f ) ( x 0 ) = g ′ ( f ( x 0 ) ) d f ( x 0 ) 或 d ( g ∘ f ) = ( g ′ ∘ f ) d f d(g\circ f)(x_0)=g'(f(x_0))df(x_0)~~~~~~~~或~~~~~~~~d(g\circ f)=(g'\circ f)df d(g∘f)(x0​)=g′(f(x0​))df(x0​)或d(g∘f)=(g′∘f)df

这个式子就好像 f f f是微分表达式中的自变量,事实上无论 f f f是内层函数(中间变量)还是自变量,微分表达式的形式是没有区别的,这被称为一阶微分的形式不变性。

2. 高阶微分与 Taylor \text{Taylor} Taylor公式

我们通过函数 f f f的微分 d f df df把 f f f局部线性化,其对应的误差是 Δ x \Delta x Δx的高阶无穷小量。我们是否能够做得更好?

线性映射的复合往往被定义为线性映射的乘法,所以 n n n个相同的线性映射 T T T的复合会被记作 T n T^n Tn。现在让我们来考虑高阶导数与高阶微分的概念,设 n ∈ Z > 0 n\in\Z_{>0} n∈Z>0​为正整数,我们定义

( d d x ) n = d d x ∘ ⋯ ∘ d d x ⏟ n 个 (\frac{d}{dx})^n=\underbrace{\frac{d}{dx}\circ\cdots\circ\frac{d}{dx}}_{n个} (dxd​)n=n个 dxd​∘⋯∘dxd​​​

是 n n n阶求导算符,从而 f f f的 n n n阶导数定义为 ( d d x ) n f : = f ( n ) (\frac{d}{dx})^nf:=f^{(n)} (dxd​)nf:=f(n),如果 n n n比较小我们也用撇号的数量代表导数的阶数,比如 f ( 1 ) = f ′ , f ( 2 ) = f ′ ′ f^{(1)}=f',f^{(2)}=f'' f(1)=f′,f(2)=f′′。根据映射复合的概念,这就是对 f f f求 n n n次导数。同理我们也可以定义高阶的微分,也即

d n = d ∘ ⋯ ∘ d ⏟ n 个 d^n=\underbrace{d\circ\cdots\circ d}_{n个} dn=n个 d∘⋯∘d​​

注意我们依然固定着 d x = Δ x dx=\Delta x dx=Δx,所以由表达式 d = d d x ⋅ d x d=\frac{d}{dx}\cdot dx d=dxd​⋅dx我们可以得出高阶微分基于求导的计算公式:

d n = ( d d x d x ) n = ( d d x ) n ( d x ) n d^n=(\frac{d}{dx}dx)^n=(\frac{d}{dx})^n(dx)^n dn=(dxd​dx)n=(dxd​)n(dx)n

这再一次强化了我们对这个记号合理性的认同,因为这就好像是分母的 ( d x ) n (dx)^n (dx)n被约掉了一样,为了强化这种直观感受,我们往往会去掉这些括号,直接写成:

d n = d n d x n d x n d^n=\frac{d^n}{dx^n}dx^n dn=dxndn​dxn

因此如果要求 f f f的 n n n阶微分,只要先求 n n n次导数,再乘上常数 d x dx dx的 n n n次幂就好了。也即:

d n f = d n d x n f d x n = f ( n ) d x n 或 d n f ( x 0 ) = f ( n ) ( x 0 ) d x n d^nf=\frac{d^n}{dx^n}f~dx^n=f^{(n)}dx^n~~~~~~~~或~~~~~~~~d^nf(x_0)=f^{(n)}(x_0)dx^n dnf=dxndn​fdxn=f(n)dxn或dnf(x0​)=f(n)(x0​)dxn

回顾一下微分的定义,即 f ( x 0 + Δ x ) = f ( x 0 ) + f ′ ( x 0 ) Δ x + o ( Δ x ) f(x_0+\Delta x)=f(x_0)+f'(x_0)\Delta x+o(\Delta x) f(x0​+Δx)=f(x0​)+f′(x0​)Δx+o(Δx),即我们通过局部线性化可以实现函数的变化量被表为自变量变化的线性函数,误差是 Δ x \Delta x Δx的高阶无穷小。线性函数也是一次多项式函数,我们自然会思考假设提高多项式的度数误差是否会进一步减小,那么,我们能否通过把函数值的变化表为自变量变化的二次多项式,继续把 o ( Δ x ) o(\Delta x) o(Δx)里的成分弄得更清楚,使得误差减小到 Δ x 2 \Delta x^2 Δx2的高阶无穷小呢?假设存在 B ∈ R B\in\R B∈R,使得 f ( x 0 + Δ x ) = f ( x 0 ) + f ′ ( x 0 ) Δ x + B Δ x 2 + o ( Δ x 2 ) f(x_0+\Delta x)=f(x_0)+f'(x_0)\Delta x+B\Delta x^2+o(\Delta x^2) f(x0​+Δx)=f(x0​)+f′(x0​)Δx+BΔx2+o(Δx2),我们来求这个 B B B。由于

lim ⁡ Δ x → 0 f ( x 0 + Δ x ) − f ( x 0 ) − f ′ ( x 0 ) Δ x − B Δ x 2 Δ x 2 = 0 \lim_{\Delta x\to0}\frac{f(x_0+\Delta x)-f(x_0)-f'(x_0)\Delta x-B\Delta x^2}{\Delta x^2}=0 Δx→0lim​Δx2f(x0​+Δx)−f(x0​)−f′(x0​)Δx−BΔx2​=0

我们有

B = lim ⁡ Δ x → 0 f ( x 0 + Δ x ) − f ( x 0 ) − f ′ ( x 0 ) Δ x Δ x 2 B=\lim_{\Delta x\to0}\frac{f(x_0+\Delta x)-f(x_0)-f'(x_0)\Delta x}{\Delta x^2} B=Δx→0lim​Δx2f(x0​+Δx)−f(x0​)−f′(x0​)Δx​

这是一个 0 0 \frac{0}{0} 00​型的极限,为了使这个极限存在,我们需要有性质更好的 f f f。具体来说,我们要求 f f f在 x 0 x_0 x0​处的二阶导数是存在的,因此我们也有了 f f f的一阶导函数 f ′ f' f′在 x 0 x_0 x0​的一个邻域 B ( x 0 , δ ) B(x_0,\delta) B(x0​,δ)存在,那么它满足了 L’Hospital \text{L'Hospital} L’Hospital法则的条件(这是一个技术性的公式也即一个求极限的方法,为了使我们探讨的主线更清楚我们将它放到后面),所以由 L’Hospital \text{L'Hospital} L’Hospital法则我们对分子分母同时(关于 Δ x \Delta x Δx)求导:

B = lim ⁡ Δ x → 0 f ′ ( x 0 + Δ x ) − f ′ ( x 0 ) 2 Δ x = f ′ ′ ( x 0 ) 2 B=\lim_{\Delta x\to0}\frac{f'(x_0+\Delta x)-f'(x_0)}{2\Delta x}\color{red}{=}\color{black}\frac{f''(x_0)}{2} B=Δx→0lim​2Δxf′(x0​+Δx)−f′(x0​)​=2f′′(x0​)​

红色的等号来源于导数的定义。这说明只要 f f f在 x 0 x_0 x0​有二阶导数,我们就可以把函数值的变化近似为自变量变化的二次多项式,并且误差在 o ( Δ x 2 ) o(\Delta x^2) o(Δx2),也就是:

f ( x 0 + Δ x ) = f ( x 0 ) + f ′ ( x 0 ) Δ x + f ′ ′ ( x 0 ) 2 Δ x 2 + o ( Δ x 2 ) f(x_0+\Delta x)=f(x_0)+f'(x_0)\Delta x+\frac{f''(x_0)}{2}\Delta x^2+o(\Delta x^2) f(x0​+Δx)=f(x0​)+f′(x0​)Δx+2f′′(x0​)​Δx2+o(Δx2)

延续这个思路,假设 f f f在 x 0 x_0 x0​上有三阶导数,那么有:

f ( x 0 + Δ x ) = f ( x 0 ) + f ′ ( x 0 ) Δ x + f ′ ′ ( x 0 ) 2 Δ x 2 + f ′ ′ ′ ( x 0 ) 6 Δ x 3 + o ( Δ x 3 ) f(x_0+\Delta x)=f(x_0)+f'(x_0)\Delta x+\frac{f''(x_0)}{2}\Delta x^2+\frac{f'''(x_0)}{6}\Delta x^3+o(\Delta x^3) f(x0​+Δx)=f(x0​)+f′(x0​)Δx+2f′′(x0​)​Δx2+6f′′′(x0​)​Δx3+o(Δx3)

一般地,假设 f f f在 x 0 x_0 x0​上的 n n n阶导数都存在,那么:

f ( x 0 + Δ x ) = ∑ k = 0 n f ( k ) ( x 0 ) k ! Δ x k + o ( Δ x n ) 或 f ( x 0 + Δ x ) − f ( x 0 ) = ∑ k = 1 n f ( k ) ( x 0 ) k ! Δ x k + o ( Δ x n ) f(x_0+\Delta x)=\sum_{k=0}^n\frac{f^{(k)}(x_0)}{k!}\Delta x^k+o(\Delta x^n)\\或~~~~~~~~f(x_0+\Delta x)-f(x_0)=\sum_{k=1}^n\frac{f^{(k)}(x_0)}{k!}\Delta x^k+o(\Delta x^n) f(x0​+Δx)=k=0∑n​k!f(k)(x0​)​Δxk+o(Δxn)或f(x0​+Δx)−f(x0​)=k=1∑n​k!f(k)(x0​)​Δxk+o(Δxn)

这就是 Taylor \text{Taylor} Taylor公式。根据我们之前的讨论, f ( k ) ( x 0 ) Δ x k = d k f ( x 0 ) f^{(k)}(x_0)\Delta x^k=d^kf(x_0) f(k)(x0​)Δxk=dkf(x0​),让我们用 Δ f ( x 0 ) \Delta f(x_0) Δf(x0​)表示 f ( x 0 + Δ x ) − f ( x 0 ) f(x_0+\Delta x)-f(x_0) f(x0​+Δx)−f(x0​)也即函数值的变化量,就有:

Δ f ( x 0 ) = ∑ k = 1 n d k f ( x 0 ) k ! + o ( Δ x n ) \Delta f(x_0)=\sum_{k=1}^n\frac{d^kf(x_0)}{k!}+o(\Delta x^n) Δf(x0​)=k=1∑n​k!dkf(x0​)​+o(Δxn)

这就是高阶微分的实际意义,它们可以按照一定的系数去近似拟合函数值的变化。特别地,假设 f f f在 x 0 x_0 x0​有任意阶导数,我们会自然地认为有

Δ f ( x 0 ) = ∑ k = 1 ∞ d k f ( x 0 ) k ! \Delta f(x_0)=\sum_{k=1}^\infty\frac{d^kf(x_0)}{k!} Δf(x0​)=k=1∑∞​k!dkf(x0​)​

成立,如果忽略掉这个式子选取的特定点 x 0 x_0 x0​和特定的函数 f f f,我们就得到了求变化量(相应于 Δ x \Delta x Δx)算符和微分算符(相应于 Δ x \Delta x Δx)的关系:

Δ = ∑ k = 1 ∞ d k k ! \Delta=\sum_{k=1}^\infty\frac{d^k}{k!} Δ=k=1∑∞​k!dk​

这就表示足够光滑的函数在某点的变化量可以表为它各阶微分(按照一定的系数)的和。

3. Taylor \text{Taylor} Taylor中值定理与 Lagrange \text{Lagrange} Lagrange余项

上面的 Taylor \text{Taylor} Taylor公式尽管震撼人心,但它只揭示了函数的变化量在选定自变量附近的性质(因为我们总是针对于某个 Δ x \Delta x Δx讨论的,而最终的误差也是 Δ x \Delta x Δx若干幂次的高阶无穷小,这就表示这个公式只有在 Δ x \Delta x Δx比较小的时候才有效)。对于 Taylor \text{Taylor} Taylor公式:

f ( x 0 + Δ x ) = ∑ k = 0 n f ( k ) ( x 0 ) k ! Δ x k + o ( Δ x n ) f(x_0+\Delta x)=\sum_{k=0}^n\frac{f^{(k)}(x_0)}{k!}\Delta x^k+o(\Delta x^n) f(x0​+Δx)=k=0∑n​k!f(k)(x0​)​Δxk+o(Δxn)

而言,如果我们能够估计 o ( Δ x n ) o(\Delta x^n) o(Δxn)的大小(找到它的界),我们就能通过这一点的性质反应整个函数的性质。假定我们有 Lagrange \text{Lagrange} Lagrange中值定理,即:

闭区间 [ a , b ] [a,b] [a,b]上的连续函数 f f f如果在开区间 ( a , b ) (a,b) (a,b)上处处可微,那么存在 c ∈ ( a , b ) c\in(a,b) c∈(a,b)使得

f ′ ( c ) = f ( b ) − f ( a ) b − a f'(c)=\frac{f(b)-f(a)}{b-a} f′(c)=b−af(b)−f(a)​

证明是平凡的,在此略去。现在我们据此证明 Cauchy \text{Cauchy} Cauchy中值定理,事实上这是 Lagrange \text{Lagrange} Lagrange中值定理换元后的结果。它是说:

闭区间 [ a , b ] [a,b] [a,b]上的连续函数 f , g f,g f,g如果在开区间 ( a , b ) (a,b) (a,b)上处处可微并且 g ′ g' g′恒不为零,那么存在 c ∈ ( a , b ) c\in(a,b) c∈(a,b)使得

f ′ ( c ) g ′ ( c ) = f ( b ) − f ( a ) g ( b ) − g ( a ) \frac{f'(c)}{g'(c)}=\frac{f(b)-f(a)}{g(b)-g(a)} g′(c)f′(c)​=g(b)−g(a)f(b)−f(a)​

我们来证明它。根据导函数的 Darboux \text{Darboux} Darboux定理, g ′ g' g′必须恒为正或者恒为负,不妨设 g g g恒为正,那么 g g g在 [ a , b ] [a,b] [a,b]上是严格递增的,因此存在反函数 g − 1 : [ g ( a ) , g ( b ) ] → [ a , b ] g^{-1}:[g(a),g(b)]\to[a,b] g−1:[g(a),g(b)]→[a,b]。现在我们对 f ∘ g − 1 f\circ g^{-1} f∘g−1在区间 [ g ( a ) , g ( b ) ] [g(a),g(b)] [g(a),g(b)]上应用 Langrange \text{Langrange} Langrange中值定理,那么存在 g ( c ) ∈ ( g ( a ) , g ( b ) ) g(c)\in(g(a),g(b)) g(c)∈(g(a),g(b))使得:

( f ∘ g − 1 ) ′ ( g ( c ) ) = ( f ∘ g − 1 ) ( g ( b ) ) − ( f ∘ g − 1 ) ( g ( a ) ) g ( b ) − g ( a ) (f\circ g^{-1})'(g(c))=\frac{(f\circ g^{-1})(g(b))-(f\circ g^{-1})(g(a))}{g(b)-g(a)} (f∘g−1)′(g(c))=g(b)−g(a)(f∘g−1)(g(b))−(f∘g−1)(g(a))​

根据复合函数求导法则和反函数求导法则就有

f ′ ( c ) g ′ ( c ) = f ( b ) − f ( a ) g ( b ) − g ( a ) \frac{f'(c)}{g'(c)}=\frac{f(b)-f(a)}{g(b)-g(a)} g′(c)f′(c)​=g(b)−g(a)f(b)−f(a)​

这就是要证的。

现在面对 n n n阶的 Taylor \text{Taylor} Taylor公式的表达式,我们想要给 o ( Δ x n ) o(\Delta x^n) o(Δxn)一个比较好的估计, Δ x \Delta x Δx的幂次如果要是 Δ x n \Delta x^n Δxn的高阶无穷小,那么我们至少需要 Δ x \Delta x Δx的 n + 1 n+1 n+1次方,假设

f ( x 0 + Δ x ) = ∑ k = 0 n f ( k ) ( x 0 ) k ! Δ x k + L ( Δ x ) Δ x n + 1 f(x_0+\Delta x)=\sum_{k=0}^n\frac{f^{(k)}(x_0)}{k!}\Delta x^k+L(\Delta x)\Delta x^{n+1} f(x0​+Δx)=k=0∑n​k!f(k)(x0​)​Δxk+L(Δx)Δxn+1

这里 L ( Δ x ) L(\Delta x) L(Δx)表示这是个由 Δ x \Delta x Δx决定的量(不一定唯一),所以

L ( Δ x ) = f ( x 0 + Δ x ) − ∑ k = 0 n f ( k ) ( x 0 ) k ! Δ x k Δ x n + 1 L(\Delta x)=\frac{f(x_0+\Delta x)-\sum_{k=0}^n\frac{f^{(k)}(x_0)}{k!}\Delta x^k}{\Delta x^{n+1}} L(Δx)=Δxn+1f(x0​+Δx)−∑k=0n​k!f(k)(x0​)​Δxk​

由于 f f f在 x 0 x_0 x0​的二阶导数是存在的,所以其一阶导数在一个邻域都存在,这就满足了 Cauchy \text{Cauchy} Cauchy中值定理的条件,所以存在 θ 1 ∈ ( 0 , 1 ) \theta_1\in(0,1) θ1​∈(0,1)使得

f ( x 0 + Δ x ) − ∑ k = 0 n f ( k ) ( x 0 ) k ! Δ x k Δ x n + 1 = f ′ ( x 0 + θ 1 Δ x ) − ∑ k = 0 n − 1 f ( k + 1 ) ( x 0 ) k ! ( θ 1 Δ x ) k ( n + 1 ) ( θ 1 Δ x ) n \frac{f(x_0+\Delta x)-\sum_{k=0}^n\frac{f^{(k)}(x_0)}{k!}\Delta x^k}{\Delta x^{n+1}}=\frac{f'(x_0+\theta_1\Delta x)-\sum_{k=0}^{n-1}\frac{f^{(k+1)}(x_0)}{k!}(\theta_1\Delta x)^k}{(n+1)(\theta_1\Delta x)^n} Δxn+1f(x0​+Δx)−∑k=0n​k!f(k)(x0​)​Δxk​=(n+1)(θ1​Δx)nf′(x0​+θ1​Δx)−∑k=0n−1​k!f(k+1)(x0​)​(θ1​Δx)k​

由于 f f f在 x 0 x_0 x0​存在三阶导数,那么其二阶导数在 x 0 x_0 x0​的一个邻域都存在,继续使用 Cauchy \text{Cauchy} Cauchy中值定理,存在 θ 2 ∈ ( 0 , 1 ) \theta_2\in(0,1) θ2​∈(0,1)使得

f ′ ( x 0 + θ 1 Δ x ) − ∑ k = 0 n − 1 f ( k + 1 ) ( x 0 ) k ! ( θ 1 Δ x ) k ( n + 1 ) ( θ 1 Δ x ) n = f ′ ′ ( x 0 + θ 2 Δ x ) − ∑ k = 0 n − 2 f ( k + 2 ) ( x 0 ) k ! ( θ 2 Δ x ) k ( n + 1 ) n ( θ 2 Δ x ) n − 1 \frac{f'(x_0+\theta_1\Delta x)-\sum_{k=0}^{n-1}\frac{f^{(k+1)}(x_0)}{k!}(\theta_1\Delta x)^k}{(n+1)(\theta_1\Delta x)^n}=\frac{f''(x_0+\theta_2\Delta x)-\sum_{k=0}^{n-2}\frac{f^{(k+2)}(x_0)}{k!}(\theta_2\Delta x)^k}{(n+1)n(\theta_2\Delta x)^{n-1}} (n+1)(θ1​Δx)nf′(x0​+θ1​Δx)−∑k=0n−1​k!f(k+1)(x0​)​(θ1​Δx)k​=(n+1)n(θ2​Δx)n−1f′′(x0​+θ2​Δx)−∑k=0n−2​k!f(k+2)(x0​)​(θ2​Δx)k​

上面的式子中 θ 2 \theta_2 θ2​其实应该写成 θ 1 ⋅ θ 2 \theta_1\cdot\theta_2 θ1​⋅θ2​,只不过 θ 1 ⋅ θ 2 ∈ ( 0 , 1 ) \theta_1\cdot\theta_2\in(0,1) θ1​⋅θ2​∈(0,1)的范围和 θ 2 \theta_2 θ2​是相同的,所以我们就用 θ 2 \theta_2 θ2​去替代它。我们继续这个过程,并且假定 f f f在 x 0 x_0 x0​的 n + 1 n+1 n+1阶导数都存在,那么我们的 Cauchy \text{Cauchy} Cauchy中值定理可以使用 n n n次得到:

L ( Δ x ) = f ( n ) ( x 0 + θ n Δ x ) − f ( n ) ( x 0 ) ( n + 1 ) ! ( θ n Δ x ) L(\Delta x)=\frac{f^{(n)}(x_0+\theta_n\Delta x)-f^{(n)}(x_0)}{(n+1)!(\theta_n\Delta x)} L(Δx)=(n+1)!(θn​Δx)f(n)(x0​+θn​Δx)−f(n)(x0​)​

为了进一步估计这个值,我们再次加强条件,假定 f f f在 x 0 x_0 x0​的一个邻域都具有 n + 1 n+1 n+1阶导数,这样这个式子也满足了 Lagrange \text{Lagrange} Lagrange中值定理的条件,所以存在 θ ∈ ( 0 , 1 ) \theta\in(0,1) θ∈(0,1)使得:

L ( Δ x ) = f ( n + 1 ) ( x 0 + θ Δ x ) ( n + 1 ) ! L(\Delta x)=\frac{f^{(n+1)}(x_0+\theta\Delta x)}{(n+1)!} L(Δx)=(n+1)!f(n+1)(x0​+θΔx)​

现在代入原来的表达式,我们就得到了 Taylor \text{Taylor} Taylor中值定理或者说 Taylor \text{Taylor} Taylor公式的 Lagrange \text{Lagrange} Lagrange余项形式:

f ( x 0 + Δ x ) = ∑ k = 0 n f ( k ) ( x 0 ) k ! Δ x k + f ( n + 1 ) ( x 0 + θ Δ x ) ( n + 1 ) ! Δ x n + 1 f(x_0+\Delta x)=\sum_{k=0}^n\frac{f^{(k)}(x_0)}{k!}\Delta x^k+\frac{f^{(n+1)}(x_0+\theta\Delta x)}{(n+1)!}\Delta x^{n+1} f(x0​+Δx)=k=0∑n​k!f(k)(x0​)​Δxk+(n+1)!f(n+1)(x0​+θΔx)​Δxn+1

因此只要 f ( n + 1 ) f^{(n+1)} f(n+1)在 x 0 x_0 x0​附近有界,我们就可以对 Taylor \text{Taylor} Taylor公式的余项进行估计,从而这个公式在 Δ x \Delta x Δx较大时也有了意义。

4. L’Hospital \text{L'Hospital} L’Hospital法则

这是一个技术性定理的补充,并且我们只对一种比较简单的情况证明,较复杂的情况都可以视为这个简单情况的推论。我们想证明,如果 f , g f,g f,g在 x 0 x_0 x0​的一个去心邻域内有定义,并且 lim ⁡ Δ x → 0 + f ( x 0 + Δ x ) = lim ⁡ Δ x → 0 + g ( x 0 + Δ x ) = 0 \lim_{\Delta x\to0^+}f(x_0+\Delta x)=\lim_{\Delta x\to 0^+}g(x_0+\Delta x)=0 limΔx→0+​f(x0​+Δx)=limΔx→0+​g(x0​+Δx)=0,另外 f ′ , g ′ f',g' f′,g′在某个 ( x 0 , x 0 + δ ) (x_0,x_0+\delta) (x0​,x0​+δ)上有定义,并且 lim ⁡ Δ x → 0 + f ′ ( x 0 + Δ x ) g ′ ( x 0 + Δ x ) \lim_{\Delta x\to0^+}\frac{f'(x_0+\Delta x)}{g'(x_0+\Delta x)} limΔx→0+​g′(x0​+Δx)f′(x0​+Δx)​存在,那么

lim ⁡ Δ x → 0 + f ( x 0 + Δ x ) g ( x 0 + Δ x ) = lim ⁡ Δ x → 0 + f ′ ( x 0 + Δ x ) g ′ ( x 0 + Δ x ) \lim_{\Delta x\to0^+}\frac{f(x_0+\Delta x)}{g(x_0+\Delta x)}=\lim_{\Delta x\to0^+}\frac{f'(x_0+\Delta x)}{g'(x_0+\Delta x)} Δx→0+lim​g(x0​+Δx)f(x0​+Δx)​=Δx→0+lim​g′(x0​+Δx)f′(x0​+Δx)​

证明的过程就是 Cauchy \text{Cauchy} Cauchy中值定理的应用。先补充定义 f ( x 0 ) = g ( x 0 ) = 0 f(x_0)=g(x_0)=0 f(x0​)=g(x0​)=0,那么 Cauchy \text{Cauchy} Cauchy中值定理保证存在 θ ∈ ( 0 , 1 ) \theta\in(0,1) θ∈(0,1)(可能与 Δ x \Delta x Δx有关),使得

f ( x 0 + Δ x ) − f ( x 0 ) g ( x 0 + Δ x ) − g ( x 0 ) = f ′ ( x 0 + θ Δ x ) g ′ ( x 0 + θ Δ x ) \frac{f(x_0+\Delta x)-f(x_0)}{g(x_0+\Delta x)-g(x_0)}=\frac{f'(x_0+\theta\Delta x)}{g'(x_0+\theta\Delta x)} g(x0​+Δx)−g(x0​)f(x0​+Δx)−f(x0​)​=g′(x0​+θΔx)f′(x0​+θΔx)​

两边同时取极限,左边就是要证的式子的左边,右边由于 Δ → 0 + \Delta\to0^+ Δ→0+时 θ Δ x → 0 + \theta\Delta x\to0^+ θΔx→0+,也等于要证的式子的右边,这就完成了证明。

如果觉得《导数与高阶导数》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。