大学时学过高等数学,然而实际上“微积分”更贴近这门课的本质。史蒂夫·斯托加茨的这本《微积分的力量》是面向大众的科普读物,写得通俗易懂,而且十分有趣,从微积分的关键工具(也即“无穷”)入手,展示人类如何通过驾驭无穷去解开自然之谜,站在多代”巨人的肩膀上“创造出微积分,并将其用于理解世界和改进生活。
概述
物理学家理查德·费曼(传记《发现的乐趣》)曾在一个采访中对没有学过微积分的记者说:“你最好学学微积分,它是上帝的语言。”这句话的含义是,宇宙是高度数学化的,宇宙所遵循的自然律总是能用微积分的语言和微分方程的形式表达出来。这类方程能描述事物在这一刻和在下一刻之间的差异(时间的连续),或者事物在这一点和在与该点无限接近的下一个点之间的差异(空间的连续)。宇宙中所有无生命的东西都遵循微分方程的规则,因此微积分向人类揭示了宇宙的奥秘,是“上帝之书”的语言。
值得注意的是,将微积分类比成语言只是展示了其对自然规律的强大表现力,并没有反映其逻辑严密性。微积分是一个强大的推理系统,具有扎实的逻辑根基,对微分方程的变换过程实际上是在构建逻辑推理的长链。而这条推理链就像真理制造机,可以利用现实世界的一个真理生成另外一个真理,从而让我们可以做出未卜先知的精准预测。麦克斯韦方程组就是以这种方式实现了对电磁行波的预测。
微积分的目的是让复杂的难题简单化,之所以微积分教程都特别厚重、高数课很难,那是因为它要解决的问题本身很复杂。微积分对于复杂问题的解决方法是将其分解成多个简单的部分,其中最为关键的一点是,这种分而治之的策略被发挥到了极致,也即无穷的程度。具体而言,复杂问题首先被切分成无穷多个彼此连续的局部子问题并分别求解,这个切分过程会涉及无限精细的减法运算,用于量化各部分之间的差异,这个部分叫微分学。然后,被切分量化的无穷多个局部需要重组还原,这个重组过程会涉及无限的加法运算,将各个部分整合成原来的整体,这个部分叫积分学。
从微分过程的分解策略可以发现,微积分的假设是所研究的问题或事物是连续的,这是一种假设,也是一种有用的虚构,因为事物本身很可能并不是连续的(尤其是深入到微观层面,如原子),但是忽略这种不连续性不会对问题的解决产生大的影响。因此,微积分是对连续实体的建模。
无穷原则
离散和连续的区别就在于后者无法进行有限、可数的分割,因此对连续体的建模离不开无穷,所以说无穷是离散和连续的桥梁,贯穿微积分始终的一个重要原则就是无穷原则:
“为了探究任何一个连续的形状、物体、运动、过程或现象,把它重新想象成由无穷多个简单部分组成的事物,分析这些部分,然后把结果加在一起,就能理解最初的那个整体。”
比如求解圆的周长,可以在圆周上画均匀分布的点,将圆周等分成若干部分,依次连接所有点就可以得到正多边形,画的点越多,正多边形的周长也越接近圆周,极限情况下就得到圆。无穷成为正多边形与圆圈之间的桥梁。

再比如求解圆的面积,可以将圆均匀分割成若干等弧度的扇形,将这些扇形重新拼接,分割的扇形数量越多,重新拼接后形成的图形越接近矩形,极限情况下就得到矩形,此时很容易求得圆的面积。无穷成为矩形和圆面之间的桥梁。

微积分的发展主要与三个谜题有关,分别是曲线之谜、运动之谜和变化之谜。曲线、运动、变化,这三个名词看起来与生活没有什么关系,最初的研究也纯粹出于好奇心,然而这些谜题的解决方案对人类文明进程和日常生活都产生了深远影响。
曲线之谜
这里的曲线是泛指,包括任何形式的曲线、曲面和曲面体,比如圆形、球面、球体等。不同于三角形、矩形、正方体这些“规矩”的几何形体,曲线没有平直部件(如直线、平面、直观的角度),其长度、面积或体积不容易计算。
早期几何学家的一个精巧构思为这个棘手问题带来启发,可以假设曲线是由平直部件构成的,比如圆形可以视作无穷多个局部线段组成、圆面可以视作无穷多个小三角形组成(如上举例)、球体也可以视作无穷多个小立方体组成。这种假设的关键问题在于平直部件需要足够小,数量也就相应地无穷大,比如曲线的局部无穷小才接近于平直的线段。
阿基米德通过相同规则逐层分割三角形来求解抛物线弓形面积,具体而言,将与抛物线相交的直线外推得到切点,这个切点与相交线段构成内接三角形,新形成的两条边又可以根据同样的规则生成新的三角形,随着三角形数量越多,三角形的面积之和越接近抛物线弓形的面积。阿基米德运用几何知识为不同层级间的三角形建立联系,即新构建三角形的面积(如图深色部分)都是上一层级三角形面积的1/8。

这样就建立了一个求解抛物线弓形面积的无穷级数,S=1+1/4+1/16+1/64… => 4S=4+1+1/4+1/16+1/64+…=4+S => S=4/3,即弓形面积是原始三角形面积的4/3。
运动之谜
早期科学家对天体运动规律的好奇驱使他们从简单物体的运动中找到普适性的规律,比如吊钟摆动、小球滚下斜面(伽利略斜面实验)。运动之谜的难点在于速度的持续变化,匀速运动的描述和计算都很简单,因为距离就是速度和时间的乘积,但是对于变速运动,问题就变得不那么简单了。速度每时每刻都在变化,要如何计算走过的距离?这一次,又一个精妙的构思拨开了运动之谜的迷雾,那就是我们可以假设变速运动是由无穷多个无限短暂的匀速运动构成的。
抓住主要矛盾
亚里士多德认为重的物体下落速度比轻的物体更快,并且速度与其重量成正比,他猜测重物之所以会下落是为了寻找自身在宇宙中心的天然位置。现在我们知道这个落体定律是错误的,伽利略通过实验证量化物体的下落过程。
由于重物下落很快,伽利略通过控制光滑斜面的斜率减慢小球的下降速度,发现一个物体从静止开始下落,在相等的时间间隔内,依次经过的距离之比与从1开始的奇数之比相同,即1、3、5、7…,因此在前t个时间间隔内下落的总距离分别与1、4、9、16…成正比,由此揭示下落距离与时间间隔的平方成正比。此外,伽利略还对抛体运动有研究,他将抛体速度进行正交分解,垂直方向为落体运动,水平方向则为匀速运动,由此得出抛体运动轨迹为抛物线(用斜度小于圆椎体的平面切割圆锥体就得到抛物线)。
回看亚里士多德和伽利略研究思路的差异,前者过于关注噪声(空气阻力)的影响而不够重视信号(重力、引力),因此亚里士多德的落体定律对于表面积大、密度小的物体如羽毛是适用的;而伽利略忽略这些不重要的因素,尽可能减少噪声的影响(如将斜面打造得很光滑),实现保留信号、清除噪声的理想条件,得出了正确的落体定律,即物体的下落速度是一个随时间变化的连续量,从初始静止逐渐加速,并且下落距离与时间的平方成正比。
作者提到,从中获得的一个教训是,在建立数学模型时,我们总要对强调什么和忽视什么做出选择。抽象的艺术在于,知道什么是必不可少的,什么是细枝末节的;知道什么是信号,什么是噪声;知道什么是趋势,什么是波动。
天体运动规律
伽利略研究的是地球物体的运动,开普勒则研究天体运动,基于天体运行的观测数据,他发现行星运动的三个经验规律,分别是:
- 开普勒第一定律:所有行星都在椭圆轨道上运行。
- (椭圆的定义与圆类似,圆上所有点到圆心距离相等,而椭圆定义是其上所有点到两个焦点的距离之和等于定长。)

- 开普勒第二定律:当行星沿轨道运行时,从这颗行星到太阳的假想连线在相等的时间内扫过的面积相等。
- 这意味着行星并不是匀速运动的,而是离太阳越近运行速度越快,从而才能实现相等时间矢径扫过的面积相等。
- 开普勒第三定律:行星公转周期的平方与该行星到太阳的平均距离的立方成正比,即 T2/ a3 为恒定值。
- 要点:行星距离太阳越远,运行速度越慢,公转周期越长。
天体运行规律可以用几何和代数来描述,这一点让痴迷于几何学的开普勒兴奋不已。
代数联姻几何
将代数从实际应用中剥离出来,作为一种符号系统加以研究,发生于文艺复兴时期的欧洲。通过几何方法分割图形并对分割后的无穷多个局部图形求和来解决微分和积分问题,这个过程需要极大的想象力和创造力,并且比较麻烦。法国数学家费马和笛卡尔将代数和几何联系起来,开创了解析几何这个数学学科,其中心舞台是xy平面,也被称为笛卡尔坐标系(虽然这是费马最早提出的……)。
在xy平面上,数值被表示成数轴(x和y轴)上的点,数值得以以几何图形的方式呈现。费马和笛卡尔都发现,任何一个线性方程(x和y以一次幂形式出现的方差)都可以表示为xy平面上的一条直线,这启发我们,非线性方程可能对应着曲线。代数开始占据主导位置,每个含有x和y的方程都潜在描绘出一条曲线,这把需要想象力来启动的几何变成了由代数引领的探索过程。代数给了几何学一个体系,把几何学需要的创造力转变为韧性,把需要洞察力的难题转化为耗时但直接的计算。
用代数描述几何的这部分作者举了两个很有意思的案例,分别是正弦波与圆周运动、光的折射与最小作用量原理,这都是中学数学的内容,但是之前没有这样深刻地认识这些规律。
正弦波是对圆周运动的刻画,假设一个点以恒定速度沿着圆周运动,这个点上下起伏的位置(纵坐标)视作时间的函数,此时就能绘制出一条正弦曲线。圆周运动是典型的周期运动,因此正弦波常用于对周期性活动的建模。正弦波可以用4个参数刻画,分别是周期、平均数、振幅和相位。通过优化找到合适的参数,可以用正弦波捕获有规律数据中的模式,从而实现数据压缩。

光从光密介质到光疏介质传播时会发生折射,并且入射角a和折射角b遵循折射定律,sina/sinb值恒定,与两侧介质疏密比有关。这是斯涅尔发现的物理学定律,但是费马给出了数学上的解释和证明。
费马指出,光的传播遵循的原则很简单,那就是最短时间原理,正如在同一介质中(如空气)沿直线传播一样,当光的传播跨越介质时,其传播原则并未改变,仍然是最短时间。这本质上是一个优化问题,即给定光线在两种介质中的传播速度,找到最快从起点到终点所走的路径。费马经过复杂的计算和微积分推导,证明了折射定律。最短时间原理后来被广义化为最小作用量原理,意思是大自然会以最经济的方式运行,这也许就是“存在即合理”的数学表达吧。
变化之谜
函数建模变化
函数量化了一个事物与另一个事物变化之间的关系,函数为运动和变化建模提供了必要的工具。常见的函数类型包括幂函数、指数函数、对数函数等,不同函数类型就像工具箱中的不同工具一样,为建模不同类型的变化现象提供手段。指数函数可以用于为越来越快的增长过程建模,而幂函数用于为不太剧烈的增长方式建模。指数函数和对数函数互为反函数,对数函数能够撤销指数函数的作用。
以自然对数e为底数的指数函数即ex 的增长速率为函数本身,即这个函数的导数自己,那么自然对数e来自于哪里呢?作者举了一个银行存款利息最大化的例子来形象解释e的来源。假设将100元存入银行,年利率为100%,你可以选择将100元拆分成n次存取,以此来实现利滚利的效果,但是相应的年利率也需要进行1/n折扣,这种情况下能获得本息之和最多是多少?也就是e=(1+1/n)n (n->+∞) 这个式子的极限值,即2.71828…。因此,e是一个复杂的极限,无穷是e的固有属性,就像π是圆的固有属性一样。
导数刻画变化
函数是对事物之间的变化关系进行建模,而导数为变化率建模,积分为则是变化的累积量建模。其中导数刻画的是变化的方向和快慢,及其随时间的变化,因此导数并不是数值,而是函数。

导数的符号是dy/dx,其中dy和dx这两个变化量都是局部的、无穷小的。从几何上来看,比较直观,函数在某一点的导数就是该点切线的斜率。
统一微分积分
微积分基本定理和曲面积分法(幂级数展开)
微积分有如下三大核心问题:
正向问题:已知一条曲线,求它各处的斜率。(求导)
反向问题:已知一条曲线各处的斜率,求这条曲线。(求原函数)
面积问题:已知一条曲线,求曲线下方的面积。(积分)
对于线性函数而言,其各点导数一样;而对于非线性函数,其各点导数变化。正向问题很简单,反向问题很难,但是二者联系紧密,解决了反向问题就解决了积分问题,这一点由微积分基本定理来说明。
艾萨克·牛顿用运动来理解面积,发现了基本定理。比如运动距离是速度在连续时间上的累积(积分),因此因此对速度函数(速度随时间的变化)求积分得到距离,而对距离求微分(或称导数)则得到速度的瞬时变化。速度曲线下方的面积就是运动距离,这种面积随着速度和时间流动的方法被牛顿称为“流数术”。

微积分基本定理提供了面积和变化率之间的关系,但是面积本身的计算还需要推导,如何把分解开的无穷多个局部整合起来,从而实现曲线下面积的计算,曲线求积问题这个微积分的圣杯也是牛顿解决的。
根据基本定理,如果想要求解一条曲线y(x)的积分(下方的面积),需要知道其原函数A(x),然后计算A(x)在起点和终点之间的函数取值差值即可。问题在于,对于任意曲线,该怎么求解其原函数?即如何解决反向问题,一旦反向问题得到妥善解决,积分问题也迎刃而解。
首先可以列出几百个原函数及其关联曲线的配对[A(x), y(x)]表格,然后当面对具体的曲线及其积分问题时就从这个表格里去寻找有关的原函数。
接下来,牛顿把任何曲线都表示成无穷多条简单曲线之和(x的不同次方组合,x, x2, x3, …),而简单曲线的原函数很容易在上面的表格中找到,由此就可以系统求出曲线的积分,这种方法叫做幂级数法。
除了牛顿,莱布尼茨也从另一种路径发现了微积分基本定理,莱布尼茨的方法是我们在高等数学课程上接触的,其优雅的符号系统(积分号)也是目前普及的。莱布尼茨的方法核心是微分dx,考虑无穷小量的量级,关注相对大的无穷小量(δx),而忽视特别小的无穷小量。

把曲线下方的面积分成无穷多个细长的条形(近似矩形),因此x变化一个无穷小量dx面积A(x) 也会相应变化dA,dA和dx的比值即为将A对x做微分,即得到微积分基本定理。
莱布尼茨发现微分和基本定理与无穷级数的伸缩技巧有关,他的老师惠更斯给他提出了一个引导他发现基本定理的无穷级数求和问题,这也是高中数学频繁接触的,这个无穷级数的特殊点在于可以改写成连续差,从而产生大规模抵消的效果,具有这种性质的和被称为“伸缩和”。

莱布尼茨通过伸缩技巧解决了这个无穷级数的问题,进而思考能否在其他问题上应用这种伸缩技巧,这让他想起了积分问题。

微积分的力量
微积分的发明意义重大,让人们意识到自然和宇宙的可理解性和可预测性(牛顿:“自然拥有数学内核,自然现象可以从引力和运动定律等经验性公理通过逻辑推导得出。“),牛顿使用微积分作为演绎工具,证明了开普勒的三大经验定律的逻辑正确性。
微积分也为很多现象提供了强有力的建模工具,比如艾滋病患者血液中HIV病毒浓度变化,从而指导干预手段。也是多种科技发明或发现的基础,如微波炉、CT成像。
这本书让我对微积分的基本原理有了比大学时期透彻的理解,除了基本原理、面积求积法以及微积分发展历史以外,主要收获还有如下几点:
1)复杂问题的解决思路:分而治之,把复杂问题分解成局部的、微小的子问题,逐个解决,然后汇总,必要的情况下分解甚至可以发挥到无穷的地步(这正是微积分的思路)。分解复杂问题这个思路在LLM提示词工程的思维链(CoT)方法以及近期发布的o1模型推理性能得到极大改善上也得到再一次验证。
2)对自然的敬畏:自然的可解释性和可预测性让人不由地感到敬畏、神奇和好奇,正如作者在本书结语处提到的:“我是在一个晴朗的冬夜写下这篇结语的。走出家门抬头仰望,遥远的星星和漆黑的太空让我不由地心生敬畏。”
3)一些以前从未耳闻的名人轶事:
费马本职工作并不是数学,而是律师,他对数学的研究纯粹出于兴趣,所以也被人称为最牛的业余数学家,出于嫉妒(恼火费马的数学研究能力远强于他),笛卡尔多次诋毁和贬损费马,比如所谓的笛卡尔坐标系其实费马早很多年就提出了。
牛顿出生就没有父亲,3岁被母亲抛弃,毕生未婚,大学期间几乎没有朋友,十分孤僻。
4)对李约瑟之谜的一点思考:
科学不是宗教和信仰,而是思想自由和理解。一旦用信仰框定思想,一切就停滞不前了。儒家思想被称作儒教,是有其合理性的。教条会让思想变得死气沉沉。当然也还有科举制、官僚制等很多原因,不过产生的效果类似,都是把人的思想局限在相对小的范围内,而且在社会层面上实现同质化(大家的功利所求一致)和易管理,这样就极少可能出现科学发现和技术突破了。