cProfile是Python内置的函数级性能分析工具,无需安装、不改逻辑,通过统计函数调用次数与CPU时间定位瓶颈;支持cProfile.run()快速启动和pstats交互式分析,但无法捕获I/O、内存、多线程阻塞等非CPU耗时。

cProfile 是 Python 自带的函数级性能剖析入口,不用装包、不改逻辑、能直接告诉你哪几个函数吃掉了最多 CPU 时间——这是定位慢代码最可靠的第一步。
用 cProfile.run() 快速抓取热点函数
在脚本末尾或主入口处加一行就能跑起来,比如你的主函数叫 main:
import cProfile
cProfile.run('main()', 'profile_stats')
这会把统计结果写进当前目录的 profile_stats 文件。注意:main() 必须是可被字符串执行的(不能带参数、不能是 lambda),否则会报 NameError 或 SyntaxError。
- 如果主逻辑在 if __name__ == '__main__': 下,确保它已定义且可调用
- 别用
cProfile.run('main(123)')这种带参数的写法,会触发语法错误 - 生产环境采样建议控制在 10–30 秒内,避免日志膨胀或阻塞
用 pstats 解析 profile_stats 并排序看瓶颈
生成文件后,用标准库 pstats 交互式分析:
python -m pstats profile_stats
进入交互后输入命令查看关键指标:
sort cumulative:按累计耗时(含子调用)排序,找“总耗时最长”的函数链sort tottime:按函数自身耗时(不含子调用)排序,找“最重的单点”——这才是优化优先级最高的目标stats 10:只显示前 10 行,避免刷屏
重点关注 tottime 高但调用次数少的函数(比如一次就花了 2 秒),也留意 ncalls 极高但单次不慢的函数(比如循环里调了 10 万次 len())。
cProfile 的盲区和必须补的手段
cProfile 只统计 CPU 时间,对以下情况完全无感:
- I/O 等待(磁盘读、网络响应、数据库查询)——这些时间算在系统调用里,
cProfile不计入任何函数的tottime - 内存暴涨引发的 GC 停顿或 swap —— CPU 使用率可能很低,但程序卡死
- 多线程中被 GIL 阻塞的线程——
cProfile默认只分析主线程
所以一旦发现 cProfile 报告里没明显热点,但程序就是慢,就得立刻切到 strace(看系统调用阻塞)、tracemalloc(查内存分配源头)或 py-spy top --pid XXX(观察真实运行栈)。
为什么别依赖 IDE 内置的 profiler
PyCharm / VS Code 的图形化 profiler 本质也是包装 cProfile 或 line_profiler,但它们常默认开启“采样过滤”,自动跳过内置函数(如 list.append、json.loads),导致你看到的 tottime 被严重低估。而真实瓶颈往往藏在高频调用的内置函数里——比如循环里反复 json.loads() 却没被统计进去。
直接用命令行 cProfile + pstats,才能拿到未经修饰的原始数据。那些看似“不该算进你代码”的调用,恰恰是优化时最先该替换掉的部分。