如何逐行分析 Python 代码?
- 2025-02-27 09:06:00
- admin 原创
- 179
问题描述:
我一直在使用 cProfile 来分析我的代码,效果非常好。我还使用gprof2dot.py来可视化结果(使其更清晰一些)。
但是,cProfile(以及我迄今为止见过的大多数其他 Python 分析器)似乎只在函数调用级别进行分析。当某些函数从不同位置调用时,这会引起混淆 - 我不知道调用 #1 还是调用 #2 占用了大部分时间。当所讨论的函数深度为六级,从其他七个位置调用时,情况会变得更糟。
如何获得逐行分析的结果?
而不是这样:
function #12, total time: 2.0s
我希望看到这样的内容:
function #12 (called from somefile.py:102) 0.5s
function #12 (called from main.py:12) 1.5s
cProfile 确实显示了总时间中有多少“转移”到父级,但是当您拥有一堆层和相互连接的调用时,这种连接就会丢失。
理想情况下,我希望有一个 GUI 可以解析数据,然后向我显示源文件以及每行的总时间。像这样:
main.py:
a = 1 # 0.0s
result = func(a) # 0.4s
c = 1000 # 0.0s
result = func(c) # 5.0s
然后,我可以单击第二个“func(c)”调用来查看该调用中占用时间的内容,与“func(a)”调用分开。这有意义吗?
解决方案 1:
我相信这就是Robert Kern 的 line_profiler 的用途。来自链接:
File: pystone.py
Function: Proc2 at line 149
Total time: 0.606656 s
Line # Hits Time Per Hit % Time Line Contents
==============================================================
149 @profile
150 def Proc2(IntParIO):
151 50000 82003 1.6 13.5 IntLoc = IntParIO + 10
152 50000 63162 1.3 10.4 while 1:
153 50000 69065 1.4 11.4 if Char1Glob == 'A':
154 50000 66354 1.3 10.9 IntLoc = IntLoc - 1
155 50000 67263 1.3 11.1 IntParIO = IntLoc - IntGlob
156 50000 65494 1.3 10.8 EnumLoc = Ident1
157 50000 68001 1.4 11.2 if EnumLoc == Ident1:
158 50000 63739 1.3 10.5 break
159 50000 61575 1.2 10.1 return IntParIO
解决方案 2:
您也可以使用pprofile ( pypi )。如果您想要分析整个执行过程,则无需修改源代码。您还可以通过两种方式分析较大程序的子集:
当到达代码中的特定点时切换分析,例如:
import pprofile
profiler = pprofile.Profile()
with profiler:
some_code
# Process profile content: generate a cachegrind file and send it to user.
# You can also write the result to the console:
profiler.print_stats()
# Or to a file:
profiler.dump_stats("/tmp/profiler_stats.txt")
通过使用统计分析从调用堆栈异步切换分析(需要一种方法在考虑的应用程序中触发此代码,例如信号处理程序或可用的工作线程):
import pprofile
profiler = pprofile.StatisticalProfile()
statistical_profiler_thread = pprofile.StatisticalThread(
profiler=profiler,
)
with statistical_profiler_thread:
sleep(n)
# Likewise, process profile content
代码注释的输出格式与线路分析器非常相似:
$ pprofile --threads 0 demo/threads.py
Command line: ['demo/threads.py']
Total duration: 1.00573s
File: demo/threads.py
File duration: 1.00168s (99.60%)
Line #| Hits| Time| Time per hit| %|Source code
------+----------+-------------+-------------+-------+-----------
1| 2| 3.21865e-05| 1.60933e-05| 0.00%|import threading
2| 1| 5.96046e-06| 5.96046e-06| 0.00%|import time
3| 0| 0| 0| 0.00%|
4| 2| 1.5974e-05| 7.98702e-06| 0.00%|def func():
5| 1| 1.00111| 1.00111| 99.54%| time.sleep(1)
6| 0| 0| 0| 0.00%|
7| 2| 2.00272e-05| 1.00136e-05| 0.00%|def func2():
8| 1| 1.69277e-05| 1.69277e-05| 0.00%| pass
9| 0| 0| 0| 0.00%|
10| 1| 1.81198e-05| 1.81198e-05| 0.00%|t1 = threading.Thread(target=func)
(call)| 1| 0.000610828| 0.000610828| 0.06%|# /usr/lib/python2.7/threading.py:436 __init__
11| 1| 1.52588e-05| 1.52588e-05| 0.00%|t2 = threading.Thread(target=func)
(call)| 1| 0.000438929| 0.000438929| 0.04%|# /usr/lib/python2.7/threading.py:436 __init__
12| 1| 4.79221e-05| 4.79221e-05| 0.00%|t1.start()
(call)| 1| 0.000843048| 0.000843048| 0.08%|# /usr/lib/python2.7/threading.py:485 start
13| 1| 6.48499e-05| 6.48499e-05| 0.01%|t2.start()
(call)| 1| 0.00115609| 0.00115609| 0.11%|# /usr/lib/python2.7/threading.py:485 start
14| 1| 0.000205994| 0.000205994| 0.02%|(func(), func2())
(call)| 1| 1.00112| 1.00112| 99.54%|# demo/threads.py:4 func
(call)| 1| 3.09944e-05| 3.09944e-05| 0.00%|# demo/threads.py:7 func2
15| 1| 7.62939e-05| 7.62939e-05| 0.01%|t1.join()
(call)| 1| 0.000423908| 0.000423908| 0.04%|# /usr/lib/python2.7/threading.py:653 join
16| 1| 5.26905e-05| 5.26905e-05| 0.01%|t2.join()
(call)| 1| 0.000320196| 0.000320196| 0.03%|# /usr/lib/python2.7/threading.py:653 join
请注意,由于 pprofile 不依赖于代码修改,它可以分析顶级模块语句,从而允许分析程序启动时间(导入模块、初始化全局变量需要多长时间……)。
它可以生成 cachegrind 格式的输出,因此您可以使用kcachegrind轻松浏览大量结果。
披露:我是 pprofile 的作者。
解决方案 3:
只是为了改进@Joe Kington 的上述答案。
对于Python 3.x,使用line_profiler:
安装:
pip install line_profiler
用法:
假设您有一个程序main.py
,其中有函数,fun_a()
并且fun_b()
您想要根据时间进行分析;您需要@profile
在函数定义之前使用装饰器。例如,
from line_profiler import profile
@profile
def fun_a():
#do something
@profile
def fun_b():
#do something more
if __name__ == '__main__':
fun_a()
fun_b()
可以通过执行 shell 命令来分析该程序:
$ kernprof -l -v main.py
可以使用以下方式获取参数$ kernprof -h
Usage: kernprof [-s setupfile] [-o output_file_path] scriptfile [arg] ...
Options:
--version show program's version number and exit
-h, --help show this help message and exit
-l, --line-by-line Use the line-by-line profiler from the line_profiler
module instead of Profile. Implies --builtin.
-b, --builtin Put 'profile' in the builtins. Use 'profile.enable()'
and 'profile.disable()' in your code to turn it on and
off, or '@profile' to decorate a single function, or
'with profile:' to profile a single section of code.
-o OUTFILE, --outfile=OUTFILE
Save stats to <outfile>
-s SETUP, --setup=SETUP
Code to execute before the code to profile
-v, --view View the results of the profile in addition to saving
it.
结果将会打印在控制台上:
Total time: 17.6699 s
File: main.py
Function: fun_a at line 5
Line # Hits Time Per Hit % Time Line Contents
==============================================================
5 @profile
6 def fun_a():
...
编辑:可以使用TAMPPA包解析剖析器的结果。使用它,我们可以逐行获得所需的图,如下所示
解决方案 4:
您可以借助line_profiler包来实现这一点
1.首先安装包:
pip install line_profiler
2.使用 magic 命令将包加载到你的 python/notebook 环境中
%load_ext line_profiler
**3.如果您想要分析某个函数的代码,请
执行以下操作:**
%lprun -f demo_func demo_func(arg1, arg2)
如果你按照以下步骤操作,你将获得一个格式良好、包含所有详细信息的输出:)
Line # Hits Time Per Hit % Time Line Contents
1 def demo_func(a,b):
2 1 248.0 248.0 64.8 print(a+b)
3 1 40.0 40.0 10.4 print(a)
4 1 94.0 94.0 24.5 print(a*b)
5 1 1.0 1.0 0.3 return a/b
解决方案 5:
PyVmMonitor 有一个实时视图可以帮助您(您可以连接到正在运行的程序并从中获取统计数据)。
扫码咨询,免费领取项目管理大礼包!