对python中良好的递归性能感到惊讶


问题内容

我写了这个相当差的Python函数来进行素因分解:

import math

def factor(n):
    for i in range(2, int(math.sqrt(n)+1)):
        if not n % i:
            return [i] + factor(n//i)
    return [n]

并且它按预期方式工作,现在我对使用迭代方法时性能是否更好感兴趣:

def factor_it(n):
    r = []
    i = 2
    while i < int(math.sqrt(n)+1):
        while not n % i:
            r.append(i)
            n //= i
        i +=1
    if n > 1:
        r.append(n)
    return r

但是我观察到的(虽然函数给出了相同的结果)是迭代函数需要更长的时间才能运行。至少在这样做时,我有种感觉:

number = 31123478114123
print(factor(number))
print(factor_it(number))

所以我测量:

setup = '''
import math

def factor(n):
    for i in range(2, int(math.sqrt(n)+1)):
        if not n % i:
            return [i] + factor(n//i)
    return [n]

def factor_it(n):
    r = []
    i = 2
    while i < int(math.sqrt(n)+1):
        while not n % i:
            r.append(i)
            n //= i
        i +=1
    if n > 1:
        r.append(n)
    return r
'''

import timeit

exec(setup)

number = 66666667*952381*290201
print(factor(number))
print(factor_it(number))

print(timeit.Timer('factor('+str(number)+')',setup=setup).repeat(1,1))
print(timeit.Timer('factor_it('+str(number)+')',setup=setup).repeat(1,1))

这就是我得到的:

[290201, 952381, 66666667]
[290201, 952381, 66666667]
[0.19888348945642065]
[0.7451271022307537]

为什么在这种情况下递归方法比迭代方法快?

我使用WinPython-64bit-3.4.4.2(Python 3.4.4 64位)。


问题答案:

这是因为您sqrt每次都要重新计算。此修改的运行速度与递归版本一样快:

def factor_it2(n):
    r = []
    i = 2
    lim = int(math.sqrt(n)+1)
    while i < lim:
        while not n % i:
            r.append(i)
            n //= i
        lim = int(math.sqrt(n)+1)
        i += 1
    if n > 1:
        r.append(n)
    return r

timeit 给我这些时间:

factor      0.13133816363922143
factor_it   0.5705408816539869
factor_it2  0.14267319543853973

我认为剩下的微小差异是由于for … in range(…)比等效while循环更快,因为该for循环可以使用生成器,而不必执行大量比较。