欢迎访问我的网站,希望内容对您有用,感兴趣的可以加入免费知识星球。

numba加速python

Python基础 迷途小书童 3年前 (2021-02-08) 2199次浏览 0个评论

软硬件环境

  • windows 10 64bit
  • python 3.8
  • numba 0.52.0

前言

Python 是一门应用非常广泛的高级语言,但是,长久以来,Python 的运行速度一直被人诟病,相比 c/c++javac#javascript 等一众高级编程语言,完全没有优势。

那么真的没有办法提升 Python 程序的运行速度吗?相信看完本文,你应该会有答案。

示例

这里以找出1000000以内的质数为例,分别计算下需要花费多长的时间?

首先来回顾下什么是质数?

质数(Prime number),又称素数,指在大于1的自然数中,除了1和该数本身外,无法被其他自然数整除(也可定义为只有1与该数本身两个因数)。举个例子,比如说数字7,从2开始一直到6,都不能被它整除,只有1和它本身7才能被7整除,所以7就是一个质数。

下面来看看 python 的代码实现

import math
import time

def is_prime(num):
    if num == 2:
        return True

    if num <= 1 or not num % 2:
        return False

    # 从3开始,到int(根号num)+1,步长是2,如3,5,7 ...
    for i in range(3, int(math.sqrt(num)) + 1, 2):
        if not num % i:
            return False

    return True

def run_program(N):
    for i in range(N):
        is_prime(i)

if __name__ == '__main__':
    N = 1000000
    start = time.time()
    run_program(N)
    end = time.time()
    print(end - start)

执行代码,可以看到在我的老旧 i5 机器上总共花费了5秒多

python_prime

改进

大家都知道解释型语言,解释器不产生目标机器代码,而是产生中间代码,解释器通常会导致执行效率较低。

因此,问题就变成了,能不能将 python 代码翻译成机器码?那执行效率肯定就会大大提升了

numba 就是这么一款工具,它是 python 的即时编译器(just-in-time compiler),它使用 LLVMpython 代码翻译成机器码,特别是在使用 numpy 数组以及循环操作上,效果最佳。

numba 的使用比较简单,我们不需要更换 python 的解释器,只需要将 numba 的装饰器写在 python 方法上,当这个带有 numba 装饰器的方法被调用时,就会被 just-in-time 即时编译为机器代码,然后执行。

使用 numba 之前,我们需要安装这个库

pip install numba
或者
conda install numba

下面来看看 numba 版本的质数问题

import math
import time
from numba import njit

@njit(fastmath=True, cache=True)
def is_prime(num):
    if num == 2:
        return True
    if num <= 1 or not num % 2:
        return False

    for i in range(3, int(math.sqrt(num)) + 1, 2):
        if not num % i:
            return False
    return True

@njit(fastmath=True, cache=True)
def run_program(N):
    for i in range(N):
        is_prime(i)

if __name__ == '__main__':
    N = 10000000
    start = time.time()
    run_program(N)
    end = time.time()
    print(end - start)

执行上述代码,可以看到,速度提升了4倍左右,不到1秒,效果还是非常明显

python_numba_prime

最后,作为横向比较,我们使用 c++ 语言,也写一个类似的程序

#include <iostream>
#include <cmath>
#include <time.h>

using namespace std;

bool isPrime(int num)
{
    if (num == 2) 
        return true;
    if (num <= 1 || num % 2 == 0) 
        return false;
    double sqrt_num = sqrt(double(num));
    for (int i = 3; i <= sqrt_num; i += 2) {
        if (num % i == 0) 
            return false;
    }
    return true;
}

int main()
{
    int N = 1000000;
    clock_t start, end;
    start = clock();
    for (int i=0; i < N; i++) 
        isPrime(i);
    end = clock();
    cout << (end - start) / ((double)CLOCKS_PER_SEC);
    return 0;
}

编译后执行,可以看到,只花了0.4秒

c++_prime

小结

从上面的对比示例中可以看到,使用了 just-in-time compiler 后(numbapypy 都是类似的实现),代码的执行效率已经直逼 C++等编译型语言了。

参考资料

喜欢 (3)

您必须 登录 才能发表评论!

Ads Blocker Image Powered by Code Help Pro

Ads Blocker Detected!!!

请关闭 Adblock 等类似浏览器插件,然后刷新页面访问,感谢您的支持!

We have detected that you are using extensions to block ads. Please support us by disabling these ads blocker.