首页 / PYTHON / 在Python中运行C扩展比普通C更快

在Python中运行C扩展比普通C更快

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了在Python中运行C扩展比普通C更快，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3937字，纯文字阅读大概需要6分钟。

内容图文

我在C中实现了一个Python扩展,发现在Python中执行C函数要比从C main执行C代码快2倍.

但为什么这会更快？我希望普通的C在从Python调用时与从C调用时的性能完全相同.

这是我的实验：

>普通C计算代码(简单3用于矩阵 – 矩阵乘法)
> Plain C main函数调用mmult()函数
> Python扩展包装器来调用mmult()函数
>所有时间都完全在C代码中发生

这是我的结果：

纯C – 85us

Python扩展 – 36us

继承我的代码：

–mmult.cpp ———-

#include "mmult.h"

void mmult(int32_t a[1024],int32_t b[1024],int32_t c[1024]) {

  struct timeval t1, t2;
  gettimeofday(&t1, NULL);

  for(int i=0; i<32; i=i+1) {
    for(int j=0; j<32; j=j+1) {
        int32_t result=0;
         for(int k=0; k<32; k=k+1) {
           result+=a[i*32+k]*b[k*32+j];
         }
         c[i*32+j] = result;
      }
  }

  gettimeofday(&t2, NULL);

  double elapsedTime = (t2.tv_usec - t1.tv_usec) + (t2.tv_sec - t1.tv_sec)*1000000;
  printf("elapsed time: %fus\n",elapsedTime);

}

–mmult.h ——-

#include <stdint.h>

void mmult(int32_t a[1024],int32_t b[1024],int32_t c[1024]);

–main.cpp ——

#include <stdio.h>
#include <stdlib.h>
#include <sys/time.h>
#include "mmult.h"

int main() {
  int* a = (int*)malloc(sizeof(int)*1024);
  int* b = (int*)malloc(sizeof(int)*1024);
  int* c = (int*)malloc(sizeof(int)*1024);

  for(int i=0; i<1024; i++) {
    a[i]=i+1;
    b[i]=i+1;
    c[i]=0;
  }

  struct timeval t1, t2;
  gettimeofday(&t1, NULL);
  mmult(a,b,c);
  gettimeofday(&t2, NULL);

  double elapsedTime = (t2.tv_usec - t1.tv_usec) + (t2.tv_sec - t1.tv_sec)*1000000;
  printf("elapsed time: %fus\n",elapsedTime);
  free(a);
  free(b);
  free(c);

  return 0;
}

以下是我如何编译main：

gcc -o main main.cpp mmult.cpp -O3

–wrapper.cpp —–

#include <Python.h>
#include <numpy/arrayobject.h>
#include "mmult.h"

static PyObject* mmult_wrapper(PyObject* self, PyObject* args) {
   int32_t* a;
   PyArrayObject* a_obj = NULL;
   int32_t* b;
   PyArrayObject* b_obj = NULL;
   int32_t* c;
   PyArrayObject* c_obj = NULL;

   int res = PyArg_ParseTuple(args, "OOO", &a_obj, &b_obj, &c_obj);

   if (!res)
      return NULL;

   a = (int32_t*) PyArray_DATA(a_obj);
   b = (int32_t*) PyArray_DATA(b_obj);
   c = (int32_t*) PyArray_DATA(c_obj);

   /* call function */
   mmult(a,b,c);

   Py_RETURN_NONE;
}

/*  define functions in module */
static PyMethodDef TheMethods[] = {
   {"mmult_wrapper", mmult_wrapper, METH_VARARGS, "your c function"},
   {NULL, NULL, 0, NULL}
};

static struct PyModuleDef cModPyDem = {
   PyModuleDef_HEAD_INIT,
   "mmult", "Some documentation",
   -1,
   TheMethods
};

PyMODINIT_FUNC
PyInit_c_module(void) {
   PyObject* retval = PyModule_Create(&cModPyDem);
   import_array();
   return retval;
}

–setup.py —–

import os
import numpy
from distutils.core import setup, Extension
cur = os.path.dirname(os.path.realpath(__file__))
c_module = Extension("c_module", sources=["wrapper.cpp","mmult.cpp"],include_dirs=[cur,numpy.get_include()])
setup(ext_modules=[c_module])

–code.py —–

import c_module
import time
import numpy as np
if __name__ == "__main__":
    a = np.ndarray((32,32),dtype='int32',buffer=np.linspace(1,1024,1024,dtype='int32').reshape(32,32))
    b = np.ndarray((32,32),dtype='int32',buffer=np.linspace(1,1024,1024,dtype='int32').reshape(32,32))
    c = np.ndarray((32,32),dtype='int32',buffer=np.zeros((32,32),dtype='int32'))

    c_module.mmult_wrapper(a,b,c)

下面是我如何编译Python扩展：

python3.6 setup_sw.py build_ext --inplace

UPDATE

我已经更新了mmult.cpp代码,以便在内部运行3到1,000,000次迭代.这导致非常相似的时间：

纯C – 27us

Python扩展 – 27us

解决方法:

85微秒的延迟太小,无法可靠且重复地测量.例如,CPU cache效果(或context switches或paging)可能支配计算时间(并改变它以使该时间无意义).

(我猜你在Linux / x86-64上)

根据经验,尝试至少持续运行半秒钟,并重复基准测试几次.您也可以使用time(1)进行测量.

另请参阅time(7).有几种时间概念(经过“实际”时间,单调时间,进程CPU时间,线程CPU时间等).您可以考虑使用clock(3)或clock_gettime(2)来测量时间.

顺便说一句,您可以使用更新版本的GCC(2017年11月,GCC7和几周GCC8)进行编译,并且您希望使用gcc -march = native -O3进行编译以进行基准测试.尝试其他optimization options和调整.您也可以尝试其他编译器,例如Clang/LLVM.

另请参阅this对相关问题的回答(关于并行化).可能numpy软件包使用(内部)类似技术(在Python GIL之外),因此可能比C中的初始顺序矩阵乘法代码更快.

内容总结

以上是互联网集市为您收集整理的在Python中运行C扩展比普通C更快全部内容，希望文章能够帮你解决在Python中运行C扩展比普通C更快所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/745931.html

来源：【匿名】

【上一篇】python – Yellowbrick：在Yellowbrick生成的图表上增加字体大小【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【在Python中运行C扩展比普通C更快】教程文章相关的互联网学习教程文章

python 中and，or计算规则

and ：如果表达式都不为假，则返回最后一个表达式的值，如果为假返回第一个表达式为假的值。(遇到假的表达式就返回此表达式的值)or :如果都为假，，返回最后一个假表达式的值，如果有真，则返回第一个真的值。（遇到真表达式就返回此表达式的值） and的优先级大于or原文：https://www.cnblogs.com/tuosir/p/8461653.html

# 1、红色球6个，1，33，蓝色球1个，1-16# 1、先从1，33之间取6个 random.sample([1,33],6)# 2，再从1-16之间取1个 random.choice([1,16])# 3、把双色球号码改成红色球 01 02 03 04 05 06 蓝色球 07 的格式# 4、读到文件的内容，判断刚才产生的双色球是否在文件中# 5、不在就写入import randomFILE_NAME = ‘seq.txt‘def op_file(content=None): with open(FILE_NAME, ‘a+‘, encoding=‘utf-8‘) as fw: if conten...

python中字典【代码】【图】

字典中key:不可改变的数据类型#fromkeys 快速定义一个空字典res = {}.fromkeys([‘a‘,‘b‘,‘c‘],[‘1‘,‘2‘,‘3‘]) print（res) 定义字典：dict1 = {‘name1‘:‘天明‘,‘age‘:‘25‘,‘high‘:‘170‘ } dict2 = {‘name2‘:‘tian‘,‘age‘:‘25‘,‘phone‘:‘100‘ } #[ ] 根据key取值如果取不到报错>>> dict1 = { ... ‘name1‘:‘天明‘, ... ‘age‘:‘25‘, ... ‘high‘:‘170‘ ... } >>> res = dict1[‘name...

python中django框架的csrf验证【代码】

在form表单以post的方式提交时，django默认会带一个验证的机制csrf验证<form action="/day02/login/" method="post">{% csrf_token %}用户名: <input type="text" name="user">密码 <input type="text" name="pwd"><input type="checkbox" name="deng" value="1">10秒免登陆<input type="submit" value="提交"><input type="button" value="点击" id="btn"> </form>必须把随机cookie验证发过去，这样django机制才能验证成功若是采用...

python中时间戳，datetime 和时间字符串之间得转换【代码】

# datetime时间转为字符串def Changestr(datetime1): str1 = datetime1.strftime(‘%Y-%m-%d %H:%M:%S‘) return str1# 字符串时间转为时间戳def Changetime(str1): Unixtime = time.mktime(time.strptime(str1, ‘%Y-%m-%d %H:%M:%S‘)) return Unixtime# datetime时间转为时间戳def Changestamp(dt1): Unixtime = time.mktime(time.strptime(dt1.strftime(‘%Y-%m-%d %H:%M:%S‘), ‘%Y-%m-%d %H:%M:%S‘)) re...

python中for和if else的使用【代码】

In [8]: a = set(‘abcd‘)In [9]: b = set(‘ef‘)In [10]: def match(x,y):....: for i in x:....: for j in y:....: if i==j:....: break....: else:....: return False....: return True....: In [11]: match(a,b) Out[11]: FalseIn [12]: match(a,a) Out[12]: TrueIn [13]: match(a,set(‘ab‘)) Out[13]: FalseIn [14]: match(a,set(‘opqrsa‘)) Out[14]:...

关于python中strip方法的理解

1.strip方法并不是去除对称字符串的。比如a="123abcd321"a.strip()方法的结果是abcd有人可能就把strip方法理解成了“可以去除字符串两端对称字符”的一种方法。这么理解是错误的。2.strip方法既可以去除字符串左侧的字符也可以去除字符串右侧的字符，也可以两端同时去除。a="123abcd"a.strip(“123”)的结果是abcdb="abcd123"b.strip("123")的结果是abcdstrip方法的结果其实是先执行lstrip方法再执行rstrip方法，为了语义清楚，你如...

14-08-07 关于程序、进程、线程，以及python中实现多线程的办法【代码】【图】

考核题目中涉及到多线程编程，于是复习了一下系统编程里面的各种概念。首先，程序是代码，没有活动。通过编译连接之后被加载到内存里运行时，内存活动的就是进程，这里的进程不仅仅是代码段，还包括涉及的数据等。而线程是在同一个进程下的小程序，它们可以“同时”地运行，其中会有一个主线程来控制。接下来是多线程或着多进程的实现，两者原理基本一样，都是把CPU的时间分片然后进行分配给某个进程或者线程，也就是说在同...

python中迭代器和生成器的区别【代码】

1#!/usr/bin/python 2def power(values):3for value in values:4print"powing %s" % value5yield value6def add(values):7for value in values:8if value % 2 == 0:9yield value + 3 10else: 11yield value + 2 12 elements = [1, 4, 7, 9, 12, 19] 13add(power(elements)) 14for i in add(power(elements)): 15print(i)首先来看上面一段代码运行结果:powing 13powing 47powing 79powing 911powing 1215powing 1921power这时已经不...

python 中模块，包，与常用模块【代码】【图】

一模块模块：就是一组功能的集合体，我们的程序可以直接导入模块来复用模块里的功能导入方式一般为： import 模块名在python中，模块一般分为四个通用类别1使用python编写.py 文件2、已被编译为共享库或DLL 的c 或c++扩展3把一系列模块组织到一起的文件夹（注：文件夹下有一个__init__.py文件，该文件夹称之为包）4、使用c编写并链接到python解释器的内置模块使用模块的优点：1、从文件级别组织程序，更方便管理2、拿来主义，...

python中 xlrd模块【代码】

python中的xlrd模块简介读取Excle文档，支持xls，xlsx格式安装：pip3 install xlrd导入：import xlrdxlrd 模块方法读取Excelfile = ‘route_info.xls‘ # 读取Excel信息,生成对象 read_book = xlrd.open_workbook(file) 获取sheet【表】相关方法，返回xlrd.sheet.Sheet()对象sheet = read_book.sheets() # 获取全部sheet列表 print(sheet) ...

python中如何使用pip安装自己的第三方模块【代码】【图】

系统：CentOS6.8 python版本：python3.5 文本编辑器：vim python中我们很多时候，需要将自己的py文件导入到python路径中，但是我们自己的文件自身并不在python默认的库文件路径下，这时候就需要我们自己将我们的py文件import进入了下面示例怎么导入自己的第三方模块，我们首先需要自己创建一个.py文件，名字随意明名了，但是不要和python内部模块重命，内部模块路径在/usr/lib/python3.5/site-packages。要不然使用pyth...

Python连载11-Python中os.path模块简介【代码】【图】

一、os.path（和路径相关的木块）1.函数：abspath()（1）含义：将路径转化为绝对路径的形式（absolute path）（2）格式：os.path.abspath(相对路径)（3）注意：点代表当前目录，双点代表当前父目录（4）返回值：路径的绝对路径形式。print(abc.abspath(".")) basename()（1）用法：获取路径中的文件名部分（2）格式：os.path.basename(路径)（3）返回值：文件名字符串（4）总结：其实就是把最后面的文件名给截取过来了。print(abc....

python中fork()函数生成子进程分析

python的os module中有fork()函数用于生成子进程，生成的子进程是父进程的镜像，但是它们有各自的地址空间，子进程复制一份父进程内存给自己，两个进程之间的执行是相互独立的，其执行顺序可以是不确定的、随机的、不可预测的，这点与多线程的执行顺序相似。 import osdef child():print ‘A new child:‘, os.getpid()print ‘Parent id is:‘, os.getppid()os._exit(0)def parent():while True:newpid=os.fork()print newpidif...

解决Python中pip/pip3下载速度慢【代码】

PyPI 镜像简介PyPI (Python Package Index) 是 Python 编程语言的软件存储库。开发者可以通过 PyPI 查找和安装由 Python 社区开发和共享的软件，也可以将自己开发的库上传至 PyPI 。Linux下更换pip源使用pip/pip3安装一些python包的时候下载速度非常慢，这时候我们可以动手更换python的pip/pip3源，在Linux系统中找到~/.pip/pip.conf这个文件，如果没有这个文件自己创建一个同名文件，或者你的系统连~./pip这个目录也没有，那就自己...

首页 / PYTHON / 在Python中运行C扩展比普通C更快

在Python中运行C扩展比普通C更快

内容导读

内容图文

内容总结

内容备注

内容手机端

【在Python中运行C扩展比普通C更快】教程文章相关的互联网学习教程文章

python 中and，or计算规则

python中双色球【代码】

python中字典【代码】【图】

python中django框架的csrf验证【代码】

python中时间戳，datetime 和时间字符串之间得转换【代码】

python中for和if else的使用【代码】

关于python中strip方法的理解

14-08-07 关于程序、进程、线程，以及python中实现多线程的办法【代码】【图】

python中迭代器和生成器的区别【代码】

python 中模块，包，与常用模块【代码】【图】

python中 xlrd模块【代码】

python中如何使用pip安装自己的第三方模块【代码】【图】

Python连载11-Python中os.path模块简介【代码】【图】

python中fork()函数生成子进程分析

解决Python中pip/pip3下载速度慢【代码】

PYTHON - 相关标签

运行 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程