Speed-up with Cython and Numpy in Python

Cython代码和Python代码区别

代码运行在IPython-Notebook中,在IPython-Notebook中导入cython环境。

1

%load_ext cython

Cython可以在Python中掺杂C和C++的静态类型,cython编译器可以把Cython源码编译成C或C++代码,编译后的代码可以单独执行或者作为Python中的模型使用。Cython中的强大之处在于可以把Python和C结合起来,它使得看起来像Python语言的Cython代码有着和C相似的运行速度。

我们使用一个简单的Fibonacci函数来比较下Python和Cython的区别:

1

2

3

4

5

6

#python

deffib1(n):

a,b=0.0,1.0

foriinrange(n):

a,b=a+b,a

returna

下面代码使用%%cython标志表示下面的代码使用cython编译

1

2

3

4

5

6

7

%%cython

deffib2(int n):

cdef double a=0.0, b=1.0

foriinrange(n):

a,b = a+b,a

returna

通过比较上面的代码,为了把Python中的动态类型转换为Cython中的静态类型,我们用cdef来定义C语言中的变量i,a,b。

我们用C语言实现Fibonacci函数,然后通过Cython用Python封装,其中cfib.h为Fibonacci函数C语言实现,如下:

1

2

3

4

5

6

7

8

doublecfib(intn){

inti;

doublea=0.0, b=1.0, tmp;

for(i=0; i

tmp = a; a = a + b; b = tmp;

}

returna;

}

1

2

3

4

5

6

7

%%cython

cdef externfrom"/home/ldy/MEGA/python/cython/cfib.h":

double cfib(int n)

deffib3(n):

"""Returns the nth Fibonacci number."""

returncfib(n)

比较不同方法的运行时间:

1

2

3

4

5

6

%timeit result=fib1(1000)

%timeit result=fib2(1000)

%timeit result=fib3(1000)

10000 loops, best of 3: 73.6 µs per loop

1000000 loops, best of 3: 1.94 µs per loop

1000000 loops, best of 3: 1.92 µs per loop

Cython代码的编译

Cython代码的编译为Python可调用模块的过程主要分为两步:第一步是cython编译器把Cython代码优化成C或C++代码;第二步是使用C或C++编译器编译产生的C或C++代码得到Python可调用的模块。

我们通过一个setup.py脚本来编译上面写的fib.pyxCython代码,如下所示,关键就在第三行,cythonize函数的作用是通过cython编译器把Cython代码转换为C代码,setup函数则是把产生的C代码转换成Python可调用模块。

1

2

3

4

fromdistutils.coreimportsetup

fromCython.Buildimportcythonize

setup(ext_modules=cythonize('fib.pyx'))

#setup(ext_modules=cythonize('*.pyx','fib1.pyx'))也可以一次编译多个Cython文件

写好setup.py文件后,就可以通过下述命令执行编译:

1

python setup.py build_ext --inplace

执行后产生了fib.c代码以及fib.so文件,以及一些中间结果保存在build文件夹里。

1

2

3

4

importos

os.chdir('/home/ldy/MEGA/python/cython/test')

os.getcwd()

!ls

build  fib.c  fib.pyx  fib.so  setup.py

通过Python调用产出的fib.so模块:

1

2

importfib

fib.fib2(90)

2.880067194370816e+18

Cython中类型的定义

为什么Cython和Python比会提高很多性能,主要原因有两点:一是Python是解释型语言,在运行之前Python解释器把Python代码解释成Python字节码运行在Python虚拟机上,Python虚拟机把Python字节码最终翻译成CPU能执行的机器码;而Cython代码是事先直接编译成可被Python调用的机器码,在运行时可直接执行。第二个主要的原因是Python是动态类型,Python解释器在解释时需要判断类型,然后再提取出底层能够运行的数据以及操作;然而C语言等比较底层的语言是静态类型,编译器直接提取数据进行操作产生机器码。

Cython中使用cdef来定义静态类型:

1

2

3

cdef int i

cdef int j

cdef float f

也可以一次定义多个:

1

2

3

4

cdef:

int i

int j

float f

Cython中还允许在静态类型和动态类型同时存在及相互赋值:

1

2

3

4

5

6

%%cython

cdef int a=1,b=2,c=3

list_of_ints=[a,b,c]

list_of_ints.append(4)

a=list_of_ints[1]

printa,list_of_ints

2 [1, 2, 3, 4]

声明Python类型为静态类型,Cython支持把一些Python内置的如list,tuple,dict等类型声明为静态类型,这样声明使得它们能像正常Python类型一样使用,但是需要约束成只能是他们所申明的类型,不能随意变动。

1

2

3

4

5

6

7

8

9

10

11

12

13

%%cython

cdef:

list names

dict name_num

name_num={'jerry':1,'Tom':2,'Bell':3}

names=list(name_num.keys())

printnames

other_names=names#动态类型可以从静态类型的Python对象初始化

delother_names[0]#因为引用了同一个list,所以都会删除第一个元素

printnames,other_names

other_names=tuple(other_names)#names和other_names的区别在于names只能是list类型,

printother_names#other_names可以引用任何类型

['Bell', 'jerry', 'Tom']

['jerry', 'Tom'] ['jerry', 'Tom']

('jerry', 'Tom')

Cython中numpy的使用

我们先构造一个函数来测试下使用纯Python时的运算时间来做对比,这个函数的作用是对一副输入图像求梯度(不必过分关注函数的功能,在这只是使用这个函数作为测试)。函数的输入数据是indata一个像素为1400*1600的图片;输出为outdata,为每个像素梯度值,下面是这个函数的纯Python实现:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

importnumpyasnp

indata = np.random.rand(1400,1600)

outdata = np.zeros(shape=indata.shape, dtype='float64')# eventually holds our output

fromnumpy.libimportpad

print("shape before", indata.shape)

indata = pad(indata, (1,1),'reflect', reflect_type='odd')# allow edge calcs

print("shape after", indata.shape)

importmath

defslope(indata, outdata):

I = outdata.shape[0]

J = outdata.shape[1]

foriinrange(I):

forjinrange(J):

# percent slope using Zevenbergen-Thorne method

# assume edges added, inarr is offset by one on both axes cmp to outarr

dzdx = (indata[i+1, j] - indata[i+1, j+2]) /2# assume cellsize == one unit, otherwise (2 * cellsize)

dzdy = (indata[i, j+1] - indata[i+2, j+1]) /2

slp = math.sqrt((dzdx * dzdx) + (dzdy * dzdy)) *100# percent slope (take math.atan to get angle)

outdata[i, j] = slp

('shape before', (1400, 1600))

('shape after', (1402, 1602))

测试运行时间,为5.31 s每个循环

1

%timeit slope(indata, outdata)

1 loop, best of 3: 5.31 s per loop

重置输出:

1

2

3

4

defreset_outdata():

outdata = np.zeros(shape=indata.shape, dtype='float64')

reset_outdata()

使用Cython重写求图像梯度函数,其中函数slope_cython2使用Cython里的numpy类型,并重写了里面的开方函数,其中%%cython -a表示使用cython编译Cython代码,并可以对照显示编译器把Cython代码编译成的C代码。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

%%cython

importcython

cimport numpyasnp

ctypedef np.float64_t DTYPE_t

@cython.boundscheck(False)

defslope_cython2(np.ndarray[DTYPE_t, ndim=2] indata, np.ndarray[DTYPE_t, ndim=2] outdata):

cdef int I, J

cdef int i, j, x

cdef double k, slp, dzdx, dzdy

I = outdata.shape[0]

J = outdata.shape[1]

foriinrange(I):

forjinrange(J):

dzdx = (indata[i+1, j] - indata[i+1, j+2]) /2

dzdy = (indata[i, j+1] - indata[i+2, j+1]) /2

k = (dzdx * dzdx) + (dzdy * dzdy)

slp = k**0.5*100

outdata[i, j] = slp

测试运行时间:208ms,快了有25倍左右

1

%timeit slope_cython2(indata, outdata)

1 loop, best of 3: 208 ms per loop

Cython中多进程

Cython还支持并行运算,后台由OpenMP支持,所以在编译Cython语言时需要加上如下代码第一行所示的标记。在进行并行计算时,需使用nogil关键词来释放Python里的GIL锁,当代码中只有C而没有Python对象时,这样做是安全的。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

%%cython --compile-args=-fopenmp --link-args=-fopenmp --force

importcython

fromcython.parallelimportprange, parallel

@cython.boundscheck(False)

defslope_cython_openmp(double [:, :] indata, double [:, :] outdata):

cdef int I, J

cdef int i, j, x

cdef double k, slp, dzdx, dzdy

I = outdata.shape[0]

J = outdata.shape[1]

withnogil, parallel(num_threads=4):

foriinprange(I, schedule='dynamic'):

forjinrange(J):

dzdx = (indata[i+1, j] - indata[i+1, j+2]) /2

dzdy = (indata[i, j+1] - indata[i+2, j+1]) /2

k = (dzdx * dzdx) + (dzdy * dzdy)

slp = k**0.5*100

outdata[i, j] = slp

1

2

reset_outdata()

%timeit slope_cython_openmp(indata, outdata)

10 loops, best of 3: 78.2 ms per loop

测试的时间如上所示,多进程大概快了2.7倍左右。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,569评论 4 363
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,499评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,271评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,087评论 0 209
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,474评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,670评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,911评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,636评论 0 202
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,397评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,607评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,093评论 1 261
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,418评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,074评论 3 237
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,092评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,865评论 0 196
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,726评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,627评论 2 270

推荐阅读更多精彩内容

  • 背景 一年多以前我在知乎上答了有关LeetCode的问题, 分享了一些自己做题目的经验。 张土汪:刷leetcod...
    土汪阅读 12,662评论 0 33
  • 先决条件 在阅读这个教程之前,你多少需要知道点python。如果你想从新回忆下,请看看Python Tutoria...
    舒map阅读 2,539评论 1 13
  • NumPy是Python中关于科学计算的一个类库,在这里简单介绍一下。 来源:https://docs.scipy...
    灰太狼_black阅读 1,202评论 0 4
  • 先概括说几件开心的事: 和他逛街逛到脚麻趴到他身上 和他一起睡大床,扯被子 他挠我的肚脐眼眼 给我买了一个戒指 给...
    风尘1998阅读 213评论 0 0
  • 多年后荒芜的麦田里 出现了一座土堆 偶尔有风吹过 扬起的尘埃悠悠飘落 一群人忙着收割 不知道躺在里面的人是谁 偶尔...
    乱语者阅读 281评论 0 0