2018-03-01 【Linux下在GCC环境使用SIMD】

什么是SIMD

SIMD的全称是Single Instruction Multiple Data (单指令多数据流)。

在支持SIMD的CPU中,包含着一些特别宽的寄存器(比如512位)。通过特别的指令,可以在这些寄存器上执行指定操作。这些操作通常是对正常寄存器(比如64位)上操作的拓展,可以理解为一条指令同时操作了多个正常寄存器,也就是所谓的SIMD了。

SIMD的性能

做个简单的除法就能知道,512位的寄存器相比64位寄存器,速度提升了8倍。

但是实际情况不仅仅是如此。在SIMD的指令中,还包括了一些非常奇妙的指令,比如计算正态分布的累积分布函数和其反函数的指令。在看到它们的时候,我心里吼了一句:“还有这种操作!”。这些特化的指令在特别的场景下就是神器。

怎么用SIMD

首先,我们是在Linux的GCC编译器上使用SIMD指令。在这个条件下,有两个途径:

  • 嵌入式汇编
  • Intrinsics

嵌入式汇编不是今天的主题。我今天主要记录一下Intrinsics怎么用。不管使用哪种方法,有一个网站是一定要收藏的:Intel Intrinsics Guide

它给出了SIMD指令集的各个子集: MMX, SSE,SSE4.2,AVX2等等。同时,它给每个指令都打上一些标签用于检索:Load,Store,Cast,Arithmetic 等等。它还给出了每个指令的等价操作和汇编指令。

具体地说,在C语言中使用SIMD涉及三个方面:

  • 头文件
  • 函数调用
  • 编译选项

头文件和函数调用很好办,它归属于Intel的规范。在Intel Intrinsics Guide中,每条指令需要的头文件都有标注,按图索骥即可。

编译选项则属于GCC的规范。 i386 and x86-64 Options 将相关选项包含在内,但是更宽一些。每条指令都有所属的指令集(比如SSE4.2),当使用到该指令后,就要在链接器的选项中加上相关的项 (比如-msse4.2) 。

选项的命名很直接,在 i386 and x86-64 Options 里搜索 -mmmx 就可以跳到SIDM选项比较集中的区域,很容易就能确定需要的选项是什么。

内存对齐

使用SIMD指令的范式很简单:

  • 用SIMD指令,将数据从内存导入特殊寄存器
  • 用SIMD指令,在特殊寄存器间进行运算
  • 用SIMD指令,将运算结果导出回内存

这里涉及到一个问题,就是导入导出使用到的内存必须满足特殊的对齐条件。比如使用了128位(16字节)的SIMD,则内存首地址必须能被16整除。如果不满足该条件,在导入数据时程序会引发段错误退出。

在C中,获得特定对齐方式的动态内存,使用的函数是来自stdlib.hvoid* aligned_alloc(size_t alignment, size_t size)

使用案例

// Filename: main.cpp
#include <cstdlib>
#include <cstdio>
#include <immintrin.h>
using namespace std;

void print(float* data, int n) {
  for (int i = 0; i < n; i ++) {
    printf("%f ", data[i]);
  }
  printf("\n");
}

int main() {
  const int WIDTH = 256;
  const float x = 0.2;

  int n = WIDTH/8/sizeof(float);
  float* w = (float*) aligned_alloc(64, sizeof(float)*n);
  float* y = (float*) aligned_alloc(64, sizeof(float)*n);
  
  // 生成数据
  for(int i = 0; i < n; i ++) {
    w[i] = rand();
  }
  print(w, n);
  
  // y_i = w_i * x
  __m256 _x = _mm256_set1_ps(0.2);
  __m256 _w = _mm256_load_ps(w);
  __m256 _y = _mm256_mul_ps(_x, _w);
  _mm256_store_ps(y, _y);

  print(y, n);
  free(y);
  free(w);
}

编译的指令如下:

g++ -o a.out -mavx main.cpp
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,219评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,363评论 1 293
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,933评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,020评论 0 206
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,400评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,640评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,896评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,597评论 0 199
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,327评论 1 244
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,581评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,072评论 1 261
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,399评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,054评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,083评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,849评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,672评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,585评论 2 270

推荐阅读更多精彩内容