OpenMP入门指南

What's OpenMP

The OpenMP API supports multi-platform shared-memory parallel programming in C/C++ and Fortran. The OpenMP API defines a portable, scalable model with a simple and flexible interface for developing parallel applications on platforms from the desktop to the supercomputer.

语法

#pragma omp <directive> [clause[[,] clause] ...]

directive

1.  atomic: 内存位置将会原子更新,只对下一行有效。
2.  barrier: 线程在此等待,直到所有的线程都运行到此barrier。用来同步所有线程,只对下一行有效。
3.  critical: 其后的代码块为临界区,任意时刻只能被一个线程运行,只对下一行有效。
4.  flush: 所有线程对所有共享对象具有相同的内存视图(view of memory)
5.  for: 用在for循环之前,把for循环并行化由多个线程执行。循环变量只能是整型
6.  master: 指定由主线程来运行接下来的程序。
7.  ordered: 指定在接下来的代码块中,被并行化的 for循环将依序运行(sequential loop)
8.  parallel: 代表接下来的代码块将被多个线程并行各执行一遍。
9.  sections: 将接下来的代码块包含将被并行执行的section块。
10. single:之后的程序将只会在一个线程(未必是主线程)中被执行,不会被并行执行。
11. threadprivate 指定一个变量是线程局部存储(thread local storage)

clause

1.  copyin: 让threadprivate的变量的值和主线程的值相同。
2.  copyprivate: 不同线程中的变量在所有线程中共享。
3.  default: Specifies the behavior of unscoped variables in a parallel region.
4.  firstprivate: 对于线程局部存储的变量,其初值是进入并行区之前的值。
5.  if: 判断条件,可用来决定是否要并行化。
6.  lastprivate: 在一个循环并行执行结束后,指定变量的值为循环体在顺序最后一次执行时获取的值,或者#pragma sections在中,按文本顺序最后一个section中执行获取的值。
7.  nowait: 忽略barrier的同步等待。
8.  num_threads: 设置线程数量的数量。默认值为当前计算机硬件支持的最大并发数。一般就是CPU的内核数目。超线程被操作系统视为独立的CPU内核。
9.  ordered: 使用于 for,可以在将循环并行化的时候,将程序中有标记 directive ordered 的部分依序运行。
10. private: 指定变量为线程局部存储。
11. reduction: Specifies that one or more variables that are private to each thread are the subject of a reduction operation at the end of the parallel region.
12. schedule: 设置for循环的并行化方法;有 dynamic、guided、runtime、static 四种方法。
    1)schedule(static, chunk_size) 把chunk_size数目的循环体的执行,静态依序指定给各线程。
    2)schedule(dynamic, chunk_size) 把循环体的执行按照chunk_size(缺省值为1)分为若干组(即chunk),每个等待的线程获得当前一组去执行,执行完后重新等待分配新的组。
    3)schedule(guided, chunk_size) 把循环体的执行分组,分配给等待执行的线程。最初的组中的循环体执行数目较大,然后逐渐按指数方式下降到chunk_size。
    4)schedule(runtime) 循环的并行化方式不在编译时静态确定,而是推迟到程序执行时动态地根据环境变量OMP_SCHEDULE 来决定要使用的方法。
13. shared: 指定变量为所有线程共享。


常用directive

parallel:

#pragma omp parallel [clause[[,]clause]...]
{
}

clause type:
if([parallel :]scalar-expression)
num_threads(integer-expression)
default(shared | none)
private(list)
firstprivate(list)
shared(list)
copyin(list)
reduction([reduction-modifier ,] reduction-identifier : list)
proc_bind(master | close | spread)
allocate([allocator :] list)

for :

#pragma omp for [clause[[,]clause]...]
{
}

clause type:
private(list)
firstprivate(list)
lastprivate([ lastprivate-modifier:] list)
linear(list[ : linear-step])
reduction([ reduction-modifier,]reduction-identifier : list)
schedule([modifier[, modifier]:]kind[,chunk_size])    // static/dynamic/guided/auto/runtime
collapse(n)        //for嵌套层数
ordered[(n)]allocate([allocator :]list)
order(concurrent)

约束条件:
1. for循环中比较操作符必须是<, <=, >, >=。例如for (int i = 0; i != 10; ++i){}会编译不通过
2. 循环必须是单入口、单出口,也就是说循环内部不允许能够达到循环以外的跳转语句,exit除外。异常的处理也必须在循环体内处理。例如:若循环体内的break或goto会跳转到循环体外,那么会编译不通过

常用库函数

1.void omp_set_num_threads(int _Num_threads);
在后续并行区域设置线程数,此调用只影响调用线程所遇到的同一级或内部嵌套级别的后续并行区域.说明:此函数只能在串行代码部分调用.

2.int omp_get_num_threads(void);
返回当前线程数目.说明:如果在串行代码中调用此函数,返回值为1.

3.int omp_get_max_threads(void);
如果在程序中此处遇到未使用 num_threads() 子句指定的活动并行区域,则返回程序的最大可用线程数量.说明:可以在串行或并行区域调用,通常这个最大数量由omp_set_num_threads()或OMP_NUM_THREADS环境变量决定.

4.int omp_get_thread_num(void);
返回当前线程id.id从1开始顺序编号,主线程id是0.

5.int omp_get_num_procs(void);
返回程序可用的处理器数.

6.void omp_set_dynamic(int _Dynamic_threads);
启用或禁用可用线程数的动态调整.(缺省情况下启用动态调整.)此调用只影响调用线程所遇到的同一级或内部嵌套级别的后续并行区域.如果 _Dynamic_threads 的值为非零值,启用动态调整;否则,禁用动态调整.

7.int omp_get_dynamic(void);
确定在程序中此处是否启用了动态线程调整.启用了动态线程调整时返回非零值;否则,返回零值.

8.int omp_in_parallel(void);
确定线程是否在并行区域的动态范围内执行.如果在活动并行区域的动态范围内调用,则返回非零值;否则,返回零值.活动并行区域是指 IF 子句求值为 TRUE 的并行区域.

9.void omp_set_nested(int _Nested);
启用或禁用嵌套并行操作.此调用只影响调用线程所遇到的同一级或内部嵌套级别的后续并行区域._Nested 的值为非零值时启用嵌套并行操作;否则,禁用嵌套并行操作.缺省情况下,禁用嵌套并行操作.

10.int omp_get_nested(void);
确定在程序中此处是否启用了嵌套并行操作.启用嵌套并行操作时返回非零值;否则,返回零值.

互斥锁操作 嵌套锁操作 功能
11.void omp_init_lock(omp_lock_t * _Lock);
12.void omp_init_nest_lock(omp_nest_lock_t * _Lock);
初始化一个(嵌套)互斥锁.

13.void omp_destroy_lock(omp_lock_t * _Lock);
14.void omp_destroy_nest_lock(omp_nest_lock_t * _Lock);
结束一个(嵌套)互斥锁的使用并释放内存.

15.void omp_set_lock(omp_lock_t * _Lock);
16.void omp_set_nest_lock(omp_nest_lock_t * _Lock);
获得一个(嵌套)互斥锁.

17.void omp_unset_lock(omp_lock_t * _Lock);
18.void omp_unset_nest_lock(omp_nest_lock_t * _Lock);
释放一个(嵌套)互斥锁.

19.int omp_test_lock(omp_lock_t * _Lock);
20.int omp_test_nest_lock(omp_nest_lock_t * _Lock);
试图获得一个(嵌套)互斥锁,并在成功时放回真(true),失败是返回假(false).

21.double omp_get_wtime(void);
获取wall clock time,返回一个double的数,表示从过去的某一时刻经历的时间,一般用于成对出现,进行时间比较. 此函数得到的时间是相对于线程的,也就是每一个线程都有自己的时间.

22.double omp_get_wtick(void);
得到clock ticks的秒数.

编译

g++ xxx -fopenmp

引用

https://zh.wikipedia.org/wiki/OpenMP
https://www.cnblogs.com/liangliangh/p/3565234.html

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,406评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,732评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,711评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,380评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,432评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,301评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,145评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,008评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,443评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,649评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,795评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,501评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,119评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,731评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,865评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,899评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,724评论 2 354

推荐阅读更多精彩内容

  • OpenMP2.5 有底层API后,就已经可以实现并行编程;然而,很多时候串行算法已经成型,如果继续使用原有的底层...
    一梦换须臾_阅读 1,406评论 0 0
  • 进程和线程 进程 所有运行中的任务通常对应一个进程,当一个程序进入内存运行时,即变成一个进程.进程是处于运行过程中...
    胜浩_ae28阅读 5,108评论 0 23
  • 1.解决信号量丢失和假唤醒 public class MyWaitNotify3{ MonitorObject m...
    Q罗阅读 879评论 0 1
  • 提子不用,请横着放。莫非老师也当过泥瓦匠? 我虽不才,但也不是SB。这脑残题是哪个250想地? 皮鞋不穿,请放锅里...
    鹿也野阅读 310评论 0 2
  • 知识点导航 一、CSS初步认识<p> CSS整体感知 css 是 cascading style sheet 层叠...
    lanvy阅读 406评论 0 2