在C#中的GPU加速——AleaGPU学习笔记（二）

注：在GPU编程中，我们一般说的设备端（Device）就是指GPU，而主机端（Host）则是指CPU

Parallel-For

Parallel-For用于对集合的每个元素或有序区间的每个索引执行相同的独立操作。如果这些操作没有写入其他操作访问的内存位置，则它们是独立的。与串行循环相比，对执行操作的顺序没有定义，并且操作可以并行运行。

void Gpu.For(int start, int end, Action<int> op);

前两个参数是指定循环范围的边界，第三个参数是一个Action，用来调用集合中的每一个数字，并将其作为参数。Gpu.For还需要一个GPU来运行，方便起见在Alea中提供了指定默认gpu的方法

var gpu = Gpu.Default;
var n = ...
gpu.For(0, n, i => 
{
    ...
});

Parallel-For工作原理如图所示，参数和结果构成一个闭包（closure）再传递给Parallel-For循环体。注意循环体中的操作必须彼此独立，它们不允许通过写入共享变量或共享数组元素进行通信。

Parallel-For使用原理

下面是一个计算两个数组元素和的示例

using Alea.Parallel;

var gpu = Gpu.Default;
var arg1 = Enumerable.Range(0, Length).ToArray();
var arg2 = Enumerable.Range(0, Length).ToArray();
var result = new int[Length];

gpu.For(0, result.Length, i => result[i] = arg1[i] + arg2[i]);

利用action可以访问循环体外部定义的数据元素，并且支持直接写出结果到.NET数组。Alea GPU的内存管理是自动的，下面的章节会进一步解释。

笔者下载了Alea.Parallel的示例代码，加上自己改写的部分，做了做运行速度测试，功能是计算10000000次两数组元素和，代码如下

using System;
using System.Diagnostics;
using System.Linq;
using System.Threading.Tasks;
using Alea;
using Alea.Parallel;

namespace DeviceQuery
{
    class Program
    {
        static void Main()
        {
            Stopwatch sw = new Stopwatch();
            sw.Start();
            DelegateWithClosureCpu(); //CPU并行闭包委托
            sw.Stop();
            double time1 = sw.Elapsed.TotalMilliseconds;

            sw.Restart();
            DelegateWithClosureGpu();//GPU并行闭包委托
            sw.Stop();
            double time2 = sw.Elapsed.TotalMilliseconds;

            sw.Restart();
            ActionWithClosure();//GPU并行闭包Action
            sw.Stop();
            double time3 = sw.Elapsed.TotalMilliseconds;

            sw.Restart();
            ActionFactoryWithClosureGPU();//GPU并行闭包Func和CPU并行闭包Func
            sw.Stop();
            double time4 = sw.Elapsed.TotalMilliseconds;

            sw.Restart();
            ActionFactoryWithClosureCPU();//CPU并行闭包Func和CPU并行闭包Func
            sw.Stop();
            double time5 = sw.Elapsed.TotalMilliseconds;

            Console.WriteLine(time1);
            Console.WriteLine(time2);
            Console.WriteLine(time3);
            Console.WriteLine(time4);
            Console.WriteLine(time5);


            Console.ReadKey();
        }

            private const int Length = 10000000;
            public static void DelegateWithClosureCpu()
            {
                var arg1 = Enumerable.Range(0, Length).ToArray();
                var arg2 = Enumerable.Range(0, Length).ToArray();
                var result = new int[Length];

                Parallel.For(0, result.Length, i => result[i] = arg1[i] + arg2[i]);

                var expected = arg1.Zip(arg2, (x, y) => x + y);
            }

            [GpuManaged]
            public static void DelegateWithClosureGpu()
            {
                var arg1 = Enumerable.Range(0, Length).ToArray();
                var arg2 = Enumerable.Range(0, Length).ToArray();
                var result = new int[Length];
            
                Gpu.Default.For(0, result.Length, i => result[i] = arg1[i] + arg2[i]);

                var expected = arg1.Zip(arg2, (x, y) => x + y);
            }
        [GpuManaged]
        public static void ActionWithClosure()
        {
            var gpu = Gpu.Default;
            var arg1 = Enumerable.Range(0, Length).ToArray();
            var arg2 = Enumerable.Range(0, Length).ToArray();
            var result = new int[Length];

            Action<int> op = i => result[i] = arg1[i] + arg2[i];

            gpu.For(0, arg1.Length, op);

            var expected = arg1.Zip(arg2, (x, y) => x + y);

        }

        [GpuManaged]
        public static void ActionFactoryWithClosureGPU()
        {
            var gpu = Gpu.Default;
            var arg1 = Enumerable.Range(0, Length).ToArray();
            var arg2 = Enumerable.Range(0, Length).ToArray();
            var result = new int[Length];
            var expected = new int[Length];

            Func<int[], Action<int>> opFactory = res => i => res[i] = arg1[i] + arg2[i];

            gpu.For(0, arg1.Length, opFactory(result));
        }

        [GpuManaged]
        public static void ActionFactoryWithClosureCPU()
        {
            var gpu = Gpu.Default;
            var arg1 = Enumerable.Range(0, Length).ToArray();
            var arg2 = Enumerable.Range(0, Length).ToArray();
            var result = new int[Length];
            var expected = new int[Length];

            Func<int[], Action<int>> opFactory = res => i => res[i] = arg1[i] + arg2[i];

            Parallel.For(0, arg1.Length, opFactory(expected));
        }
    }
}

运行结果

最后编辑于：2020.03.08 23:44:51

禁止转载，如需转载请通过简信或评论联系作者。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 217,509评论 6赞 504
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,806评论 3赞 394
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 163,875评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,441评论 1赞 293
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,488评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,365评论 1赞 302
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,190评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,062评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,500评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,706评论 3赞 335
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,834评论 1赞 347
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,559评论 5赞 345
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,167评论 3赞 328
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,779评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,912评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,958评论 2赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,779评论 2赞 354

在C#中的GPU加速——AleaGPU学习笔记（二）

Parallel-For

推荐阅读更多精彩内容