开篇
不容易啊,终于要开始介绍并发了,erlang也终于可以大显神威了。在前面的几篇文章中,着重介绍了使用erlang进行顺序编程的一些关键点,算是入门。
毕竟,相对于golang,对于熟悉面向对象编程的程序员而言,erlang的入门门槛要高不少,毕竟是两种几乎迥异的编程思想的碰撞。
erlang的顺序编程作为入门的同时,其实也介绍了erlang为什么被称之为并发语言以及erlang代码的简洁、高效。
关于并发
并发这个话题在当下的时代环境背景中随处可见,好像写的程序不支持并发就没脸见人似的。
在诸如C,C++,Java,C#等语言中,通常通过多线程,多进程的方式来支持并发。而这类语言往往没有在语言级对多线程、多进程程序的编写做很好的支持。
而在erlang,以及golang等语言中,在语言级就支持并发。这无异于简化了并发编程的编写。而往往越简单的逻辑是越不容易出错的,从另一方面也保证了软件的质量。
Erlang中的并发
在erlang,实现并发通过语言级别的三个并发原语实现。另外,erlang是面向消息的语言,即,进程间通信不是通过共享内存等方式实现,而是通过消息实现。Erlang中也不存在线程的概念,通过产生多个进程来实现并发。
注:erlang中创建一个进程的开销远远小于在其他语言中创建一个进程。因为erlang创建进程的过程是在erlang自身的虚拟机中实现,此处的底层实现保证了创建进程的快速以及低开销。
并发原语如下:
!
!在erlang中表示向某个进程发送消息spawn
产生一个进程。receive ... end
接受从另外的进程发送过来的消息.简单的例子:
-module(area_server).
-ifdef(debug).
%% export all functions under debug mode
-compile(export_all).
-else.
%% export the entrance function under release mode
-export([loop/0]).
-endif.
-define (PI, 3.1415926).
%% receive message sender from other processes
loop()->
receive
{rect, Width, Height} ->
io:format("the area of rectangle is ~p~n", [Width * Height]),
loop();
{circle, R} ->
io:format("the area of circle is ~p~n", [?PI * R * R]),
loop();
Other ->
io:format("no supported shape ~p~n", [Other]),
loop()
end.
可以看到,spawn原语执行后,会返回一个产生的进程的进程id,在例子中是<0.37.0>。 然后通过 ! 原语向该进程发送消息。
在代码中可以看到,receive...end 的并发原语中,会接受并处理 {rect, Width, Height}, {circle, R} 的消息,即,计算矩形和圆形面积。对于其他的消息,给出"no supported shape"信息,并附上消息内容。
Demos
echo
- 服务端
-module (echo_server).
-ifdef(debug).
-compile(export_all).
-else.
-export([loop/0]).
-endif.
%% receive message and just send back
loop() ->
receive
{From, Message} ->
From ! Message,
loop();
end.
- 客户端
-module (echo_client).
-ifdef(debug).
-compile(export_all).
-else.
-export([send/2]).
-endif.
%%send message to process
send(Pid, Message) ->
Pid ! Message,
receive
Response ->
Response
end.
-
运行示例
第一行:编译echo_server模块
第二行:编译echo_client模块
第三行:产生一个进程,后台运行echo_server
第四行:向echo_server的进程发送消息,并带上自己的进程id(self() => 获取当前进程的id)。
对echo_server封装
背景
上述例子中可以看出,server的进程需要手动创建,而且接受消息的client不能判断是从server回过来的,也可能是从其他进程发送过来的。所以我们要对代码进行一层修改。并且封装部分函数。服务端
%% start the server and output the pid.
start() ->
spawn(fun loop/0).
%% receive message and just send back
loop() ->
receive
{From, Message} ->
From ! {self(), Message},
loop()
end.
- 客户端
%%send Message to Process with process id
send(Pid, Message) ->
Pid ! {self(), Message},
receive
{Pid, Response} ->
Response
end.
-
运行示例
可以看到,此处将进程的创建,接收消息的Pid匹配,以及回消息时带上自身的进程Pid都封装到了函数之内。
关于RPC
看到此处,可能大家都会觉得,这个是不是只能在同台物理机上的同个虚拟机内进行进程间通信呢?答案显然是否定的。至于RPC怎么配置,怎么实现,放在以后讲述节点部署时再进行描述。
关于进程创建开销
很多人,尤其是具有多年传统编程语言经验的,都会下意识的认为进程创建的开销是非常巨大的。但,在erlang中,并非如此。口说无凭,来段代码验证下。具体思路:首先创建N个进程,并使N个进程挂起,然后发消息,让N个进程退出,然后打印消耗时间(包括CPU时间和真实时间)。
-
代码:
-
运行
可以看到,创建20万个进程,消耗了1916微秒,而平均每个进程的创建并销忘的开销,仅仅为9.58微秒。
-
另外:
在此处,获取到系统设置本机默认可以创建26万个进程,如果想要调整这个数字的大小,需要在erlang虚拟机启动时进程设置。如:erl +P 50000
。那么启动时,最多只能创建5万个进程。(erlang opt 18 版本中,此处会将参数扩大至2的幂次方,5万的参数,会设置为 65536个进程。)
超时设置
场景
在一个进程的receive...end原语中,也有需求是等到X秒,然后退出,或者给出等待时间等等。语法
receive
Pattern1 [when Guard1] -> do something;
Pattern2 [when Guard1] -> do something;
...
after Time ->
Expression
end.
其中,after处的子句触发条件是2个,1:Time等待时间到,2:所有的消息均与receive中的模式进行过匹配。
因此,如果有大量消息接受的进程,需要考虑是否采用这种低效率的模式。
- 案例
此处可以灵活变通,比如利用Time = 0,设计一个立即触发模式匹配的。或者receive不做任何事,仅仅是让进程sleep一定时间。或者做一个定时器,Time时间之后,在after语句中开始接受其他消息。