1. 人工蜂群算法简介
(以下描述,均不是学术用语,仅供大家快乐的阅读)
工蜂群算法(Artificial Bee Colony Algorithm,ABC)是一种模仿蜜蜂采蜜机理而产生的群智能优化算法。其原理相对复杂,但实现较为简单,在许多领域中都有研究和应用。
人工蜂群算法中,每一个蜜源的位置代表了待求问题的一个可行解。蜂群分为采蜜蜂、观察蜂和侦查蜂。采蜜蜂与蜜源对应,一个采蜜蜂对应一个蜜源。观察蜂则会根据采蜜蜂分享的蜜源相关信息选择跟随哪个采蜜蜂去相应的蜜源,同时该观察蜂将转变为侦查蜂。侦查蜂则自由的搜索新的蜜源。每一个蜜源都有开采的限制次数,当一个蜜源被采蜜多次而达到开采限制次数时,在该蜜源采蜜的采蜜蜂将转变为侦查蜂。每个侦查蜂将随机寻找一个新蜜源进行开采,并转变成为采蜜蜂。
2. 算法流程
这次我们的主角是一群勤劳的小蜜蜂。这群小蜜蜂分为三个职业:采蜜蜂、观察蜂和侦查蜂。
采蜜蜂:也有叫雇佣蜂,蜜源的发现者,发现蜜源后会去招募观察蜂小伙伴来一同开采这个蜜源。
观察蜂:也有叫非雇佣蜂、跟随蜂等,在等来数只采蜜蜂来招募时,观察蜂会在众多的采蜜蜂中选择一只跟随去开采采蜜蜂所发现的蜜源,直到该蜜源被开采完。
侦查蜂:不跟随任何其他蜜蜂,自己寻找蜜源,找到之后则会转变为采蜜蜂去招募观察蜂。
每只蜜蜂第t代的位置如下,每一个位置都代表一个蜜源,蜜源值越优对蜜蜂的吸引越大。
在大多数书和论文上都是这么描述的,可是,这有什么用?这些描述一点都不具体,完全无法按照这些描述精准的完成算法。
下面来说一下我的关键问题所在。
1.三种蜜蜂之间的角色如何转换?都说采蜜蜂能转换成侦查蜂,侦查蜂能转换成采蜜蜂,那么观察蜂能否转变成采蜜蜂和侦查蜂?
2.蜜源数量是否有上限?采蜜蜂每次找到蜜源后即转换为侦查蜂,若侦查蜂又可以搜寻新的蜜源,那么每次迭代后,都会新增采蜜蜂数量的蜜源,但是对一个蜜源的开采可能并不是一次迭代过程就能够完成的,那么会拥有大量的未被开采完甚至未被开采的蜜源,是否会造成资源浪费。
下面是我的实现方式(我的答案):
1. 三种蜜蜂之间可以相互转化。
采蜜蜂->观察蜂:有观察蜂在采蜜过程中发现了比当前采蜜蜂更好的蜜源,则采蜜蜂放弃当前蜜源转而变成观察蜂跟随优质蜜源,同时该观察蜂转变为采蜜蜂。
采蜜蜂->观察蜂:当该采蜜蜂所发现的蜜源被开采完后,它会转变为观察蜂去跟随其他采蜜蜂。
采蜜蜂->侦查蜂:当所有的采蜜蜂发现的蜜源都被开采完后,采蜜蜂将会变为侦查蜂,观察蜂也会变成侦查蜂,因为大家都无蜜可采。
侦查蜂->采蜜蜂、观察蜂:侦查蜂随机搜索蜜源,选择较好的数个蜜源位置的蜜蜂为采蜜蜂,其他蜜蜂为观察蜂。
2.蜜源的数量上限
蜜源的数量上限等于采蜜蜂的数量上限。初始化时所有蜜蜂都是侦查蜂,在这些侦查蜂所搜索到的蜜源中选出数个较优的蜜源,发现这些蜜源的侦查蜂变为采蜜蜂,其他蜜蜂变为观察蜂。直到所有的蜜源都被开采完之前,蜜源的数量不会增加,因为这个过程中没有产生侦查蜂。所有的蜜源都被开采完后,所有的蜜蜂再次全部转化为侦查蜂,新的一轮蜜源搜索开始。也可以在一个蜜源开采完时马上产生一个新的蜜源补充,保证在整个开采过程中蜜源数量恒定不变。
2.1蜜源的开采
蜜源的开采实际上就是观察蜂跟随采蜜蜂飞向蜜源的过程。得到的下一代的位置公式如下:
表示第i只观察蜂在第t代时随机选择第r只采蜜蜂飞行一段距离,其中R为(-1,1)的随机数。
2.2蜜源的选择
一只观察蜂在一次迭代过程中只能选择一只采蜜蜂跟随,它需要从众多的采蜜蜂中选择一只来进行跟随。观察蜂选择的策略很简单,随机跟随一只采蜜蜂,该采蜜蜂发现的蜜源越优,则选择它的概率越大。
是不是很像轮盘赌,对,这就是轮盘赌,同时我们也可以稍作修改,比如将勤劳的小蜜蜂改为懒惰的小蜜蜂,小蜜蜂会根据蜜源的优劣和距离以及开采程度等因素综合来选择跟随哪只采蜜蜂(虽然影响不大,但聊胜于无)。
忘记了轮盘赌的小伙伴可以看一下优化算法笔记(六)遗传算法。
下面是我的人工蜂群算法流程图
其实到最后才会发现,蜜蜂之间如何转换,按照何种策略从侦查蜂中选择采蜜蜂等等,对算法的性能和结果影响都不大。
蜂群算法的核心思想其实是观察蜂跟随采蜜蜂在蜜源周围的采蜜过程,即集中力量发展生产力才是最重要的,也可以说让一部分人先富起来,再让先富带动后富,实现共同富裕。
其他的参数如采蜜蜂的数量以及蜜源的最大开采程度也是只是影响了算法的全局-局部搜索精度和收敛速度。集中力量发展的方面较多,发展的速度就会较慢,发展的深度越深得到的结果越精确。但是一味最求深度必然会影响广度,必须在深度和广度之间做好平衡。
3. 实验
又到了实验环节,参数实验较多,全部给出将会占用太多篇幅,仅将结果进行汇总展示。
实验1:参数如下
参数 | 值 |
---|---|
问题维度(维度) | 2 |
蜂群数量(种群数) | 20 |
迭代次数(最大迭代次数) | 50 |
采蜜蜂最大数 | 10%,20%,30%,40%,50% 总群数 |
蜜源最大开采次数 | 60 |
取值范围 | (-100,100) |
实验次数 | 10 |
上图分别为采蜜蜂上限为10%总数和50%总数的情况,可以看出当采蜜蜂上限为10%总群数时,种群收敛的速度较快,但是到最后有一个点死活不动,这是因为该点作为一个蜜源,但由于适应度值太差,使用轮盘赌被选择到的概率太小从而没有得到更佳的蜜源位置,而因未开采完,采蜜蜂又不能放弃该蜜源。
看了看采蜜蜂上限为50%总群数时的图,发现也有几个点不动的状态,可以看出,这时不动的点的数量明显多于上限为10%总数的图,原因很简单,采蜜蜂太多,“先富”的人太多,而“后富”的人较少,没有带动“后富者”的“先富者”也得不到发展。
看看结果
采蜜蜂上限 | 最优值 | 均值 | 最差值 |
---|---|---|---|
10% | 2.7246701609773516E-4 | 0.03148418695322249 | 0.14939095776515166 |
20% | 2.738392784607894E-5 | 0.034678207336322917 | 0.22487475255209172 |
30% | 2.0064357050454994E-5 | 0.030860813779668102 | 0.16996661317938938 |
40% | 1.453883912235495E-4 | 0.02199654087939065 | 0.07422594736502292 |
50% | 9.28501533821353E-4 | 0.19582266625078354 | 0.7879489746465032 |
嗯,感觉结果并没有什么差别,可能由于问题较简单,迭代次数较少,无法体现出采蜜蜂数对于结果的影响,也可能由于蜜源的搜索次数为60较大,总群一共只能对最多20*50/60=16个蜜源进行搜索。我们将最大迭代次数调大至200代再看看结果
采蜜蜂上限 | 最优值 | 均值 | 最差值 |
---|---|---|---|
10% | 3.734568294857327E-11 | 4.2729655428076835E-7 | 2.033165476252375E-6 |
20% | 4.813275393712557E-10 | 8.800554109847244E-7 | 4.369403717638076E-6 |
30% | 7.53183905542997E-10 | 4.671766666435679E-7 | 2.044803420983268E-6 |
40% | 9.491398322676551E-9 | 2.5663373709208893E-6 | 9.861923272267325E-6 |
50% | 3.1942404020660714E-9 | 3.819585072332345E-6 | 3.0717059125095225E-5 |
当最大迭代次数为200时,人工蜂群算法的结果如上图,我们可以明显的看出,随着采蜜蜂上限的上升,算法结果的精度在不断的下降,这也印证了之前的结果,由于蜜源搜索次数较大(即搜索深度较深)采蜜蜂数量越多(搜索广度越多),结果的精度越低。不过影响也不算太大,下面我们再来看看蜜源最大开采次数对结果的影响。
实验2:参数如下
参数 | 值 |
---|---|
问题维度(维度) | 2 |
蜂群数量(种群数) | 20 |
迭代次数(最大迭代次数) | 200 |
采蜜蜂最大数 | 20% 总群数 |
蜜源最大开采次数 | 1,2,5,10,20 |
取值范围 | (-100,100) |
实验次数 | 10 |
上图分别是蜜源开采限度为1,20和4000的实验。
当蜜源开采上限为1时,即一个蜜源只能被开采一次,即此时的人工蜂群算法只有侦查蜂随机搜索的过程,没有观察蜂跟随采蜜蜂的过程,可以看出图中的蜜蜂一直在不断的随机出现在新位置不会向某个点收敛。
当蜜源开采上限为20时,我们可以看到此时种群中的蜜蜂都会向一个点飞行。在一段时间内,有数个点一动不动,这些点可能就是采蜜蜂发现的位置不怎么好的蜜源,但是在几次迭代之后,它们仍会被观察蜂开采,从而更新位置,蜜源开采上限越高,它们停顿的代数也会越长。在所有蜜蜂都收敛于一个点之后,我们可以看到仍会不断的出现其他的随机点,这些点是侦查蜂进行随机搜索产生的新的蜜源位置,这些是人工蜂群算法跳出局部最优能力的体现。
当蜜源开采上限为4000时,即不会出现侦查蜂的搜索过程,观察蜂只会开采初始化时出现的蜜源而不会采蜜蜂不会有新的蜜源产生,可以看出在蜂群收敛后没有出现新的蜜源位置。
蜜源开采上限 | 最优值 | 均值 | 最差值 |
---|---|---|---|
1 | 6.337994185481664E-8 | 0.05861357186812096 | 0.49990188473311625 |
2 | 5.293512648483095E-41 | 4.230581226891911E-6 | 4.163020392599152E-5 |
5 | 1.4674611682904505E-44 | 1.5470665541636557E-32 | 1.5390674100134358E-31 |
10 | 3.921568363593575E-27 | 1.1008071173291054E-22 | 6.647404140842794E-22 |
20 | 3.939678224553763E-18 | 2.0461861284987338E-14 | 1.7279556385292846E-13 |
4000 | 1.9806615835705686E-9 | 5.980622770720888E-5 | 3.3351556713991E-4 |
看看最终结果,我们发现,当蜜源开采上线大于1时的结果提升,但是好像开采上限为5时结果明显好于开采次数上限为其他的结果,而且随着开采次数不断上升,结果在不断的变差。为什么会出现这样的结果呢?原因可能还是因为问题较为简单,在5次开采的限度内,观察蜂已经能找到更好的蜜源进行开采,当问题较为复杂时,我们无法知晓开采发现新蜜源的难度,蜜源开采上限应该取一个相对较大的值。当蜜源开采限度为4000时,即一个蜜源不可能被开采完(开采次数为20(种群数)*200(迭代次数)),搜索的深度有了但是其结果反而不如开采限度为几次几十次来的好,而且这样不会有侦查蜂随机搜索的过程,失去了跳出局部最优的能力。
我们应该如何选择蜜源的最大开采次数限制呢?其实,没有最佳的开采次数限制,当适应度函数较为简单时,开采次数较小时能得到比较好的结果,但是适应度函数较复杂时,经过试验,得出的结果远差于开采次数较大时。当然,前面就说过,适应度函数是一个黑盒模型,我们无法判断问题的难易。那么我们应该选择一个适中的值,个人的选择是种群数的0.5倍到总群数的2倍作为蜜源的最大开采次数,这样可以保证极端情况下,1-2个迭代周期内小蜜蜂们能将一个蜜源开采完。
4. 总结
人工蜂群算法算是一个困扰我比较长时间的算法,几年时间里,我根据文献实现的人工蜂群算法都有数十种,只能说人工蜂群算法的描述太过模糊,或者说太过抽象,研究者怎么实现都说的通。但是通过实现多次之后发现虽然实现细节大不相同,但效果相差不多,所以我们可以认为人工蜂群算法的稳定性比较强,只要实现其主要思想即可,细节对于结果的影响不太大。
对于人工蜂群算法影响最大的因素还是蜜源的开采次数限制,开采次数限制越大,对同一蜜源的开发力度越大,但是分配给其他蜜源的搜索力度会相对减少,也会降低蜂群算法的跳出局部最优能力。可以动态修改蜜源的开采次数限制来实现对算法的改进,不过效果不显著。
其次对于人工蜂群算法影响是三类蜜蜂的搜索行为,我们可以重新设计蜂群的搜索方式来对算法进行改进,比如采蜜蜂在开采蜜源时是随机飞向其他蜜源,而观察蜂向所选的蜜源靠近。这样改进有一定效果但是在高维问题上效果仍不明显。
以下指标纯属个人yy,仅供参考
指标 | 星数 |
---|---|
复杂度 | ★★★★☆☆☆☆☆☆ |
收敛速度 | ★★★★★★☆☆☆☆ |
全局搜索 | ★★★★★★★★☆☆ |
局部搜索 | ★★★★★☆☆☆☆☆ |
优化性能 | ★★★★★★☆☆☆☆ |
跳出局部最优 | ★★★★★★☆☆☆☆ |
改进点 | ★★★★★☆☆☆☆☆ |