怎么说呢,看到这个题目,能想到比较明显的是又是挖SE中的数据建立开发者网络了,然后题目中一个比较关键的也算是比较重要的词就是verified。即这个research的结果是得到了现实世界的验证的。这个最起码可靠性是很好的。很多研究得到的结论往往由于验证困难或者代价大都没有verify这一块。另外,看本文的小标题,Fine-Grained,那意思就是大方向的工作已经有人做了,我的特色是什么呢,就是比你做的还细,即更细粒度。文章也确实如此,由原来的基于file-level的developer collaboration network(contrite to a common file)变成了function-level的network的挖掘。那你fine-grained有什么用呢,优势在哪儿,就肯定少不了对比。
回到community的挖掘,即network创建出来后,就是用community detect 算法来发现其中的community了哟。作者这里好像没用传统的方法,用的是OSLOM,因为其处理的是有向加权图。作者说没人在这个有向加权图上搞,这个是真的么?还搞了一大堆数学符号即一些概念用到的metrics等。这个就没看了。花了很多篇幅来跟file-level做对比,最后得到的结论就是呀,自己的function-level发现的community更好呀,也通过online survey那些发现的communities中的developer来验证其发现的额community确实就符号现实的community。好吧。你赢了。不过,也确实可能丢掉一些file-level的developer collaboration。
话说,guthub,git用的也真是太火了。看的好几篇文章都是直接从上面把大量数据搞下来。以后是不是也要努力从里面搞数据啊。
以上!
zou@Home
2015-07-19