数据质量领域应该关注的信息

顶级学者

Samuel D. Gosling:University of Melbourne

代表论文:Amazon's Mechanical Turk A New Source of Inexpensive, Yet High-Quality, Data?


Michael D. Buhrmester:University of Oxford

代表论文:Identifying careless responses in survey data.

J. H. J. de Bruijne:European Space Research and Technology Centre

代表论文:Gaia Data Release 2. Summary of the contents and survey properties


顶级会议

SIGMOD、VLDB、HICSS、CTS、WWW

顶级期刊

Perspectives on Psychological Science

Behavior Research Methods

Nucleic Acids Research

顶级机构

Washington University in St. Louis

University of Texas at Austin

University of Oxford

推荐阅读论文


Gaia数据发布2:概述调查内容及调查性质

期刊论文2018Astronomy and Astrophysics

我们提供了第二次盖亚数据发布,盖亚DR2,包括天体测量学,光度学,径向速度,以及天体物理参数和变化的信息,亮度大于21星等。此外,还提供了太阳系中少量小行星的历元天体测量和光度测量。目的:对Gaia DR2的内容进行总结,并对Gaia DR1的差异进行讨论,并概述调查中仍然存在的主要局限性。对Gaia DR2结果的负责任使用提出了建议。方法:盖亚的原始数据收集工具在第一次22个月的任务已由盖亚处理数据处理和分析的财团(DPAC),变成第二个数据版本,代表一个重大进步对盖亚根据DR1的完整性、性能和丰富的数据产品。结果:Gaia DR2包含了大约17亿个光源的天体位置和G中的视亮度。对于其中的13亿个源,视差和固有运动是另外可用的。提供变异性信息的来源样本已扩大到50万颗恒星。本次数据发布包含四个新元素:14亿个源的宽带彩色信息,以GBP (330-680 nm)和GRP (630-1050 nm)波段的视亮度形式;给出了约700万个源的径向速度中值;估计有7700万到1.61亿个来源提供了恒星的有效温度、消光、红化、半径和光度;此外,我们还提供了太阳系中14000颗小行星的天文测量学和光度测量学。最后,Gaia DR2也代表了光学中的天体参照系Gaia- crf2的新物化,这是第一个仅基于河外源的光学参照系。与盖亚DR1有关的光度系统和目录源列表有显著的变化,我们强调需要将这两个数据发布视为独立的。结论:盖亚DR2代表了盖亚任务的主要成就,兑现了长期以来的承诺,为超过10亿颗恒星提供视差和适当的运动,这代表了盖亚调查中恒星样本的补充径向速度和天体物理源信息的可用性的第一步,盖亚调查覆盖了银河系的很大一部分体积。 

下一代无线系统的大规模MIMO

期刊论文2014IEEE Communications Magazine


与传统的点对点MIMO相比,多用户MIMO具有很大的优势:它与廉价的单天线终端一起工作,不需要丰富的散射环境,而且由于每个有源终端利用所有的时频箱,资源分配也简化了。然而,多用户MIMO,正如最初设想的那样,具有大致相等数量的服务天线和终端以及频分双工操作,并不是一种可扩展的技术。大规模MIMO(也称为大规模天线系统、超大MIMO、超MIMO、全维MIMO和ARGOS)通过在有源终端上使用大量多余的服务天线和时分双工操作,与当前的做法形成了彻底的突破。额外的天线有助于将能量集中到更小的空间区域,从而在吞吐量和辐射能量效率方面带来巨大的改善。大规模MIMO的其他好处包括广泛使用廉价的低功耗组件,减少延迟,简化MAC层,以及对故意干扰的鲁棒性。预期的吞吐量取决于向终端提供渐近正交信道的传播环境,但到目前为止,实验还没有揭示这方面的任何限制。虽然大规模的MIMO使得许多传统的研究问题变得无关紧要,但它揭示了亟需关注的全新问题:这些挑战包括:制造许多低成本、低精度的组件,使它们能够有效地协同工作;为新连接的终端进行采集和同步;利用多余的服务天线提供的额外自由度;以及寻找新的部署方案。本文概述了大规模多输入多输出的概念和当前的研究现状。

3.亚马逊的土耳其机器人:廉价高质量数据的新来源?

期刊论文2011Perspectives on Psychological Science


亚马逊(Amazon)的土耳其机械(Mechanical Turk, MTurk)是一个相对较新的网站,它包含了开展研究所需的主要元素:一个综合的参与者补偿系统;一个庞大的参与者池;研究设计、参与者招募和数据收集的简化过程。在这篇文章中,我们描述和评估MTurk对心理学和其他社会科学的潜在贡献。研究结果表明(a) MTurk参与者在人口统计学上比标准的互联网样本更多样化,并且明显比典型的美国大学样本更多样化;(b)参与受补偿率和任务期限的影响,但仍然可以迅速而廉价地征聘参与者;(c)实际补偿率不影响数据质量;(d)获得的数据至少与传统方法获得的数据一样可靠。总的来说,可以使用MTurk以廉价和快速的方式获取高质量的数据。

(参考资料:Data quality-研究方向详细 - 学术范 (xueshufan.com)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容