数据分析是问题导向的,好的问题能够引领出好的结果,坏的问题可能导致资源和时间的浪费。好问题通常具备以下五个特征,不仅在数据分析领域,在一般意义上对解决问题都有帮助:
- 你的听众感兴趣。
你的问题必须是你的听众感兴趣的,问到心里去的。这将迫使自己思考谁是你的听众,他或她关注什么。
- 还没有被很好地回答。
不要自大,你要解答的问题,很可能在互联网上或研究报告数据库的某个角落已经有一个大神很好地回答了。或者你所在的组织内部有人已经思考了很久。在你着手回答之前,还是向他们请教。
- 可信性。
设想一下如果你的问题已经得到很好的回答,能否很好地解释组织面临的问题,或者对现有的问题有一个有价值的建议。如果没有,那么重新提炼你的问题。不要把实验和数据资源浪费在一个坏问题上。这是优化分析资源的一个很好建议。
- 可解答的。
有些问题难度很大但又是我们经常会问道的,这种问题尤其要警惕。例如在医学领域,很自然的问题是“人体某种机制是如何运行的”,或“某种疾病的致病机理是什么”这些问题直白但通常难以回答。除非你有拿诺贝尔奖的勇气和执着。再比如很多伦理相关的问题,其实很难回答,涉及这些问题要慎之又慎。
5.尖锐和特殊的问题。
尖锐的问题是指具有特殊性的问题,对关注的研究对象或问题的特殊性把握得准确。例如“饮食是否能促进健康?”,这就是一个很一般的问题,没有特殊性。如果改为“每天多摄入5分蔬菜是否能减少呼吸感染性疾病?”这就是一个具体的问题。具体的问题也便于设计实验和收集数据。好的特殊性问题能够较容易地得到定义好的干预措施。例如如果上个问题答案是肯定的,那么干预措施也很容易制定,只要每天多吃五分蔬菜。