A first important step is to state your research objective in one understandable sentence.
重要的第一步是用一句好理解的话陈述你的科研目标。比如,如果你的目标是表现你可以设计出一个比谷歌更好的搜索引擎,那么你可能得更精确地定义什么是“更好”,并且更具体地制定你地假说。比如,你可能这样陈述你的假说,“用网站搜索结果里的社交网络信息更准确地对结果进行排序与不用这种信息的情况进行对比”。这个假说可以很容易被非计算机科学的人理解,并且可以确切地证明或者推翻。更具体地说,该假说可以进一步阐述成,“我的ABC算法用了用户的大量社交网络信息和超链接信息。我们预期ABC算法可以在它使用了格外的社交网络信息后得到比谷歌PageRank算法更好的网站排序结果”。
It is more advantageous to make your hypothesis more concrete.
假说越具体对你的科研越有益。第一,一个具体的假说帮助我们专注在几个重要的点上。比如,它促使我们尽可能清晰明了地制定方法论以及展现算法ABC。第二,它帮助我们决定必要地基准和评估指标去证明或推翻假说。比如,你可以这样制定方法--基于一个理论证明,无论PageRank算法在最终排序结果里提供了什么,你的ABC算法都能至少有一样好地结果。为了展现这点,你可能会意识到你需要一个广泛被接受地评估指标来比较网站排序结果。比如,你可能使用“Area Under the ROC Curve” (or the AUC measure) 作为一个排序指标。或者,你可能希望用一个名为 Normalized Discounted Cumulative Gain 地排序指标。不论选择使用哪种指标,你都需要在后续工作中证明你地ABC算法会展现出对比于PageRank 算法的重要优势。如果你更偏向理论研究,你可以寻找一些证明方法来帮助表现有一系列定理和推论支持你的假说。
In many cases, however, the hypothesis can only be answered empirically.
但是,在很多情况下,假说只能被实证。如果你采用这种方法,你将需要设计实验。第一,你需要证明数据集和样本是实验的必要数据。通常,原始的数据集