最近研究了一下dataturks的数据库部分,现在来说一说自己的一些理解
首先看一看下图,里面显示了整个hope数据库有哪几张表。configs存储了设置信息;d_api_key是一张空表,暂时没发现是什么功能;d_hits存储了数据的索引信息;d_hits_result记录了标注信息;d_org_users记录了org和user的对应关系;d_orgs记录了org组织信息;d_project_invites记录邀请信息,也暂时没发现用处;d_project_users记录了project与用户的对应关系;d_projects记录了project信息;d_subscription_plans和d_subscription也暂时不知道用途。d_users记录了用户。
下面我就挑几张比较重要的表讲一下其结构。
1 configs表
configs表中存储了一些设置路径,如publicKey为公钥,fileUploadDir为文件上传路径,fileDownloadDir为文件下载路径,还有一些其他的设置。
2 d_hits表
d_hits里面是对数据的一个索引,由于一个数据可以有多个标注,所以通过建立单独的数据索引来降低数据库的冗余度。其中projectId对应d_projects中的id,指代该数据属于哪个project,id用于区分不同的样本。
3 d_hits_result
d_hits_result里面存储了标注结果。其中id用于区分不同的标注;hitId代表了不同的数据,即d_hits表中的id;projectId代表属于哪个project;result表示了标注结果;userid表示该标注的责任人;后面还记录了标注消耗的时间,用于计算每个人的标注速度。
以上就是比较重要的几张表了,由于平台比较干净没怎么操作过,所以有些表内还是空的,具体功能有待进一步发掘。
以上。