想要训练一个好用的机器学习模型该怎么办?标注数据去吧!
是呀,数据不行,模型怎么能行?可是面对成千上万的数据只能看模型而叹气了。
有钱一起花,有数据当然一起标了,赶紧做一个简单的数据标注系统,发动组里的人一起标数据吧!
基本构造
还是传统的构造方法,有显示,有控制,还有数据库
前端页面
用于展现你要标注的数据,提交标注的结果(是,否,疑惑)的按钮,标注规则
后端控制
处理前端的标注结果并让前端发过去需要标注的数据
数据库
存放这要标记的数据,并且有这条数据的id 号,数据内容,标注结果,标注状态
实现工具
- 前端:HTML, jQuery,bootstrap
- 后端 : python flask
- 数据库:mysql
前端基本样式:
主要写的内容就是js
首先在加载的页面的时候需要让后台访问一次数据库,并把需要标注的数据返回
点击对应的按钮,给后台发送对应的数据,然后后台根据前端的指示进行数据库的操作并返回数据
后台的功能主要有两个
- 1 用于页面初始化的查询操作
- 2 用于点击按钮的处理操作
查询操作是数据库的select操作,而处理操作就是先把前端做的处理对数据库进行更新,然后查询一条没有标注的数据进行返回。
数据库的设计只需要有一个id主键,数据内容,标注的结果,还有对应的标注状态这么几条。
开始标注数据吧!
实现快,疗效好,这里就不放代码了。如果有人感兴趣可以留言,我给你们进行单独的介绍