之前利用scrapy爬虫保存到mysql中,但是爬了很多重复数据,那如何在mysql中删除这些重复记录呢?我选择的方法是直接利用sql语句在原表中操作删除,没有新建一个表,重复的记录,保留最小ID那个,其他重复的删除,利用的语句为:
delete from 表名 where id not in (select minid from (select min(id) as minid from 表名 group by 根据那个字段来判断重复的字段名) b);
之前利用scrapy爬虫保存到mysql中,但是爬了很多重复数据,那如何在mysql中删除这些重复记录呢?我选择的方法是直接利用sql语句在原表中操作删除,没有新建一个表,重复的记录,保留最小ID那个,其他重复的删除,利用的语句为:
delete from 表名 where id not in (select minid from (select min(id) as minid from 表名 group by 根据那个字段来判断重复的字段名) b);