爬虫所取得的数据岑参不齐,编码也很乱,一个数据框中有好几个编码。
R语言对中文支持比较差,在把数据框整个的插入MySQL中时最容易出现乱码,不好调节,所以最好的办法时利用SQL语句对数据框中的数据一条一条的插入到MySQL中。如果,某一条数据出现乱码,单独对这一条进行转码再插入。
strSQL <- paste(
'insert into ziti (ID,job_name,job_saray,job_space,job_ex,job_ed) values',
paste(x,ziti$job_name[i],ziti$job_saray[i],ziti$job_space[i],ziti$job_ex[i],ziti$job_ed[i]),collapse=', '),sep = ' ')
dbSendQuery(con, strSQL)