数据转换
content <- unlist(content)
content <- as.character(content) #转换为字符
a[,4]<-as.numeric(a[,4]) #转换成数字
user_verified <- as.factor(data$user_verified) #将分类变量转换成因子
library(tmcn)
content <- toUTF8(content) #利用tmcn包中的toUTF8函数可转换成utf8编码
as.numeric(as.character(x)) #将因子型x转换成数值型,因子(factor)转换成数值型(numeric)的规则是这样的:一共有n个数,那么转换后的数字就会在1——n中取值,数字最小的取一,次小的取二,以此类推