r和python都有横向、纵向合并的方法,当然也都有类似于SQL语句查询的一些列操作。,
例如,pandas中有非常好用的横纵向合并都行的concat方法,其中用来调整横纵向合并的参数是非常常见的(axis = 1),此外还有我也比较经常用的append方法、join、merge方法。
而在r中,则有cbind()、rbind(),这两种最简单的方法。当然它也有merge这种方法。
还有就是,今天为了用r里面的那个xlsx包,重新配置了一遍jdk环境。记得一年前的时候,在这上面耗了整整一天的时间。。。就是不知道哪里错了。。。后来照豆瓣上的一个分享,删了2个文件,改了一个txt之后就神奇地好了。但是应该是jdk8,现在是jdk13,不需要再在系统变量里面继续配置JRE,只需要在PATH里面加如\bin就好了,然后xlsx也就可以用了。
真几把方便啊。
再插一句话就是,jdk环境是不管是r还是python很多非常有用的package/module的编写语言,当初做xlsx,selenium这些玩意儿其实很多都是拿java来写的。。。可惜,我太菜了不会java。。。冯绪就对java了如指掌啊哈哈。
————————————————-分割线
此外,r中还有一个非常好用的数据筛选的方法:subset(x, subset, select = c(), drop = FALSE),这种方法和你对data.frame[bool]进行逻辑筛选得到的结果一摸一样。
btw,r中的逻辑判断,TRUE & FALSE are all in captions
除了subset,r中的抽样方法还有整群抽样和分层抽样,方法分别为:cluster(), starta()
r中的reverse可以用sort(x, decreasing = TRUE)来代替,其中x <- a vector,其中的parameter和python中不一样,python的关键词是descending,而r中式decreasing。。。