![240](https://cdn2.jianshu.io/assets/default_avatar/6-fd30f34c8641f6f32f5494df5d6b8f3c.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
其实这段代码我一直以来有一个问题:`model_lasso <- glmnet(x, y, family="binomial", nlambda=50, alpha=1)` 这里,为何family要选binomial?来自官方的说明:For binomial logistic regression, the response variable y should be either a factor with two levels, or a two-column matrix of counts or proportions. 在Glmnet官方示例文件中,载入数据的y是一个逻辑向量:`0 1 1 0 1 0 0 0 1 1 1 1 0 1 0 0 0 1 0 0 1 0 1 1 1 1 0 0 0 1 1 1 1 0 1 0 0 1 1 0 0 1 0 1 1 1 1 1 0 `这样的形势;这里对于表达组数据,我觉得family应该选“cox”更合适,这时候的y是一个两列矩阵,time/status,后者是一个binary变量,1代表死亡,0代表正常审查。survival包的`Sruv`方法可以产生这个矩阵。这也应该是我们最常用的类型。
clusterProfiler是业界大神Y叔写的R包,看过了它的绘图就会使人沉迷于其颜值无法自拔。本文很多内容直接翻译自官方文档,加上了我的测试数据(还是以果蝇为例)。 一、...