碎碎念-拐个弯的GEO处理

  • 如果R下载网速不快,可以考虑wget -c下载压缩包;
    1)现在windows10 应用商城有ubuntu的可兼容版本,适用了下,很好用;
    2)git版本,git bash here也很好用;
    3)有3点:a.我们下载的数据是从XXXseries_matrix.txt.gz提取的,而下载链接是有规律的;b.我们提取表达矩阵即非‘!’开头的行;c.提取表型信息即!Sample开头的行;
wget -c ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE5nnn/GSE5364/matrix/GSE5364_series_matrix.txt.gz
zcat GSE5364_series_matrix.txt.gz |grep '!Sample' >pd.txt
zcat GSE5364_series_matrix.txt.gz |grep -v '!' >ex.txt
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容