2022-12-27 【思路】简单记录一个R读入fastq数据的思路

R 处理fastq数据,简单搜索后找到了Biostrings和ShortRead两个包。
但是,如果想自己写函数读入fastq数据呢?我个人处理还是想将其读入后处理为向量或者数据框。
if或者for循环会造成R处理过慢。刚想的思路如下:

  • 按行读入为向量x
  • 对向量x的索引对4求余,构造一个向量y。该向量与读入数据等长,且内容只有1,2,3,0四个值。
  • 对向量y的值,用逻辑值从向量x中可以拆分出4个向量。
  • 拆分出的四个向量可以作为数据框的四列,且其顺序都是一一对应。

可以避免直接出现if或者for,可能处理速度会快一些。
就是简单记录个思路,有空再来实现(实现也不会出现在该平台)。
没用链接,这次总不能锁我了吧?

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 1.R中library和require的区别. library和require都可以载入包。在一个函数中,如果一个...
    启动子学生信阅读 2,047评论 0 1
  • 《R数据科学》的再次回顾学习,以及使用tidyverse过程中的一些new tricks学习记录。 [TOC] 前...
    Dawn_WangTP阅读 1,350评论 0 11
  • 安装程序包:install.packages("xxx") 加载程序包:> library(ggplot2) 查看...
    海阔天空周阅读 444评论 0 2
  • 一.R环境设置 尝试在线环境 你真的不需要设置自己的环境来开始学习R编程语言。 原因很简单,我们已经在线设置了R编...
    JackHCC阅读 545评论 0 0
  • 一.R环境设置 尝试在线环境 你真的不需要设置自己的环境来开始学习R编程语言。 原因很简单,我们已经在线设置了R编...
    JackHCC阅读 1,095评论 0 1