三架马车，经常上不去车

管道符号 |
帮助命令 --help

1 awk

1.1 筛选某几列变量输出

awk '{if(NR>1){FS="\t"; OFS="\t"; print "chr"$1, $2, $2}}'  SumGWAS.tsv > SumGWAS_hg38.bed

NR>1 跳过第一行，逻辑判断等于==，或不等于!=
OFS="\t"定义输出文件分割符，否则为默认空格
> 经常用，覆盖输出
$1 第几列变量，与字符串放一起直接在其前方添加
$2, $2 注意要有逗号，输出后为各自一列

1.2 变量简单处理成新格式

chr_pos_refAllele_othAllele （cut拆分chr1:12345）

awk '{if(NR<4) print NR"\t"$1"\t"$2"\t"$3+1"\t"$1"_"$2"_"$3"_"$4}'  file 

awk '{if(NR>1){OFS="\t"; print "chr"$1, $2, $2+1, NR}}'  file

awk -F "\t" '{if(NR>=1){OFS="\t"; print $1,$2,$3,$4,$5,$6,$7,$8,$1":"$2}}' file  > SummaryStat.tsv

1.3变量预览最小值

awk 'BEGIN {min = 2} {if(NR>=2){if ($10+0 < min+0) min=$10}} END {print "Min=", min}'  GWAS_info.tsv

参考求均值

1.n 题外--liftOver转换坐标参考基因组

liftOver `SumGWAS_hg38.bed` /opt/tools/seq-analysis/liftover/hg38ToHg19.over.chain `SumGWAS_GRCh37.bed` unMapped

liftOver `hg19.bed` /opt/tools/seq-analysis/liftover/hg19ToHg38.over.chain `GRCh38.bed` unMapped

注意去掉上面单引号``

当时是为了做liftOver，顺便记录在这里，此处有个坑
awk '{print $1"\t"$2"\t"$3+1}' old.bed > new.bed

解决方案搬运自https://www.jianshu.com/p/34d2c65d7b3f

2.1 grep查找

2.1grep 与 awk 匹配查找pattern

awk '{if($1=="chr2") print $0}' hg38.bed |head

awk '{if($1=="2") print NR,$0}'  file |head

2.2 grep正则表达式

^chr 行头
678$ 行尾
grep -n -C 1 'chrX:' file 显示行号，上下各一行
grep -w 精确匹配
grep -v 反选

参考文

2.3 grep查找多个并输出

grep -E 'MarkerName|5:146629145:A_G|20:52727953:A_C' GWAS.tsv > Selected.tsv

2.4 grep查找文件

grep -f

3 sed

据说sed可顶所有, 参考linux命令行文本操作一文就够

3.1原文件上替换，添加Header，删除行

sed -i 's/X/23/g' Temp

sed -i '1i chr\tstart\tend\tNR' Temp

sed -i '1d' Temp

3.2更改第一行某变量名，重新输出

cat M.tsv| sed '1 s/SNP/variant/g' > Temp

3.3 显示指定行号内容，显示分隔符

sed -n '5,10p' Temp.file
sed -n l Temp.file | head

4 其他

wc -l file1 file2 计数行数

4.1 sort 排序

awk -F "\t" '{if($7<=5e-8){print NR "\t" $0}}' FILE.tsv | sort -t $'\t' -k8 -g |head
sort -k8,8  -g  MetaResultWithHeader.tsv
sort -k1,1n -k2,2n  test > ChrX_1_10_11_20.result
sort -k3,3V按染色体chr1：22X排序

科学计数法的问题，-g
搬运工关于-k的讲解

4.2 join 拼接（类似于R merge）

需先确认是否排序

sort -c -k4,4n Temp
echo $?

join -1 4 -2 4 -a 1 GRCh38.bed  hg37.bed  > TempJoin

保留文件1全部记录-a 1，
指定行头 join --header
指定分隔符(输入+输出） join -t $'\t'

4.3 cut拆分（类似于strsplit）

awk '{print $1}' v2.tsv | cut  -c 4-20 | awk  '{FS=":";OFS="\t"}{if(NR>=2) {print $1,$2}}' > temp.tsv
sed -i "1i CHR\tGRCH38 " temp.tsv

4.4 paste合并不同文件（记录每行一一对应）

paste -d "\t" file1 file2

4. 跳过指定行数开始显示

wc -l file
cat -n file | tail -n + 1000 | head -n 2

CSDN社区

有空不妨多去看看：

linux命令行文本操作一文就够
by：熊+jimmy+SX 生信技能树 2017-12-14

(未完)

最后编辑于：2022.05.13 12:30:42

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 219,753评论 6赞 508
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,668评论 3赞 396
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 166,090评论 0赞 356
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 59,010评论 1赞 295
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 68,054评论 6赞 395
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,806评论 1赞 308
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,484评论 3赞 420
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,380评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,873评论 1赞 319
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 38,021评论 3赞 338
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,158评论 1赞 352
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,838评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,499评论 3赞 331
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 32,044评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,159评论 1赞 272
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,449评论 3赞 374
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 45,136评论 2赞 356