type
status
date
slug
summary
tags
category
icon
password
RNA-seq pipline 仅供参考
质控
fastqc
: fastqc增加线程对单个文件没有意义,对多个文件有意义,参考:https://www.jianshu.com/p/d31b82e760041. FastQC参数:
-o --outdir:输出路径
--extract:结果文件解压缩
--noextract:结果文件压缩
-f --format:输入文件格式.支持bam,sam,fastq文件格式
-t --threads:线程数
-c --contaminants:制定污染序列。文件格式 name[tab]sequence
-a --adapters:指定接头序列。文件格式name[tab]sequence
-k --kmers:指定kmers长度(2-10bp,默认7bp)
-q --quiet: 安静模式
multiqc
合并结果使用
fastp
软件进行质控过滤构建索引
使用
hisat2
构建索引比对
使用
hisat2
比对,并使用Samtools
软件将sam文件转换为bam文件output
42886886 reads; of these:
42886886 (100.00%) were paired; of these:
1395144 (3.25%) aligned concordantly 0 times
38285496 (89.27%) aligned concordantly exactly 1 time
3206246 (7.48%) aligned concordantly >1 times
----
1395144 pairs aligned concordantly 0 times; of these:
492650 (35.31%) aligned discordantly 1 time
----
902494 pairs aligned 0 times concordantly or discordantly; of these:
1804988 mates make up the pairs; of these:
886020 (49.09%) aligned 0 times
783953 (43.43%) aligned exactly 1 time
135015 (7.48%) aligned >1 times
98.97% overall alignment rate
reads计数
使用
subread
软件下的featurecounts
进行计数主要的参数:
-a 输入GTF/GFF基因组注释文件
-p 这个参数是针对paired-end数据
-F 指定-a注释文件的格式,默认是GTF
-g 从注释文件中提取Meta-features信息用于read count,默认是gene_id
-t 跟-g一样的意思,其是默认将exon作为一个feature
-o 输出文件
-T 多线程数
欢迎您在底部评论区留言,一起交流~
- 作者:mtnf
- 链接:https://mtnf100.top/article/4e91ce95-f588-47d0-ab28-c560d0bf9fee
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。