type
status
date
slug
summary
tags
category
icon
password
👉
RNA-seq pipline 仅供参考

质控

fastqc : fastqc增加线程对单个文件没有意义,对多个文件有意义,参考:https://www.jianshu.com/p/d31b82e76004
1. FastQC参数: -o --outdir:输出路径 --extract:结果文件解压缩 --noextract:结果文件压缩 -f --format:输入文件格式.支持bam,sam,fastq文件格式 -t --threads:线程数 -c --contaminants:制定污染序列。文件格式 name[tab]sequence -a --adapters:指定接头序列。文件格式name[tab]sequence -k --kmers:指定kmers长度(2-10bp,默认7bp) -q --quiet: 安静模式
 
multiqc合并结果
notion image
notion image
 
 
使用fastp软件进行质控过滤

构建索引

使用hisat2构建索引

比对

使用hisat2比对,并使用Samtools软件将sam文件转换为bam文件
 
🎯
output
42886886 reads; of these: 42886886 (100.00%) were paired; of these: 1395144 (3.25%) aligned concordantly 0 times 38285496 (89.27%) aligned concordantly exactly 1 time 3206246 (7.48%) aligned concordantly >1 times ---- 1395144 pairs aligned concordantly 0 times; of these: 492650 (35.31%) aligned discordantly 1 time ---- 902494 pairs aligned 0 times concordantly or discordantly; of these: 1804988 mates make up the pairs; of these: 886020 (49.09%) aligned 0 times 783953 (43.43%) aligned exactly 1 time 135015 (7.48%) aligned >1 times 98.97% overall alignment rate

reads计数

使用subread软件下的featurecounts进行计数
主要的参数:
-a 输入GTF/GFF基因组注释文件
-p 这个参数是针对paired-end数据
-F 指定-a注释文件的格式,默认是GTF
-g 从注释文件中提取Meta-features信息用于read count,默认是gene_id
-t 跟-g一样的意思,其是默认将exon作为一个feature
-o 输出文件
-T 多线程数
 
💡
欢迎您在底部评论区留言,一起交流~
 
BSA基因定位全代码 cCUT-TAG测试
  • Twikoo