原创 小果 生信果
欢迎点赞+收藏+关注
(资料图片)
生信人R语言学习必备
立刻拥有一个Rstudio账号
开启升级模式吧
(56线程,256G内存,个人存储1T)
在学习转录组分析时,你是否会被铺天盖地的软件搞得眼花缭乱呢,学习完一个再学习另一个,最后发现两者功能竟然是一样的!甚至有些软件已经不再适用于转录组分析,可是依然出现在推荐的教程里。今天小果就带领大家擦亮眼睛,告别“老腊肉”,迎接“小鲜肉”!
在介绍软件之前,小果先带大家复习一下转录组分析的流程。转录组分析是一种根据不同条件下基因表达水平的差异来研究基因功能的方法。在分析之前要准备好转录组测序数据、参考基因组(有参)、基因组注释文件,在这里小果要提醒一句参考基因组注释文件一定要和参考基因组是相同版本,不然容易报错哦!
有了数据后就可以进行后续的质控、比对、表达分析、差异分析以及富集分析。下面小果带大家来挑选每个环节使用的软件。
数据质控
原始数据质量的好坏直接决定了是否能得到理想结果,在数据质控环节常用的软件有FastQC、MultiQC、Trimmomatic、Cutadapt、FASTX_Toolkit, FastQC可以对测序原始数据进行质量检验,生成质量检测报告,是最常用的质控软件。
MultiQC工具可以将多个单独的FastQC结果整合为一个文件,方便统一查看同一批测序结果。
Trimmomatic、Cutadapt、FASTX_Toolkit三者均为对测序结果进行处理的软件,下面小果来给大家详细介绍一下这三位“神秘人”。
Trimmomatic
Trimmomatic适用于illumina二代测序数据的reads处理,主要对接头(adapter)序列和低质量序列进行过滤。Trimmomatic的参数并不多,从字面意思可以明白含义,自版本之后可自动识别碱基编码格式是phred33还是phred64。优点是操作简单、参数易懂。
FASTX-Toolkit
FASTX-Toolkit是用于短读FASTA / FASTQ文件预处理的命令行工具的集合。新一代测序数据通常包含多个短读序列。在将序列映射到基因组之前预处理FASTA / FASTQ文件有时能够提高效率从而得到更好的结果。但是要注意FASTX-Toolkit不支持压缩格式的输入文件;不允许序列中存在N碱基,这样的序列会自动去除;默认情况下认为FASTQ文件的碱基编码格式为phred64。总而言之FASTX-Toolkit参数众多,如果能够掌握可以提高工作效率,缺点就是容易报错,对小白不友好。
Cutadapt
Cutadapt是一个比较经典的能够对双端进行接头切除的软件,也可以删除primer、 polyA尾序列以及低质量序列。Cutadapt在去除接头方面非常专业,使用时要懂得一点测序原理,参数稍微有些复杂。
经过小果的讲解大家是否对转录组分析质控方面有了更多地了解呢,欢迎来和小果讨论哦!
“生信果”,生信入门、R语言、生信图解读与绘制、软件操作、代码复现、生信硬核知识技能、服务器、生物信息学的教程,以及基于R的分析和可视化等原创内容,一起见证小白和大佬的成长。
哈啰出行投资成立装饰工程公司 注册资本200万元
企查查APP显示,3月18日,上海钧住装饰工程有限公司成立,法定代表...中老铁路的背后 “税务专车”一路同行
2021年12月3日中老铁路正式开通运营,仅需...云南永善佛滩顺河梯级电站全面推进建设
日前,云南省永善县顺河村举行了佛滩顺河...人社部发布信用管理师国家职业技能标准
近日,人力资源和社会保障部对外发布了《...中国生态环境保护实现“十四五”起步之年良好开局
中国生态环境部7日在北京召开2022年全国...观察:中国首条民营控股高铁开通之“时”与“势”
杭台高铁首趟列车即将发车。张煜欢摄1月8...中国黄金消费市场渐回暖 “古法金”饰品获年轻消费者青睐
2022世界珠宝发展大会正在海口举行。8日在...宁吉喆:2021年中国GDP将连续第二年超百万亿元
中国国家发改委副主任兼中国国家统计局...北交所董事长徐明:北交所成立以来股票平均上涨98.9%
北京证券交易所董事长徐明8日表示,北交所...2021年北向资金流入超4300亿元 外资热情拥抱中国资产
尽管面临疫情反复等多重不利因素,外资在2...Copyright © 2015-2022 太平洋建筑工程网版权所有 备案号:豫ICP备2022016495号-17 联系邮箱:93 96 74 66 9@qq.com