Transcriptome:数据预处理
Transcriptome:数据预处理

Transcriptome:数据预处理

转录组分析-测序数据预处理

本操作最关键是检查每一步文件的大小!!!

1、从公司获得Rawdata和cleandata,rawdata到cleandata经过了质控的过程。本次将直接从cleandata开始进行分析。(此步骤上传服务器的话,需要检查文件是否都上传成功:md5sum -c md5.txt)

image-20240626002242978

2、检查cleandata文件大小是否符合,解压后的fastq文件基本在7G左右(解压时间较长),简化文件名,Windows可以用7-zip软件批量解压缩。也可以上传后再进行解压缩和重命名(去掉前缀和后缀):参考第3步骤。

image-20240626003222206

3、利用vim将如下代码写入.sh文件,进行解压缩和重命名。

4、利用WinSCP将fastq文件上传到服务器指定文件夹中(上传时间较长),可根据需要,分别传入多个文件夹(以当前服务器大小来算,比对时一次最好处理18个fastq文件,多了容易蹦)

image-20240626003446307

5、上传完成后,使用ll -h检查文件的大小和数量。

image-20240626003716254

6、安装miniconda:

下载Miniconda3最新版本:

#-c:下载大文件或不稳定网络环境下非常有用,可以避免重新下载整个文件

验证 Miniconda 是否成功安装:

7、增加多个下载通道channels

展示已增加的通道:

使用conda不同通道下载安装软件的命令通常是(以bioconda为例)

8、利用miniconda创建一个名为rna的python环境,版本为2(也可以为3,对应的是python3版本)

9、rna环境使用(环境的作用是进行软件的管理)

激活环境:

退出当前环境:

 

发表回复