运行

运行示例

示例1:单细胞全序列转录组数据

为分析设置必要的配置文件,包括样本数据的路径、试剂类型、基因组索引、GTF等。使用以下命令运行SeekSoulTools:

seeksoultools fast run \
--fq1 /path/to/cellline/cellline_R1.fq.gz \
--fq2 /path/to/cellline/cellline_R2.fq.gz \
--samplename demo \
--genomeDir /path/to/GRCh38/star \
--gtf /path/to/GRCh38/genes/genes.gtf \
--chemistry DD-Q \
--include-introns \
--core 4

示例2:FFPE样本单细胞转录数据,使用--scoremin 0.2 --matchnmin 0.33

seeksoultools fast run \
--fq1 /path/to/ffpe/ffpe_R1.fq.gz \
--fq2 /path/to/ffpe/ffpe_R2.fq.gz \
--samplename demo \
--genomeDir /path/to/GRCh38/star \
--gtf /path/to/GRCh38/genes/genes.gtf \
--scoremin 0.2 \
--matchnmin 0.33 \
--chemistry DD-Q \
--include-introns \
--core 4

软件参数说明

参数

参数说明

–fq1

R1 fastq数据路径。

–fq2

R2 fastq数据路径。

–samplename

样本名称,会在outdir目录下创建以样本名称命名的目录。仅支持数字,字母和下划线。

–outdir

结果输出目录。默认值:./。

–genomeDir

STAR构建的参考基因组路径, 版本需要与SeekSoulTools使用的STAR一致。

–gtf

相应物种的gtf路径。

–rRNAgenomeDir

STAR构建的参考基因组路径,用于rRNA比例评估, 对于非人非鼠物种,该参数可以不指定,当不指定该参数时,用–genomeDir参数值进行核糖体信息统计。如果指定该参数吗,则版本需要与SeekSoulTools使用的STAR一致。

–rRNAgtf

相应物种的gtf路径,用于rRNA比例评估,同样该参数可以不指定。

–core

分析使用的线程数。

–chemistry

试剂类型,每种对应一组--shift--pattern--structure--barcode--sc5p的组合,可选值:DD-Q;
DD-Q 对应SeekOne® DD单细胞全序列转录组试剂盒。

–skip_misB

barcode不允许碱基错配,默认允许一个碱基错配。

–skip_misL

linker不允许碱基错配,默认允许一个碱基错配。

–skip_multi

舍弃能纠错为多个白名单barocde的reads,默认纠错为比例最高的barcode。

–expectNum

预估的捕获细胞数目。

–forceCell

当正常分析得到的细胞数⽬不理想时,选⽤此参数,后⾯加⼀个预期的数值N,SeekSoulTools软件会按照UMI从⾼到低取前N个细胞。

–include-introns

不启用时,只会选择exon reads⽤于定量;启用时,intron reads也会⽤于定量。

–star_path

指定其他版本的STAR路径进行比对,版本需要与--genomeDir版本兼容,默认的--star_path为环境下的STAR。

–scoremin

设置STAR比对时的--outFilterScoreMinOverLread参数,用于FFPE样本放宽比对要求。该参数根据比对得分来过滤掉一些可能是错误的比对。

–matchnmin

设置STAR比对时的--outFilterMatchNminOverLread参数,用于FFPE样本放宽比对要求。该参数根据reads比对上的碱基数来过滤一些部分比对的reads。