赛题信息:
随着空间组学、单细胞组学和基因组学等前沿技术的飞速发展,多组学工具和应用在维度、深度、广度上都有了很大提升和发展。然而,由于开发语言、环境和封装等差异的原因,科研人员与高校学生在探索多组学数据分析时,常遭遇分析工具开发困难,工具使用门槛高的挑战。为克服这些挑战,主办方希望参赛选手在参赛平台上进行多组学工具的开发,创建和共享具有应用价值大,影响力高,易用性好的工具或工具系列。大赛秉持以赛促训、以赛促学、以赛促教、以赛促创的理念,通过比赛,激发研究者之间的创新思维和实践能力,促进科学研究与教育教学的融合,推动从科研到教育的全链条发展。
工具系列作品示例:
单细胞流程分析工具系列:
scRNA-seq流程
scRNA-seq包括 scRNA-seq 数据下游分析之前涉及的处理和准备步骤,包括基因组比对、单个细胞的识别和量化、测序饱和度、质量控制、降维、聚类和注释。scRNA-seq 可以识别和表征不同的细胞类型、发现新的细胞群以及研究转录动力学和调控网络。
RefRead:检查将用于reads比对和表达定量的参考基因组文件,包括包含参考基因组Star软件索引的公共目录、参考基因组gtf文件等。
M280parseFastq:解析beads条形码umi和数据质量控制。
star:使用STAR来比对参考基因组。
anno:根据gtf文件注释reads以对齐基因组区域,umis校正并生成原始计数矩阵。
cleanAfteranno:删除多余文件以节省存储空间。
getM280UMI:这一步包括beads calling和合并。 在 scRNA-seq 中,beads通常用于捕获和分离单个细胞。 识别和过滤空滴和双峰,计算相似性并合并具有高相似性的beads。 bam 文件添加beads标签。
statSaturation:根据之前步骤生成的采样数据文件,计算组织覆盖区域的测序饱和度。
count:计算合并beads后细胞的基因表达量,对细胞和基因进行统计,输出三个标准矩阵文件供下游分析。
splice_matrix:如果选择注释内含子,则会有一个剪接RNA矩阵和一个RNA速度矩阵。 这两个矩阵文件可用于深入分析细胞发育轨迹和方向。
QC:计算细胞过滤后的质控信息,包括基因数、总umis数、线粒体百分比。
Cluster:单个细胞的降维、聚类及注释信息显示
报告: 生成 HTML Web 报告,整合每个步骤的分析结果,并显示关键统计指标、测序饱和度图、聚类分析和注释分析结果。
示例作品链接:https://cloud.stomics.tech/#/public/tool/detail/workflow/WF01202403042b7Erk/3.1.6
单细胞数据分析工具系列:
细胞注释(SingleR),差异分析(Seurat)和功能富集分析(clusterProfiler)
SingleR是一种对细胞注释的分析方法,在进行细胞注释后,差异分析和差异基因的功能富集通常是最为常见的分析流程。因此,本实例通过SingleR基于参考单细胞数据集注释空间组学数据。例如,我们使用小鼠大脑皮质空间组学数据作为待注释数据,使用小鼠大脑皮层单细胞数据作为参考数据集进行注释,并且可视化,进而利用Seurat 软件包对注释结果进行差异分析,并利用clusterProfiler软件包进行功能富集分析。该流程实现了从注释到差异分析结果的解读,可以广泛用在其他的单细胞数据分析中。
示例作品链接:https://cloud.stomics.tech/#/public/tool/detail/notebook/NB0120240326WKEr0k/--
非常抱歉!本站不支持旧版本IE浏览器~~建议使用IE10/IE11/Chrome/Firefox/Safari等高级浏览器浏览。