赛业生物积累了大量的生物信息及基因编辑方面的数据,结合AI人工智能技术,建立了数据集和算法模型,目前开发的罕见病数据中心(RDDC)可进行人类基因突变的致病风险预测,通过预测模型还可得到导致疾病表型的突变位点,进而构建相关的细胞或动物模型进行验证,为基因治疗研究开展提供极大便利。
罕见病数据中心
罕见病数据中心(Rare Diseases Data Center, RDDC),是由清华珠三角研究院人工智能创新中心和赛业生物联合开发的关于罕见病相关研究的数据中心,涵盖了全球已公布的确诊疾病的流行病学数据、药物发展概况、疾病相关基因图谱、基因突变位点、疾病相关实验大小鼠模型等数据信息。同时,RDDC在对罕见病数据信息进行搜集整理和重构的基础上,又以疾病、基因和动物模型为主线,对相关数据信息进行了多维度的展示。此外,RDDC还充分利用现有已公开的遗传大数据资源,布局了基于人工智能与生物信息技术的遗传疾病相关基因诊断工具,包括突变致病性预测(PathoPredic)、突变剪接预测(RNA Splicer)等多种线上工具。
罕见病数据库优势
罕见病数据库开发背景
罕见病占所有疾病种类的2/3以上,在不同类型的疾病中,遗传性疾病,神经系统疾病和婴幼儿疾病中的罕见病种类最多,此外,除了肿瘤以外,所有类型疾病中的罕见病占比都达到了50%以上。另一方面,遗传病占据了罕见病种类中的大多数,遗传病和基因突变息息相关,因此对罕见病数据进行系统化的整理和分析有助于基因靶点的系统化研究,并为后续基因治疗手段的开发提供助力。
以上数据来自于MalaCards
中国生物医药研究人员使用的数据库大多来源于欧美,数据库重要性不亚于“芯片”,一旦国外实现封锁的话,这类核心数据就会成为生物医药产业发展的“卡脖子”问题。另外,由于人种差异,国外罕见病发病人群与中国人群发病数据并不完全一样,建立中国自己的罕见病数据库尤为重要。
RDDC数据库对生物医学研究中的主要数据库中疾病,基因,突变,临床表型,疾病模型等的信息进行了清理、重构和优化,构建了庞大而全面的罕见病基础信息系统。
RDDC罕见病数据库使用指南
全外报告:从报告中选择基因突变信息进行预测。
输入全外报告中的信息
预测结果展示
结论总结:突变致病性预测模型结果符合临床诊断。
全外报告:从报告中选择基因突变信息进行预测。
输入全外报告中的信息
预测结果展示
结论总结:RNA剪接模型预测的可变剪接符合湿实验结果。