靶点预测与验证平台 | 基因治疗CRO | 赛业（苏州）生物科技有限公司

赛业生物积累了大量的生物信息及基因编辑方面的数据，结合AI人工智能技术，建立了数据集和算法模型，目前开发的罕见病数据中心（RDDC）可进行人类基因突变的致病风险预测，通过预测模型还可得到导致疾病表型的突变位点，进而构建相关的细胞或动物模型进行验证，为基因治疗研究开展提供极大便利。

罕见病数据中心

罕见病数据中心（Rare Diseases Data Center, RDDC），是由清华珠三角研究院人工智能创新中心和赛业生物联合开发的关于罕见病相关研究的数据中心，涵盖了全球已公布的确诊疾病的流行病学数据、药物发展概况、疾病相关基因图谱、基因突变位点、疾病相关实验大小鼠模型等数据信息。同时，RDDC在对罕见病数据信息进行搜集整理和重构的基础上，又以疾病、基因和动物模型为主线，对相关数据信息进行了多维度的展示。此外，RDDC还充分利用现有已公开的遗传大数据资源，布局了基于人工智能与生物信息技术的遗传疾病相关基因诊断工具，包括突变致病性预测（PathoPredic）、突变剪接预测（RNA Splicer）等多种线上工具。

罕见病数据库优势

关注治疗靶点：综合性生物医药研究数据库，重点关注医药研发上游致病机理和靶点发现。
AI工具开发：基于海量二代测序和疾病数据，利用机器学习和深度学习算法模型，构建以突变致病性预测和突变剪切改变预测为代表的基因数据辅助诊断模型。
核心信息切入：通过疾病、基因和动物模型三个切入点为生物医药研发提供信息获取便利。
高度可视化：提高研发者信息获取效率，颠覆传统生物类数据库只重数据，不重用户体验的弊端。
模块化设计：高度简洁性和交互性，模块化展示结合可视化，满足轻度用户提供快速直观了解所需信息的同时，通过大量交互设计，让深度用户也能便利挖掘深度信息，同时提供直观的相似数据比对相关的展示和筛选工具。

罕见病数据库开发背景

罕见病占所有疾病种类的2/3以上，在不同类型的疾病中，遗传性疾病，神经系统疾病和婴幼儿疾病中的罕见病种类最多，此外，除了肿瘤以外，所有类型疾病中的罕见病占比都达到了50%以上。另一方面，遗传病占据了罕见病种类中的大多数，遗传病和基因突变息息相关，因此对罕见病数据进行系统化的整理和分析有助于基因靶点的系统化研究，并为后续基因治疗手段的开发提供助力。

罕见病占疾病总数超过2/3