1. eRNAFinder
eRNA分子在众多生物学过程中发挥重要作用,但由于eRNA分子表达水平低且不稳定,对eRNA进行鉴定非常困难。利用eRNA分子的双向转录特征,我们开发了eRNAFinder,通过整合表观组和转录组数据对eRNA分子进行准确鉴定和定量。eRNAFinder能够有效地从不同类型RNA分子中识别真实的eRNA分子,为开展eRNA研究提供计算支持。
2. MaxFlow
鉴定miRNA分子与人类疾病之间的关联,是理解疾病发病分子机制的重要步骤。然而,利用分子实验验证miRNA-疾病关联昂贵且耗时。为了克服传统实验方法的缺点,我们提出了一种组合优化算法(MaxFlow)来预测miRNA与疾病间的关联。MaxFlow无需事先输入疾病(miRNA)相关的miRNA(疾病),就可用于预测与疾病(miRNA)相关的miRNA(疾病)。MaxFlow可以准确揭示miRNA与疾病间的关联,为识别miRNA-疾病新联系提供强有力的计算工具。
3. DR2DI
发现已知药物新的候选疾病(药物重定位)是一种快速低风险的药物研发方式。临床实验发现老药物的新用法具有很大的偶然性和不确定性。因此,迫切开发理论计算方法系统准确的预测药物-疾病关联,指导下游临床实验。我们提出了一种基于相似性核分类器框架的计算工具(DR2DI),使用高维异质生物医学数据作为输入,准确揭示药物与疾病之间的潜在关联。DR2DI可以作为一种有效的生物信息学工具,识别潜在药物-疾病关联和指导药物重新定位。
4. KDDANet
大量介导已知药物-疾病关联(KDDA)的基因不能通过现有实验手段进行检测。识别这些基因(隐藏基因)对于理解疾病发病机制和指导药物重定位具有重要意义。我们设计了一个新型计算软件(KDDANet),通过最小花费最大流图优化算法,从基因互作网络的角度,系统准确地揭示介导KDDA的隐藏基因和细胞学通路。KDDANet能够为药物-疾病关联的分子机制提供新的见解,指导药物重定位和疾病治疗。
5. NetMiner
准确重建基因共表达网络对理解复杂疾病的分子机制和发现与疾病相关的关键基因具有重要意义。高通量转录组测序产生了大量的RNA-seq样本。然而,这些RNA-seq数据在重建基因共表达网络中的潜在优势尚未得到很好的探索。我们设计了一个基于ensemble机器学习的计算工具(NetMiner),使用大规模RNA-seq样本,整合三种常用的算法的推断结果,构建全基因组规模高质量基因共表达网络。NetMiner与其他算法相结合可用于预测未知基因的新功能,发现重要的药物标靶。