生物数据挖掘(biological data mining),理学-物理学-〔物理学与其他学科的交叉〕-生物信息学,从与生物相关的大量的、不完全的、有噪声的、模糊的、随机的各种数据中,通过算法搜索隐藏在其中的有价值的生物信息、医疗信息和知识等的过程。生物数据挖掘是将数据挖掘应用于生物医学及生物信息学中,提出一系列专门针对生物数据的挖掘算法和挖掘模式,以期发现生物数据中的规律,并对分析结果进行解释、可视化和生物医学应用。生物数据挖掘是一门涉及面很广的新兴交叉学科,涉及生物学、医学、公共卫生、数据库、人工智能、数理统计、可视化、并行计算等领域。而数据挖掘利用了来自如下一些领域的思想:①数理统计学的抽样、估计和假设检验;②模式识别和机器学习的搜索算法、建模技术和学习理论;③人工智能领域的思想,包括最优化、深度搜索、贝叶斯概率模型等;④其他相关领域的思想,包括进化计算、信息论、图论、信号处理、可视化和信息检索等。适合大数据的处理技术包括:关联规则学习、分类、聚类分析、数据融合、自然语言处理、回归、信号处理、仿真、可视化、神经网络、深度学习等。