化合物性质预测(compound property prediction),理学-化学-物理化学-化学信息学-化合物性质预测,通过对已知化合物的结构和性质数据的采集,并采取一定的统计学或机器学习方法构建结构—性质关系预测模型,进而实现对未知化合物的物理化学性质、药代动力学性质和毒性等的预测。化合物性质预测的基本原理是化合物的结构决定性质,性质是结构的反映。在构建性质预测模型时,为了定量地描述化合物的结构特征,通常需要引入分子描述符、分子指纹等方式表征结构,接着采用合适的建模方法,如多元线性回归、偏最小二乘回归、支持向量机、朴素贝叶斯分类、深度学习等方法建立预测模型。选择适当的化合物的结构表征方式和建模方法是获得高精度预测模型的关键。与实验方法相比,使用该方法对化合物的性质进行预测具有明显的优势。首先,理论模型可以快速地对大量化合物进行预测,而且花费极低;其次,如果化合物的结构已知,即使未能拿到实物,也可以通过模型预测该化合物的性质。