概率映射(probabilistic mapping),工学-信息与通信工程-大数据处理-大数据集成-模式映射-概率映射,源模式和目标模式之间可能的模式映射集合。模式映射描述了中介模式和数据源模式之间的映射关系。一个半自动的模式映射工具可能在模式和模式之间产生多个映射。为每个映射指定一个概率,多个映射属性可能映射到某个相同的属性,但是模式和模式中的其他属性都不相同。由于映射的正确性是不确定的,所以需要考虑查询结果中所有的映射。概率映射的形式化定义如下。设是关系模式。概率映射是一个三元组,式中,是集合,使得:①对于是和之间的映射,对每一个;②。是和之间的关系概率映射集合,式中和中的每一个关系至多在一个概率模式中出现。概率映射的语义主要可以从几个角度来理解。给定一个概率映射,有(至少)两种方法来解释模式映射的不确定性:①中的单个映射是正确的,并且它适合用于源中的所有数据;②中的多个映射是部分正确的,每个适合中元组的不同子集,而且不知道对于特定的元组哪个映射是正确的。对于包含多个解释的映射,其中的一个映射可能对所有数据是正确的。