映射-化简编程模型(MapReduce programming model),工学-信息与通信工程-大数据处理-大数据分析-Mapreduce编程模型,用于大规模数据集的并行运算的软件模型。美国谷歌(Google)公司在2004年提出的映射-化简(MapReduce)编程模型,是最具代表性的批处理模式。其主要思想是从函数式编程语言里借鉴的,还有从矢量编程语言里借鉴的特性。它极大地方便了编程人员在不懂分布式并行编程的情况下,将自己的程序运行在分布式系统上。软件实现是指定一个Map函数,把一组键值对映射成一组新的键值对,指定并发的Reduce函数,用来保证所有映射的键值对中的每一个共享相同的键组。一个完整的MapReduce过程是:MapReduce模型首先将用户的原始数据源进行分块,然后分别交给不同的Map任务区处理。Map任务从输入中解析出键值对集合,然后对这些集合执行用户自行定义的Map函数得到中间结果,并将该结果写入本地硬盘。Reduce任务从硬盘上读取数据之后,会根据键值进行排序,将具有相同键值的数据组织在一起。