按需集成(integration on demand),工学-信息与通信工程-大数据处理-大数据集成-按需集成,针对即时性的查询需求设计的数据集成方法。越来越多的企业和组织都选择依托开放互联网实现动态业务协作,即时共享业务数据,实现跨域数据的动态集成。集成需求具有临机性、即时性的特点,往往需要用户的参与。由于数据源的自治性、异构性,使集成需求与用户之间存在鸿沟,因此按需集成的目标就是提供用户和数据源之间的沟通桥梁,根据用户的需求为用户提供统一的访问途径。其技术基础依然是数据集成中的常见技术,基本分为3层,即查询执行、数据源描述和接口集成。其中把查询转换为实际需求去执行的查询搜索引擎发挥了重要作用。按需集成的查询搜索引擎设计一般由自然语言处理、结构查询语言生成和查询转换3个功能模块组成。自然语言处理模块接收用户输入的自然语言或类自然语言需求,利用自然语言处理技术将其进行分词、词性标注、词汇归类等操作,最终产生构造结构查询语言(structure query language,SQL)所需的若干关键词及相应的约束。