层次狄利克雷过程(Hierarchical Dirichlet Processes; HDP),理学-计算机科学技术-人工智能-自然语言处理-文本挖掘-主题模型,实现了多文档之间共享无限多个聚类的模型。潜在狄利克雷分布(LDA)模型的非参数模型的推广。HDP的中餐馆连锁(CRF)构造即是为顾客分配餐桌和菜的过程,首先为每一位顾客分配餐桌,顾客选择就座于哪张餐桌和这张餐桌已有的顾客数成正比,同时顾客也可以选择一张新的餐桌就座。在分配完餐桌后,为每张餐桌分配菜,每道菜都有可能被点到,某道菜被点到的概率与已点用这道菜的餐桌个数成正比,同时也可能有新的菜被点到。HDP和狄利克雷过程一样,也可以由有限混合模型取极限得到。应用范围:由于具有很好的聚类性质,HDP算法在视频监控、图像理解和图像标注、文本分类、认知研究、信息检索等方面得到了广泛的关注和应用。层次狄利克雷过程是LDA模型的非参数模型的推广,它实现了多文档之间共享无限多个聚类。