化学结构存储格式(chemical structure storage format),理学-化学-物理化学-化学信息学-化学结构存储格式,分子的化学结构的编码是实现计算机内化学文件存储和检索的基础,它是一种特殊的、化学特有的语言体系。根据编码原则和方法的不同,现行的编码方法可分为系统命名码、碎片码、线性码、拓扑码、连接表等。这些编码都具有不同的特点。系统命名码中最著名的是IUPAC系统码和CA索引码。其中,IUPAC系统码是由国际纯粹与应用化学联合会(IUPAC)规定的,而CA索引码是由美国化学文摘(CA)所提供的检索工具。IUPAC系统码不具有唯一性,CA索引码虽然有唯一性和单一性的特征,但它和IUPAC系统码一样,都不能很好地反映分子的结构特征。碎片码是将分子结构分割成不同的片段,利用不同片段编码的组合命名的一种编码,它基本上能满足用计算机来处理分子结构,但对于没有被定为碎片的子结构,则不能用于检索。线性码也具有不能检索子结构的缺陷。