摘要:当肽段的氨基酸序列长度不等时,建立活性肽定量构效关系(QSAR)模型具有一定困难。自交互协方差(ACCs)技术虽然能够建立肽段不等的模型,但是预测效果并不理想。本研究提出1种两端排序法(TTPN)。首先从数据库中查找序列长度最短的肽,以氨基酸数量为基准,分别对每条肽的C端和N端取基准数量的氨基酸残基,组成新的,用于表征其结构的序列。之后建立描述变量矩阵X,活性数据矩阵Y进行定量构效关系(QSAR)研究。为验证TTPN法的有效性及适用范围,收集并建立3个数据库:苦味肽(BT)数据库、降血压肽(ACE)数据库和ORAC法测定的抗氧化肽数据库。QSAR结果表明,在3个数据库中TTPN均比ACCs法能更好地描述肽序列(如ACE数据库中TTPN和ACCs的R2、Q2分别为0.724,0.599和0.329,0.038)。此外,TTPN还能够描述信息被部分或完全描述的序列(2-14和7-14数据库的R2、Q2分别为0.717,0.693和0.922,0.753)。综上所述,TTPN法不仅为序列不等长肽QSAR建模提供了1种有效的处理方法,而且与ACCs法相比,应用TTPN技术所建立的QSAR模型具有较好的分析和预测能力,应用范围广泛,且根据模型得出的活性肽结构特征更易于解释。