Identifying DNA-binding Proteins Based on Feature Construction and Feature Selection

Abstract

DNA结合蛋白在分子生物学中扮演重要角色,其影响基因表达调控、DNA复制等活动。然而以生物实验的方式识别DNA结合蛋白,耗时且昂贵。数据分析的方式已成为识别DNA结合蛋白的重要途径。为提高DNA结合蛋白的识别性能,针对蛋白质序列数据特点,研究DNA结合蛋白识别问题中的特征工程,包括特征构造与特征选择。该特征工程能有效提高DNA结合蛋白的识别性能,为识别DNA结合蛋白提供了一种简便、高效的方法。论文主要包括以下几个方面。 1)特征构造:针对DNA结合蛋白序列之间低相似性、独立性、序列长度不同等特点,本文从物理化学特性、混沌游戏表示、分形维数、位置特异性得分矩阵和频谱分析五种不同角度的特征构造方...DNA-binding proteins play a vital important role in molecular biology, it has an impact on genes regulation, DNA replication and so on. However, DNA-binding proteins identified by experimental techniques, which are time-consuming and expensive.The method of data analysis has been becoming animportant way to identify DNA-binding proteins.In order to improving the identificationperformance, the feat...学位:工学硕士院系专业:航空航天学院_工程硕士(控制工程)学号:2322014115336

    Similar works