25 research outputs found
Residuos dinámicamente importantes en la diversidad conformacional de proteínas
Las propiedades de flexibilidad y dinámica de las proteínas han sido desde hace tiempo asociadas a sus funciones biológicas. Estas propiedades han sido originalmente usadas para explicar la heterogeneidad de las propiedades de unión de la seroalbúmina bovina por Kurush en 1950 y su descripción formal fue incluida en el clásico modelo de Monod-Wyman-Changeux de regulación alostérica, también conocido como modelo de pre-equilibrio. Actualmente está bien establecido que la forma funcional de una proteína, normalmente conocida como el estado nativo, no es única. El concepto de “embudo” propuesto por Wolynes et al. en 1995 ha sido utilizado para explicar los canales de plegamiento de las proteínas considerando un “fondo de potencial rugoso” representando al conjunto de isómeros conformacionales. El grado de la diversidad conformacional de una proteína puede entonces relacionarse con la extensión de la “rugosidad del fondo del embudo”. La distribución de los confórmeros en este potencial ha sido previamente asociada al plegamiento, la historia evolutiva, y la presencia de ciertas mutaciones. Actualmente, los conceptos antes mencionados han derivado en la noción de la preexistencia de poblaciones de confórmeros en equilibrio dinámico (dinamismo) sobre la superficie de energía potencial de una proteína. Este equilibrio dinámico soporta la hipótesis de la unión del ligando a una conformación específica de mayor afinidad y ofrece una visión central que permite explicar la función biológica. La dinámica vibracional intramolecular asociada a cada conformación garantiza las transiciones conformacionales que, debido a su importancia, podrían estar asociadas con rasgos conservados evolutivamente. El análisis de modos normales, basado en un modelo de “grano grueso” de la proteína, puede proporcionar la información necesaria para explorar estas características. En la primer parte de la tesis presentamos un nuevo procedimiento para identificar residuos en posiciones clave para el mantenimiento de la diversidad conformacional asociada a la unión al ligando. El método se aplicó a un conjunto de 188 pares de estructuras de proteínas, cristalizadas con y sin ligando. En primer lugar, se seleccionaron los modos normales implicados en el cambio conformacional de acuerdo con las distorsiones estructurales introducidas por unión al ligando. El subespacio definido por estos modos se utilizó para analizar el efecto de mutaciones puntuales en la conservación de la diversidad conformacional de la proteína. Definimos las posiciones cuyas mutaciones alteran en mayor medida estos subespacios como posiciones claves, es decir, son residuos dinámicamente importantes que median el cambio conformacional de unión al ligando. Encontramos una correlación negativa entre la conservación evolutiva de los residuos de una proteína y el impacto de sus mutaciones sobre los subespacios de modos normales asociados a la unión del ligando. Estas posiciones se muestran conservadas evolutivamente, en su mayoría son residuos con baja exposición al solvente, alifáticos y localizados en estructuras regulares de la proteína como hoja-β y hélice-α . Durante la segunda etapa del doctorado, combinamos la información obtenida de métodos basados en propiedades estructurales y dinámicas de proteínas con información relacionada con redes de interacciones de residuos. La representación de la estructura proteica como red facilita la búsqueda de determinantes topológicos, que pueden estar relacionados con residuos funcionalmente importantes. Cada estructura proteica de nuestro set de estudio se representó como una red de contacto de residuos y se realizó un análisis exhaustivo de las propiedades de la red. Se analizaron tres parámetros topológicos de redes, Grado, Centralidad de Intermediación y Proximidad Central. Particularmente los últimos dos se han previamente utilizado en diversos trabajos para identificar residuos funcionales ya que la Centralidad de Intermediación refleja el control que ejerce un nodo sobre las interacciones de otros nodos en la red y la Proximidad Central se asocia a cuan rápido se propaga la información desde un nodo dado a otros nodos alcanzables en la red. Estudiamos la correlación de estos parámetros topológicos de redes con nuestro parámetro para definir mutaciones que alteran en mayor medida el subespacio de modos normales asociado a la unión al ligando. Además, analizamos la correlación entre la conservación evolutiva y el área de accesibilidad al solvente, con estos parámetros topológicos. Encontramos una buena correlación entre los efectos de las mutaciones en los subespacios de modos normales asociados a la unión del ligando y los parámetros topológicos de redes. Estos parámetros han sido utilizados para predecir con éxito sitios activos o sitios funcionales en varias proteínas. Esto apoya nuestro método para detectar residuos dinámicamente importantes que median el cambio conformacional de unión al ligando. Determinamos que los residuos dinámicamente relevantes tienden a estar interconectados, por lo que es posible definir redes de residuos que modulan dinámicamente los cambios conformacionales. Como etapa final de la tesis, exploramos las posiciones claves que sustentan la estabilidad dinámica de la estructura homotetramérica de la Transtiretina Humana. El estado nativo de la Transtiretina presenta dos sitios de unión a la hormona tiroxina, que son generados por la interfaz dímero-dímero, mediante interacciones débiles. La disociación de la estructura tetramérica es el primer paso del proceso de formación de fibrillas de amiloide. Un gran número de mutaciones puntuales por desestabilizar la estructura cuaternaria del tetrámero muestran efectos pro-amiloidogénicos. Basándonos en el análisis de modos normales y su respuesta a las perturbaciones locales hemos identificado las posiciones cuyas mutaciones alteran en mayor medida la dinámica de equilibrio del tetrámero de Transtiretina. Encontramos que estas posiciones están localizadas principalmente en las hojas-β E y F, del monómero de Transtiretina y el loop entre estas estructuras secundarias. Determinamos que la interfase monómero-monómero es una de las regiones más vulnerables, ya que mutaciones en residuos de esta región conducen a cambios significativos en la dinámica de equilibrio del tetrámero y, por lo tanto, favorece la disociación de la estructura. Además, hemos encontrado que las mutaciones en los residuos localizados en la interfaz dímero-dímero y/o en el sitio de unión a la hormona tiroxina desestabilizan al tetrámero más que el promedio. La unión de la tiroxina estabiliza la estructura tetramérica estableciendo interacciones con los residuos en la interfaz dímero-dímero. Debido a esto se han propuesto varios compuestos como drogas en la terapia de la amiloidosis por Transtiretina, siendo clave la afinidad por el sitio unión del tetrámero, y por tanto, la contribución a la integridad de la estructura. Comparamos varios compuestos de acuerdo a su efecto sobre las vibraciones asociadas a la unión del ligando. Discutimos y analizamos nuestra comparación de drogas en términos de parámetros y mediciones asociadas a las afinidades de unión al ligando y la estabilización del estado nativo del tetrámero de Transtiretina. A pesar de la presencia en el tetrámero de dos sitios de unión idénticos, la unión de la tiroxina en solución se caracteriza por una fuerte cooperatividad negativa. La flexibilidad estructural del tetrámero, simulada mediante el análisis de modos normales, expuso patrones vibratorios asimétricos en ambos dímeros. Las fluctuaciones térmicas revelan diferencias en el tamaño y la flexibilidad de las cavidades de unión de los ligandos en la interfaz dímero-dímero. Es decir, pequeñas diferencias estructurales entre los dímeros, o monómeros pueden conducir a diferencias funcionales significativas en la dinámica del tetrámero de Transtiretina.Fil: Saldaño, Tadeo Enrique. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología; Argentin
Analysis of changes of cavity volumes in predefined directions of protein motions and cavity flexibility
Dynamics of protein cavities associated with protein fluctuations and conformationalplasticity is essential for their biological function. NMR ensembles, molecular dynamics (MD) simulations, and normal mode analysis (NMA) provide appropriate frameworks to explore functionally relevant protein dynamics and cavity changesrelationships. Within this context, we have recently developed analysis of null areas(ANA), an efficient method to calculate cavity volumes. ANA is based on a combination of algorithms that guarantees its robustness against numerical differentiations.This is a unique feature with respect to other methods. Herein, we present anupdated and improved version that expands it use to quantify changes in cavity features, like volume and flexibility, due to protein structural distortions performed onpredefined biologically relevant directions, for example, directions of largest contribution to protein fluctuations (principal component analysis [PCA modes]) obtained byMD simulations or ensembles of NMR structures, collective NMA modes or anyother direction of motion associated with specific conformational changes. A webpage has been developed where its facilities are explained in detail. First, we showthat ANA can be useful to explore gradual changes of cavity volume and flexibilityassociated with protein ligand binding. Secondly, we perform a comparison study ofthe extent of variability between protein backbone structural distortions, andchanges in cavity volumes and flexibilities evaluated for an ensemble of NMR activeand inactive conformers of the epidermal growth factor receptor structures. Finally,we compare changes in size and flexibility between sets of NMR structures for different homologous chains of dynein.Fil: Barletta Roldan, Patricio German. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaFil: Barletta, Matias. Lionix Evolve; Costa RicaFil: Saldaño, Tadeo Enrique. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; ArgentinaFil: Fernández Alberti, Sebastián. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentin
Network analysis of dynamically important residues in protein structures mediating ligand-binding conformational changes
According to the generalized conformational selection model, ligand binding involves the co-existence of at least two conformers with different ligand-affinities in a dynamical equilibrium. Conformational transitions between them should be guaranteed by intramolecular vibrational dynamics associated to each conformation. These motions are, therefore, related to the biological function of a protein. Positions whose mutations are found to alter these vibrations the most can be defined as key positions, that is, dynamically important residues that mediate the ligand-binding conformational change. In a previous study, we have shown that these positions are evolutionarily conserved. They correspond to buried aliphatic residues mostly localized in regular structured regions of the protein like β-sheets and α-helices. In the present paper, we perform a network analysis of these key positions for a large dataset of paired protein structures in the ligand-free and ligand-bound form. We observe that networks of interactions between these key positions present larger and more integrated networks with faster transmission of the information. Besides, networks of residues result that are robust to conformational changes. Our results reveal that the conformational diversity of proteins seems to be guaranteed by a network of strongly interconnected key positions rather than individual residues.Fil: Saldaño, Tadeo Enrique. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad Nacional de Quilmes; ArgentinaFil: Tosatto, Silvio C. E.. Università di Padova; ItaliaFil: Parisi, Gustavo Daniel. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad Nacional de Quilmes; ArgentinaFil: Fernández Alberti, Sebastián. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad Nacional de Quilmes; Argentin
Expanding the repertoire of human tandem repeat RNA-binding proteins.
Protein regions consisting of arrays of tandem repeats are known to bind other molecular partners, including nucleic acid molecules. Although the interactions between repeat proteins and DNA are already widely explored, studies characterising tandem repeat RNA-binding proteins are lacking. We performed a large-scale analysis of human proteins devoted to expanding the knowledge about tandem repeat proteins experimentally reported as RNA-binding molecules. This work is timely because of the release of a full set of accurate structural models for the human proteome amenable to repeat detection using structural methods. The main goal of our analysis was to build a comprehensive set of human RNA-binding proteins that contain repeats at the sequence or structure level. Our results showed that the combination of sequence and structural methods finds significantly more tandem repeat proteins than either method alone. We identified 219 tandem repeat proteins that bind RNA molecules and characterised the overlap between repeat regions and RNA-binding regions as a first step towards assessing their functional relationship. We observed differences in the characteristics of repeat regions predicted by sequence-based or structure-based methods in terms of their sequence composition, their functions and their protein domains
Exploring conformational space with thermal fluctuations obtained by normal-mode analysis
Proteins in their native states can be represented as ensembles of conformers in dynamical equilibrium. Thermal fluctuations are responsible for transitions between these conformers. Normal-modes analysis (NMA) using elastic network models (ENMs) provides an efficient procedure to explore global dynamics of proteins commonly associated with conformational transitions. In the present work, we present an iterative approach to explore protein conformational spaces by introducing structural distortions according to their equilibrium dynamics at room temperature. The approach can be used either to perform unbiased explorations of conformational space or to explore guided pathways connecting two different conformations, e.g., apo and holo forms. In order to test its performance, four proteins with different magnitudes of structural distortions upon ligand binding have been tested. In all cases, the conformational selection model has been confirmed and the conformational space between apo and holo forms has been encompassed. Different strategies have been tested that impact on the efficiency either to achieve a desired conformational change or to achieve a balanced exploration of the protein conformational multiplicity.Fil: Saldaño, Tadeo Enrique. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología; ArgentinaFil: Freixas Lemus, Victor Manuel. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología; ArgentinaFil: Tosatto, Silvio C. E.. Università di Padova; ItaliaFil: Parisi, Gustavo Daniel. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología; ArgentinaFil: Fernández Alberti, Sebastián. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad Nacional de Quilmes. Departamento de Ciencia y Tecnología; Argentin
Fig 6 -
A) Amino Acid composition in regions with low and high pLDDT scores among the 219 RNA-binding tandem repeat proteins. B) Amino acid composition in regions with low and high pLDDT scores among the whole human proteome dataset, as well as for the complete sequences. C) Amino acid enrichment in regions with low and high pLDDT scores among RNA-binding tandem repeat proteins with respect to the whole human dataset. All values above 1 indicate an amino acid enrichment in RNA-binding tandem repeat proteins compared to the human proteome dataset. The opposite holds true for values below 1.</p
An example of a protein (LRPPRC, UniProtKB: Q9BZE4) forming a repetitive structural pattern that is only detected by sequence-based methods.
A) Structural visualisation coloured according to the pLDDT score scheme: orange (pLDDTpLDDTpLDDT 90). B) Van der Waals surface representation, where the negatively charged residues are highlighted in red, while those with a positive charge are highlighted in blue.</p
An example of an RNA-binding tandem repeat protein (UniProtKB: O00567) predicted as repetitive by both types of methods.
It shows the larger coverage of repeats defined by structural methods, and the small overlap with the regions predicted as repetitive by sequence-based methods. The region corresponding to an RBDpep is highlighted in red. The “Merge” row corresponds to the union of the tandem repeats predicted by different methods. In the row corresponding to the pLDDT score, the segments are coloured according to the following scheme: orange (pLDDTpLDDTpLDDT 90).</p
Distribution of pLDDT scores across the 219 RNA-binding tandem repeat proteins, split by repeat prediction method and region (whole protein or trRBDpeps).
As in the AlphaFoldDB website, the orange bar corresponds to the amount of residues among the dataset with a pLDDT score 90. A) pLDDT score profile for the whole set of RNA-binding tandem repeat proteins predicted as repeated by sequence-based methods. B) pLDDT score profile for trRBDpeps of proteins predicted as repeated by sequence-based methods. C) pLDDT score profile for the whole set of RNA-binding tandem repeat proteins predicted as repeated by both types of methods. D) pLDDT score profile for trRBDpeps of proteins predicted as repeated by both sequence and structure-based methods. E) pLDDT score profile for the whole RNA-binding tandem repeat proteins subset predicted as repeated by structure-based methods. F) pLDDT score profile for trRBDpeps of proteins predicted as repeated by structure-based methods. G) Distribution of pLDDT scores across the whole human dataset (20,264 proteins).</p