2,455 research outputs found
Chemoinformatics Research at the University of Sheffield: A History and Citation Analysis
This paper reviews the work of the Chemoinformatics Research Group in the Department of Information Studies at the University of Sheffield, focusing particularly on the work carried out in the period 1985-2002. Four major research areas are discussed, these involving the development of methods for: substructure searching in databases of three-dimensional structures, including both rigid and flexible molecules; the representation and searching of the Markush structures that occur in chemical patents; similarity searching in databases of both two-dimensional and three-dimensional structures; and compound selection and the design of combinatorial libraries. An analysis of citations to 321 publications from the Group shows that it attracted a total of 3725 residual citations during the period 1980-2002. These citations appeared in 411 different journals, and involved 910 different citing organizations from 54 different countries, thus demonstrating the widespread impact of the Group's work
Dissimilarity-based algorithms for selecting structurally diverse sets of compounds
This paper commences with a brief introduction to modern techniques for the computational analysis of molecular diversity and the design of combinatorial libraries. It then reviews dissimilarity-based algorithms for the selection of structurally diverse sets of compounds in chemical databases. Procedures are described for selecting a diverse subset of an entire database, and for selecting diverse combinatorial libraries using both reagent-based and product-based selection
Optimiertes Design kombinatorischer Verbindungsbibliotheken durch Genetische Algorithmen und deren Bewertung anhand wissensbasierter Protein-Ligand Bindungsprofile
In dieser Arbeit sind die zwei neuen Computer-Methoden DrugScore Fingerprint (DrugScoreFP) und GARLig in ihrer Theorie und Funktionsweise vorgestellt und validiert worden.
DrugScoreFP ist ein neuartiger Ansatz zur Bewertung von computergenerierten Bindemodi potentieller Liganden für eine bestimmte Zielstruktur. Das Programm basiert auf der etablierten Bewertungsfunktion DrugScoreCSD und unterscheidet sich darin, dass anhand bereits bekannter Kristallstrukturen für den zu untersuchenden Rezeptor ein Referenzvektor generiert wird, der zu jedem Bindetaschenatom Potentialwerte für alle möglichen Interaktionen enthält. Für jeden neuen, computergenerierten Bindungsmodus eines Liganden lässt sich ein entsprechender Vektor generieren. Dessen Distanz zum Referenzvektor ist ein Maß dafür, wie ähnlich generierte Bindungsmodi zu bereits bekannten sind. Eine experimentelle Validierung der durch DrugScoreFP als ähnlich vorhergesagten Liganden ergab für die in unserem Arbeitskreis untersuchten Proteinstrukturen Trypsin, Thermolysin und tRNA-Guanin Transglykosylase (TGT) sechs Inhibitoren fragmentärer Größe und eine Thermolysin Kristallstruktur in Komplex mit einem der gefundenen Fragmente.
Das in dieser Arbeit entwickelte Programm GARLig ist eine auf einem Genetischen Algorithmus basierende Methode, um chemische Seitenkettenmodifikationen niedermolekularer Verbindungen hinsichtlich eines untersuchten Rezeptors effizient durchzuführen. Zielsetzung ist hier die Zusammenstellung einer Verbindungsbibliothek, welche eine benutzerdefiniert große Untermenge aller möglichen chemischen Modifikationen Ligand-ähnlicher Grundgerüste darstellt. Als zentrales Qualitätskriterium einzelner Vertreter der Verbindungsbibliothek dienen durch Docking erzeugte Ligand-Geometrien und deren Bewertungen durch Protein-Ligand-Bewertungsfunktionen. In mehreren Validierungsszenarien an den Proteinen Trypsin, Thrombin, Faktor Xa, Plasmin und Cathepsin D konnte gezeigt werden, dass eine effiziente Zusammenstellung Rezeptor-spezifischer Substrat- oder Ligand-Bibliotheken lediglich eine Durchsuchung von weniger als 8% der vorgegebenen Suchräume erfordert und GARLig dennoch im Stande ist, bekannte Inhibitoren in der Zielbibliothek anzureichern
Directed evolution of an HIV-1 LTR specific recombinase for anti-retroviral therapy- a proof of concept study
The prospect of the work presented in this thesis has been to engineer Cre recombinase to recognize and recombine a sequence from an HIV-1 Long Terminal Repeat (LTR), characterize the recombination proficiency of the evolved recombinase in mammalian cells and explore the potential of the recombinase for a novel antiretroviral strategy
Improved approaches to ligand growing through fragment docking and fragment-based library design
Die Fragment-basierte Wirkstoffforschung (“fragment-based drug discovery“ – FBDD) hat in den vergangenen zwei Jahrzehnten kontinuierlich an Beliebtheit gewonnen und sich zu einem dominanten Instrument der Erforschung neuer chemischer Moleküle als potentielle bioaktive Modulatoren entwickelt. FBDD ist eng mit Ansätzen zur Fragment-Erweiterung, wie etwa dem Fragment-„growing“, „merging“ oder dem „linking“, verknüpft. Diese Entwicklungsansätze können mit Hilfe von Computerprogrammen oder teilautomatischen Prozessen der „de novo“ Wirkstoffentwicklung beschleunigt werden. Obwohl Computer mühelos Millionen von Vorschlägen generieren können, geschieht dies allerdings oft auf Kosten unsicherer synthetischer Realisierbarkeit der Verbindungen mit einer potentiellen Sackgasse im Optimierungsprozess.
Dieses Manuskript beschreibt die Entwicklung zweier computerbasierter Instrumente, PINGUI und SCUBIDOO, mit dem Ziel den FBDD Ausarbeitungs-Zyklus zu fördern. PINGUI ist ein halbautomatischer Arbeitsablauf zur Fragment-Erweiterung basierend auf der Proteinstruktur unter Berücksichtigung der synthetischen Umsetzbarkeit. SCUBIDOO ist eine freizugängliche Datenbank mit aktuell 21 Millionen verfügbaren virtuellen Produkten, entwickelt durch die Kombination kommerziell verfügbarer Bausteine („building blocks“) mit bewährten organischen Reaktionen. Zu jedem erzeugten virtuellen Produkt wird somit eine Synthesevorschrift geliefert. Die entscheidenden Funktionen von PINGUI, wie die Erzeugung abgeleiteter Bibliotheken oder das Anwenden organischer Reaktionen, wurden daraufhin in die SCUBIDOO Webseite integriert.
PINGUI als auch SCUBIDOO wurden des Weiteren zur Erforschung Fragment-basierter Liganden („fragment-based ligand discovery“) mit dem β-2 adrenergen Rezeptor (β-2-AR) und der PIM1 Kinase als Zielproteine („targets“) eingesetzt. Im Rahmen einer ersten Studie zum β-2-AR wurden mit PINGUI acht unterschiedliche Erweiterungen für verschiedene Fragment-Treffer („hits“) vorhergesagt (ausgewählt?). Alle acht Verbindungen konnten dabei erfolgreich synthetisiert werden und vier der acht Produkte zeigten im Vergleich zu den Ausgangsfragmenten eine erhöhte Affinität zum target. Eine zweite Studie umfasste die Anwendung von SCUBIDOO zur schnellen Identifikation von Fragmenten und deren möglichen Erweiterungen mit potentieller Bindungsaktivität zur PIM-1 Kinase. Als Ergebnis ergab sich ein Fragment-Treffer mit der dazugehörigen Kristallstruktur. Weitere Folgeprodukte befinden sich derzeit in Synthese. Abschließend wurde SCUBIDOO an eine automatische Roboter- Synthese gekoppelt, wodurch hunderte von Verbindungen effizient parallel synthetisiert werden können. 127 der 240 vorhergesagten Produkte (53%) wurden mit dem Ziel an den β-2-AR zu binden bereits synthetisiert und werden in Kürze weitergehend getestet.
Die beiden vorgestellten Computer-Tools könnten zur Verbesserung im Anfangsstadium befindlicher Projekte zur Fragment-basierten Wirkstoffentwicklung, vor allem hinsichtlich der Strategien im Bereich der Fragment Erweiterung, eingesetzt werden. PINGUI zum Beispiel generiert Vorschläge zur Fragment- Erweiterung, die sich mit hoher Wahrscheinlichkeit an die Zielstruktur anlagern, und stellt somit ein nützliches und kreatives Werkzeug zur Untersuchung von Struktur-Wirkungsbeziehungen („structure-activity relationship“ – SAR) dar. SCUBIDOO zeigte sich mit einem bisherigen 53-prozentigen Synthese-Erfolg als zugänglich für die Integration an die effiziente automatisierte Roboter-Synthese. Jede zukünftige Synthese liefert neue Kenntnisse innerhalb der Datenbank und wird somit nach und nach den Synthese-Erfolg erhöhen. Des Weiteren stellen alle synthetisierten Produkte neuartige Verbindungen dar, was umso mehr den möglichen Einfluss SCUBIDOOs bei der Entdeckung neuer chemischer Strukturen hervorhebt
Exploring Molecular Diversity: There is Plenty of Room at Markush's
L'estratègia de les etapes inicials del descobriment de fĂ rmacs estĂ normalment basada en un procĂ©s anomenat hit-to-lead que implica un extens estudi entorn de la sĂntesi de derivats d'una molècula original que prèviament hagi mostrat certa activitat biològica davant d'una diana concreta. Per tant, aquest procĂ©s comporta la sĂntesi de molts anĂ legs que descriurien una subquimioteca, que generalment evidencia que aquests estudis estan molt focalitzats al voltant de l'espai quĂmic del compost original. AixĂ i tot, quan aquesta molècula Ă©s finalment patentada, es descriu un espai quĂmic molt mĂ©s vast per mitjĂ d'estructures Markush donant per suposat que alguns dels seus derivats puguin presentar tambĂ© activitat biològica. Tot i això, la presència d'aquestes estructures no implica la sĂntesi comprovada de tota la biblioteca molecular sinĂł nomĂ©s una petita mostra de la mateixa.
La nostra hipòtesi Ă©s que hi ha una gran part de l’espai quĂmic d’aquestes biblioteques que estĂ sense explorar i pot amagar possibles candidats que poden fins i tot superar l’activitat del hit original. A travĂ©s d'aquest projecte, es proposa una alternativa que sostĂ© que una selecciĂł racional de poques molècules – basat en l'agrupament segons semblança molecular – pot representar de manera mĂ©s significativa l'espai quĂmic establert, oferint la possibilitat d'explorar regions desconegudes que podrien amagar mĂ©s potencial biològic.
DesprĂ©s de revisar els darrers fĂ rmacs aprovats per la FDA en el perĂode del 2008 al 2020 i la base de dades de molècules bioactives de ChEMBL, s'ha dut a terme una exploraciĂł de l'ampli espai quĂmic resultant de molècules petites amb propietats similars a les dels medicaments per definir nous espais accessibles que podrien ocultar activitat. Els resultats obtinguts de set casos d'estudis reals han demostrat que tant la selecciĂł racional com l’aleatòria representen mĂ©s significativament les biblioteques combinatòries declarades a les patents, que les molècules descrites fins ara.
S'han realitzat dos estudis prĂ ctics que implementen aquesta metodologia suggerida per descriure millor l'espai quĂmic del fĂ rmac antipalĂşdic Tafenoquina i del Dacomitinib, un inhibidor de tirosina cinases de segona generaciĂł per al tractament del cĂ ncer de pulmĂł de cèl·lules no petites. L’exploraciĂł de l’espai quĂmic d’aquestes dues famĂlies ha portat a la sĂntesi racional de set anĂ legs antipalĂşdics i vuit inhibidors de cinases que han mostrat interessants activitats inhibidores.
Aquests resultats demostren que l'aplicaciĂł de la quimioinformĂ tica per a la selecciĂł de biblioteques pot millorar la capacitat d'inspeccionar millor els conjunts de dades quĂmiques per identificar nous compostos precandidats i representar grans biblioteques per a posteriors campanyes de reposicionament.La estrategia de las etapas iniciales del descubrimiento de fármacos está normalmente basada en un proceso denominado hit-to-lead que implica un extenso estudio entorno a la sĂntesis de derivados de una molĂ©cula original que previamente haya expresado cierta actividad biolĂłgica frente a una diana concreta. Por ende, este proceso conlleva la sĂntesis de muchos análogos que describirĂan una sublibrerĂa quĂmica, la cual generalmente evidencia que estos estudios están muy focalizados alrededor del espacio quĂmico del compuesto original. AĂşn y asĂ, cuando esta molĂ©cula es finalmente patentada, se describe un espacio quĂmico mucho más vasto por medio de estructuras Markush teorizando que algunos de sus derivados puedan presentar tambiĂ©n actividad biolĂłgica. Sin embargo, la presencia de estas estructuras no implica la sĂntesis comprobada de toda la biblioteca molecular sino solo una pequeña muestra de la misma.
Nuestra hipĂłtesis es que hay una gran parte del espacio quĂmico de estas bibliotecas que está sin explorar y puede ocultar posibles candidatos que pueden hasta superar la actividad del hit original. A travĂ©s de este proyecto, se propone una alternativa que sostiene que una selecciĂłn racional de pocas molĂ©culas – fundada en el agrupamiento segĂşn su similitud quĂmica – puede representar de manera más significativa el espacio quĂmico establecido, ofreciendo la posibilidad de explorar regiones desconocidas que podrĂan ocultar más potencial biolĂłgico.
DespuĂ©s de revisar los Ăşltimos fármacos aprobados por la FDA en el perĂodo de 2008 a 2020 y la base de datos de molĂ©culas bioactivas de ChEMBL, se ha llevado a cabo una exploraciĂłn del amplio espacio quĂmico resultante de molĂ©culas pequeñas con propiedades similares a las de los medicamentos para definir nuevos espacios accesible que podrĂan ocultar actividad. Los resultados obtenidos de siete casos de estudios reales han demostrado que tanto la selecciĂłn racional como la aleatoria representan más significativamente las bibliotecas combinatorias declaradas en las patentes que las molĂ©culas descritas hasta la fecha.
Se han desarrollado dos estudios prácticos que implementan esta metodologĂa sugerida para describir mejor el espacio quĂmico del fármaco antipalĂşdico Tafenoquina y Dacomitinib, un inhibidor de la tirosina quinasa de segunda generaciĂłn para el tratamiento del cáncer de pulmĂłn de cĂ©lulas no pequeñas. La exploraciĂłn del espacio quĂmico de estas dos familias ha llevado a la sĂntesis racional de siete análogos antipalĂşdicos y ocho inhibidores de quinasas que han mostrado interesantes actividades inhibidoras.
Estos resultados demuestran que la aplicaciĂłn de la quimioinformática para la selecciĂłn de bibliotecas puede mejorar la capacidad de inspeccionar mejor los conjuntos de datos quĂmicos para identificar nuevos potenciales hits y representar grandes bibliotecas para fines de reposicionamiento.The early Drug Discovery strategy is commonly based on a hit-to-lead process which involves large research on the synthesis of derivatives of an original molecule that had previously shown biological activity against a specific biological target. Therefore, this process implies the synthesis of many analogs leading to the description of a chemical sub-library which generally leads to a highly focused study on the chemical space nearby the hit compound. However, when this drug is finally patented, a wider chemical space derived from a Markush structure is described, theorizing that some analogs within may present biological activity. Nevertheless, this claim involving the Markush structure does not imply the proven synthesis of all the chemical library but just a small population of it.
We hypothesize that there is a great part of the chemical space of these libraries that is unexplored and can hide potential lead candidates which may even surpass the activity of the original hit. Through this project, an alternative is proposed claiming that a rational selection of a short sample of small molecules – founded on similarity-based clustering – can represent more significatively the stated chemical space offering the possibility to explore the unknown space that could hide more potential biological activity.
After a review on the latest approved drugs by the FDA in the period from 2008 to 2020 and the ChEMBL database of bioactive molecules, an exploration of the resulting wide chemical space of small molecules with drug-like properties has been assessed in order to define accessible spots that might hide biological activity. The obtained results from seven real cases of study have proven that random and rationally selected molecules represent more significantly the combinatorial libraries stated in the patents rather than the reported molecules until date.
Furthermore, two practical studies implementing our suggested methodology have been developed to better describe the chemical space of the antimalarial drug Tafenoquine and Dacomitinib, a second-generation tyrosine kinase inhibitor for non-small-cell lung cancer treatment. The assessment driven by a better chemical space exploration of these two families have led to the rational synthesis of seven antimalarial analogs and eight kinase inhibitors which have shown interesting inhibitory activities.
Our results evince that the application of cheminformatics for library selection may improve the ability to better inspect chemical datasets in order to identify new potential hits and represent large libraries for further reprofiling purposes
Diverse small molecule inhibitors of human apurinic/apyrimidinic endonuclease APE1 identified from a screen of a large public collection.
The major human apurinic/apyrimidinic endonuclease APE1 plays a pivotal role in the repair of base damage via participation in the DNA base excision repair (BER) pathway. Increased activity of APE1, often observed in tumor cells, is thought to contribute to resistance to various anticancer drugs, whereas down-regulation of APE1 sensitizes cells to DNA damaging agents. Thus, inhibiting APE1 repair endonuclease function in cancer cells is considered a promising strategy to overcome therapeutic agent resistance. Despite ongoing efforts, inhibitors of APE1 with adequate drug-like properties have yet to be discovered. Using a kinetic fluorescence assay, we conducted a fully-automated high-throughput screen (HTS) of the NIH Molecular Libraries Small Molecule Repository (MLSMR), as well as additional public collections, with each compound tested as a 7-concentration series in a 4 µL reaction volume. Actives identified from the screen were subjected to a panel of confirmatory and counterscreen tests. Several active molecules were identified that inhibited APE1 in two independent assay formats and exhibited potentiation of the genotoxic effect of methyl methanesulfonate with a concomitant increase in AP sites, a hallmark of intracellular APE1 inhibition; a number of these chemotypes could be good starting points for further medicinal chemistry optimization. To our knowledge, this represents the largest-scale HTS to identify inhibitors of APE1, and provides a key first step in the development of novel agents targeting BER for cancer treatment
- …