Application of interaction profiles and machine learning in virtual screening

Abstract

Badania prowadzone w ramach wirtualnego screeningu dostarczają dużej ilości informacji na temat oddziaływania potencjalnych ligandów z ich receptorami. W celu wyeliminowania trudności związanych z analizą danych stosuje się metody wspomagane komputerowo. Jedną z nich stanowi Fingerprint Oddziaływań Strukturalnych (ang. Strcuctural Interaction Fingerprint – SIFt) będący poręcznym narzędziem służącym do analizy wyników dokowania. Fingerprint składa się z dziewięciobitowych binarnych fragmentów, kodujących informacje na temat reszt aminokwasowych zaangażowanych w oddziaływanie określonego typu. Uśrednienie fingerprintów otrzymanych na podstawie kilku kompleksów ligand – białko, prowadzi do utworzenia profilu oddziaływań konkretnego związku chemicznego.Celem pracy jest zastosowanie profili SIFt dla rozróżniania między ligandami aktywnymi a nieaktywnymi dla danego białka docelowego. Profile oddziaływań uzyskane na podstawie SIFt-ów, osobno dla aktywnych i nieaktywnych związków, zostały poddane procesowi ewaluacji poprzez algorytmy uczenia maszynowego. Na tej podstawie oceniono, czy możliwe jest odróżnienie związków o różnych aktywnościach na bazie profili SIFt.Dodatkowo, opisana metodologia została porównana z zastosowaniem fingerprintów molekularnych (MACCS), opisujących strukturę liganda, ale nie oddziaływania w jakie jest zaangażowany.Wyniki uzyskane z zastosowaniem uczenia maszynowego udowadniają, że możliwe jest skuteczne odróżnienie związków aktywnych od nieaktywnych na bazie profili SIFt.Virtual screening provides a vast amount of information about possible binding modes of potential ligands to their biological targets. Structural Interaction Fingerprint (SIFt) constitutes a handy and extremely supportive tool for post-docking analysis. It can be utilized to store, organize and mine vast amount of data obtained in a result of docking studies. SIFt fingerprint consists of 9-bit binary fragments, providing information about protein residues involved in interaction, and moreover, the interaction type. A collection of such fingerprints can be merged into an averaged string, showing frequencies of each interaction. In presented work, we propose a possibility of profile construction, basing on SIFt strings selected from multiple binding complexes, but for one ligand at the time. SIFt profiles were utilized to distinguish between active and inactive compounds. SIFt-based interaction profiles, for active and inactive ligands were evaluated by machine learning algorithms, that determined whether compounds bearing distinct activities could be discriminated. Finally, SIFt profiles performance in virtual screening was compared with molecular fingerprints (MACCS), that describe structure of compound, but not interactions it is involved in.Interaction profiles built on the basis of structural interaction fingerprints proved to be a viable tool for discrimination between active and inactive compounds

    Similar works

    Full text

    thumbnail-image