3 research outputs found

    Система для породження нових молекул методами глибокого навчання

    Get PDF
    Дипломна робота: 132 с., 23 рис., 6 табл., 2 додатки, 46 джерел. Об’єкт дослідження – генерація нових молекулярних структур. Мета роботи – дослідити стандартні та нові підходи до генерації молекул, проаналізувати існуючі методи глибокого навчання для генерації нових молекулярних структур, побудувати систему яка б використовувала та тестувала останні розробки у галузі генеративних змагальних нейронних мереж на хімічній предметній області . Процес генерації нових молекул - довготривалий та дороговартісний, в останні роки активно ведуться дослідження для його пришвидшення та здешевлення. Методи глибокого навчання показали себе як ефективний інструмент у даній задачі. Важливо використовувати останні розробки з одних дисциплін на предметних областях інших для підвищення ефективності та розширення устаткованих уявлень. У даній роботі було досліджено існуючі підходи до розв'язку даної задачі. Використано хімічні дані у SMILES нотації. Проаналізовано їх структуру, розроблено скрипт для трансформації їх у двовимірні зображення у підходящому для обраної моделі форматі. Було застосовано один з нових підходів до тренування генеративних змагальних мереж, а саме прогресивне нарощування генеративної змагальної мережі на хімічній предметній області. За допомогою обраної моделі було згенеровано штучний датасет розміром 1000 прикладів, оцінено її перформанс, запропоновано шляхи для подальших досліджень.Bachelor thesis: 132 p., 23 fig., 6 tabl., 2 append., 46 sources. The object of research is the generation of new molecular structures. The aim of the work is to investigate standard and new approaches to molecule generation, to analyze existing deep learning methods for generating new molecular structures, to build a system that would use and test the latest developments in generative adversarial networks in the chemical field. The process of generating new molecules is long and expensive, in recent years, research is being actively conducted to accelerate and reduce the cost. Deep learning methods have proven to be an effective tool in this task. It is important to use the latest developments from some disciplines in the subject areas of others to increase efficiency and expand the established ideas. In this thesis, the existing approaches to solving this problem were investigated. Chemical data in SMILES notation is used. Its structure is analyzed, a script is developed to transform it into two-dimensional images in a format suitable for the selected model. One of the new approaches to the training of generative adversarial networks was applied, namely the progressive growing of the generative adversarial network in the chemical domain. Using the selected model, an artificial dataset with a size of 1000 examples was generated, models performance was evaluated, and ways for further research were suggested
    corecore