Робота публікується згідно наказу ректора НАУ від 27.05.2021 р. №311/од "Про розміщення кваліфікаційних робіт здобувачів вищої освіти в репозиторії університету". Керівник кваліфікаційної роботи: к.тех.н., зав.каф. кафедри комп’ютерних мультимедійних технологій Бобарчук Олександр АнтоновичМожливо, найважливішим досягненням останнього десятиліття в галузі комп’ютерного бачення та машинного навчання став винахід GAN (Generative Adversarial Networks) — методу, який запровадив можливість мислити за межами того, що вже було присутнє в даних, кроком у цілковито новій галузі, яка тепер називається генеративним моделюванням. Однак, пройшовши через фазу підйому, GAN почали стикатися з плато, коли більшість методів намагалися вирішити деякі вузькі місця, з якими стикалися змагальні методи.
Справа не в окремих методах, а в змагальності самої проблеми.
З випуском Dall-E 2, Imagen, Stable Diffusion і Midjourney дифузійні моделі
захопили світ штурмом, надихаючи на творчість і розсуваючи межі машинного
навчання. Ці моделі можуть генерувати майже нескінченну різноманітність
зображень із текстових підказок, у тому числі фотореалістичні, фантастичні,
футуристичні та, звичайно, чарівні. Ці можливості переосмислюють, що для людства означає взаємодія з технологіями, надаючи нам здібності створювати майже будь-які зображення, які ми можемо уявити. Але, навіть з їх розширеними можливостями дифузійні моделі мають обмеження. Однак, оскільки ці моделі постійно вдосконалюються або наступна генеративна парадигма бере верх, вони дозволять людству створювати зображення, відео та інші захоплюючі враження простою думкою
Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.