Robotic cloth manipulation is challenging due to the many degrees of freedom and properties of the cloth material affecting the dynamics of the manipulated cloth. The nonlinear dynamics of the cloth have particularly strong significance in dynamic cloth manipulation, where some parts of the cloth are not directly controllable.
This thesis presents a novel approach for solving dynamic cloth manipulation by training policies using reinforcement learning (RL) in simulation and transferring the learned policies to the real world directly. The proposed method uses visual feedback and material property randomization in a physics simulator to achieve generalization in the real world. Experimental results show that using only visual feedback is enough for the policies to learn dynamic cloth manipulation in a way that transfers from simulation to the real world. In addition, the randomization of the dynamics in simulation enables capturing the behavior of a variety of cloths in the real world.Tekstiilien suuri vapausasteiden lukumäärä ja materiaalien erilainen vaikutus tekstiilien dynamiikkaan tekevät niiden manipulaatiosta teollisuusrobottia käyttäen haastavaa. Erityisesti tekstiilien epälineaariset dynaamiset ominaisuudet vaikuttavat dynaamisen manipulaation kontekstissa, missä osaan tekstiilistä ei voida suoraan vaikuttaa.
Tämä opinnäytetyö esittelee uuden tavan tekstiilien dynaamiseen manipulaatioon teollisuusrobottia käyttäen, missä robotin säätö perustuu vahvistusoppimiseen ja oppimiseen simulaatiossa. Menetelmä käyttää visuaalista takaisinkytkentää, sekä tekstiilin dynaamisten ominaisuuksien satunnaistamista manipulaatiotaitojen oppimiseen. Kokeelliset tulokset osoittavat, että visuaalinen takaisinkytkentä on riittävä keino oppia tekstiilien dynaamisen manipulaation taitoja, joita voidaan käyttää suoraan oikeilla teollisuusroboteilla. Lisäksi dynaamisten ominaisuuksien satunnaistaminen auttaa oikeisiin tekstiileihin yleistämisessä