Se presenta el desarrollo de un entorno virtual de simulación basado en Python Turtle para el entrenamiento de un algoritmo de aprendizaje por refuerzo destinado a la navegación autónoma de un velero de 2 metros de eslora. Este entorno de simulación permite entrenar el pilotaje autónomo en diferentes condiciones de viento y datos de navegación de la embarcación, en ausencia de obstáculos, por medio de la observación causa-efecto y una estrategia de recompensas que permiten al agente decidir las mejores acciones. La generación virtual de situaciones de navegación reduce las horas de pruebas de maPostprint (author's final draft