Constrained clustering and deep learning for time series analysis : with application to incremental temporal analysis for remote sensing

Abstract

Depuis quelques années, les satellites réalisent des captures d'images de la Terre avec une haute fréquence de revisite et une haute disponibilité, qu'on peut représenter sous forme de séries temporelles. Cela permet d'effectuer une observation continue de la Terre avec des applications dans le suivi agricole, la gestion de catastrophes naturelles, etc. Cependant, ce phénomène ne se limite pas au domaine de la télédétection. On peut en effet observer une croissance similaire dans de nombreux domaines, tel que la médecine ou la finance. Or, dans tous ces domaines, l'analyse de ces données fait face aux mêmes problématiques.Une grande quantité de données n'est pas toujours accompagnée d'un étiquetage suffisant, ce qui empêche généralement une bonne application des méthodes supervisées. En effet, l'étiquetage reste une tâche très chronophage et complexe, car nécessitant une expertise sur les données analysées. A l'opposé, les méthodes non supervisées ne nécessitent pas de connaissances de l'expert mais donnent parfois des résultats médiocres.Dans ce contexte, le clustering sous contraintes est une alternative qui offre un bon compromis en termes d'investissement pour l'expert. Toutefois, les méthodes de clustering sous contraintes sont sujettes à des limitations importantes. Nous montrons dans cette thèse que deux facteurs limites fortement l'impact des contraintes, la consistance, qui est la quantité d'information dans l'ensemble des contraintes que l'algorithme peut déterminer par ses propres biais, et la cohérence, qui est le degré d'accord entre les contraintes elles-mêmes.Afin de répondre au problème de consistance, nous proposons une nouvelle méthode, I-SAMARAH, basée sur le clustering collaboratif et l'intégration des contraintes de manière incrémentale. Cependant, nous montrons également que le problème de cohérence reste important que nous proposons d'aborder de manière plus prospective avec des méthodes basées sur l'apprentissage profond.Current satellites now achieve frequent revisits and high mission availability and provide series of images of the Earth captured at different dates that can be seen as time series. Their analysis allows continuous observation of the Earth on a wide spectrum with applications in agricultural mapping, environmental disaster monitoring, etc. However, this phenomenon is not limited to the field of remote sensing. Similar growth can be observed in many fields, such as medicine or finance. Whether it is for remote sensing or other domains, the analysis of these data faces the same issues.A large amount of data does not always imply sufficient labeling, which generally prevents a good application of supervised methods. Indeed, labeling remains a very time-consuming task, but also a complex one, as it requires expertise on the analyzed data. On the other hand, unsupervised methods do not require the expert's knowledge but sometimes give poor results or results that are far from the expert's expectations.In this context, constrained clustering, which is a form of semi-supervised learning algorithms, is an alternative and offers a good compromise in terms of investment for the expert. However, constrained clustering methods are subject to important limitations on the quality of the obtained results. We show in this thesis that two factors strongly limit the impact of constraints, consistency, which is the amount of information in the set of constraints that the algorithm can determine by its own bias, and coherence, which is the degree of agreement between the constraints themselves.In order to address the consistency problem, we propose a new method, I-SAMARAH, based on collaborative clustering and incremental integration of constraints. However, we also show that the consistency problem remains an important scientific challenge that we propose to address in a more prospective way with methods based on deep learning

    Similar works

    Full text

    thumbnail-image

    Available Versions

    Last time updated on 30/06/2022