Note publique d'information : En imagerie hyperspectrale, chaque pixel est associé à un spectre provenant de la
réflectance observée en d points de mesure (i.e., longueurs d'onde). On se retrouve
souvent dans une situation où la taille d'échantillon n est relativement faible devant
le nombre d de variables. Ce phénomène appelé "fléau de la dimension" est bien connu
en statistique multivariée. Plus d augmente devant n, plus les performances des méthodologies
statistiques standard se dégradent. Les spectres de réflectance intègrent dans leur
dimension spectrale un continuum qui leur confère une nature fonctionnelle. Un hyperspectre
peut être modélisé par une fonction univariée de la longueur d'onde, sa représentation
produisant une courbe. L'utilisation de méthodes fonctionnelles sur de telles données
permet de prendre en compte des aspects fonctionnels tels que la continuité, l'ordre
des bandes spectrales, et de s'affranchir des fortes corrélations liées à la finesse
de la grille de discrétisation. L'objectif principal de cette thèse est d'évaluer
la pertinence de l'approche fonctionnelle dans le domaine de la télédétection hyperspectrale
lors de l'analyse statistique. Nous nous sommes focalisés sur le modèle non-paramétrique
de régression fonctionnelle, couvrant la classification supervisée. Dans un premier
temps, l'approche fonctionnelle a été comparée avec des méthodes multivariées usuellement
employées en télédétection. L'approche fonctionnelle surpasse les méthodes multivariées
dans des situations délicates où l'on dispose d'une petite taille d'échantillon d'apprentissage
combinée à des classes relativement homogènes (c'est-à-dire difficiles à discriminer).
Dans un second temps, une alternative à l'approche fonctionnelle pour s'affranchir
du fléau de la dimension a été développée à l'aide d'un modèle parcimonieux. Ce dernier
permet, à travers la sélection d'un petit nombre de points de mesure, de réduire la
dimensionnalité du problème tout en augmentant l'interprétabilité des résultats. Dans
un troisième temps, nous nous sommes intéressés à la situation pratique quasi-systématique
où l'on dispose de données fonctionnelles contaminées. Nous avons démontré que pour
une taille d'échantillon fixée, plus la discrétisation est fine, meilleure sera la
prédiction. Autrement dit, plus d est grand devant n, plus la méthode statistique
fonctionnelle développée est performante.
Note publique d'information : In hyperspectral imaging, each pixel is associated with a spectrum derived from observed
reflectance in d measurement points (i.e., wavelengths). We are often facing a situation
where the sample size n is relatively low compared to the number d of variables. This
phenomenon called "curse of dimensionality" is well known in multivariate statistics.
The mored increases with respect to n, the more standard statistical methodologies
performances are degraded. Reflectance spectra incorporate in their spectral dimension
a continuum that gives them a functional nature. A hyperspectrum can be modelised
by an univariate function of wavelength and his representation produces a curve. The
use of functional methods allows to take into account functional aspects such as continuity,
spectral bands order, and to overcome strong correlations coming from the discretization
grid fineness. The main aim of this thesis is to assess the relevance of the functional
approach in the field of hyperspectral remote sensing for statistical analysis. We
focused on the nonparametric fonctional regression model, including supervised classification.
Firstly, the functional approach has been compared with multivariate methods usually
involved in remote sensing. The functional approach outperforms multivariate methods
in critical situations where one has a small training sample size combined with relatively
homogeneous classes (that is to say, hard to discriminate). Secondly, an alternative
to the functional approach to overcome the curse of dimensionality has been proposed
using parsimonious models. This latter allows, through the selection of few measurement
points, to reduce problem dimensionality while increasing results interpretability.
Finally, we were interested in the almost systematic situation where one has contaminated
functional data. We proved that for a fixed sample size, the finer the discretization,
the better the prediction. In other words, the larger dis compared to n, the more
effective the functional statistical methodis.