II.2.2. Analyse des données

II.2.2.1. Méthode de calcul

La question du choix des données étant résolue a priori, se pose ensuite la question de leur traitement. Deux techniques statistiques ont souvent été appliquées par les différents auteurs dans l'objet d'estimer des tendances séculaires du niveau de la mer. Il s'agit d'une part, de l'ajustement d'une droite, voire d'un polynôme, par la méthode des moindres carrés, et d'autre part, l'analyse statistique en composantes principales, connue dans la littérature anglophone sous le nom de Empirical Orthogonal Function analysis (EOF) ou eigenanalysis.

Chaque technique de calcul présente des avantages et des inconvénients. La technique EOF requiert des enregistrements continus, sans interruption, sur une période bien déterminée. Cette période doit être commune à l'ensemble des séries temporelles, ce qui représente une contrainte importante. En revanche, l'ajustement d'une droite par la méthode des moindres carrés, ou régression linéaire, s'applique à tous les enregistrements, même en présence de lacunes. L'avantage de l'analyse en composantes principales réside dans la décomposition des jeux de données en modes temporels et spatiaux orthogonaux, qui peuvent fournir une information intéressante sur la structure spatio-temporelle des signaux contenus dans les jeux de données.

Quelques études comparatives sur les deux techniques d'analyse mentionnées ci-dessus ont été effectuées, notamment par Emery & Aubrey [1991], ou encore par Peltier & Tushingham [1991]. Leurs conclusions sont concordantes: les résultats obtenus par les deux méthodes d'analyse sont très proches. Emery & Aubrey [1991] constatent que les tendances estimées par régression linéaire sont en moyenne 16,5 % plus fortes que celles qui sont déterminées par EOF, mais les auteurs s'interrogent sur la signification réelle de cette différence qu'ils attribuent plutôt à une approximation de l'analyse en composantes principales.

J'ai donc opté pour la régression linéaire par moindres carrés, plus simple à mettre en oeuvre. D'ailleurs, l'idée d'étendre le modèle fonctionnel d'une droite à un polynôme du second degré est tentante. D'autant que les variations eustatiques attendues seraient liées aux émissions anthropiques en gaz à effet de serre dans l'atmosphère qui n'ont cessées d'augmenter depuis la révolution industrielle. Toutefois, plusieurs études ont été menées en vain pour mettre en évidence une accélération de la tendance séculaire du niveau des mers sur les quelques cent cinquante dernières années.

Barnett [1984] estime qu'il n'est pas réaliste de considérer une fonction d'ordre supérieur qui prendrait en compte une accélération. Le signal résiduel qu'il obtient après l'ajustement d'une tendance linéaire correspond à un bruit blanc, moyenne nulle et écart-type de 12 mm. Si l'on peut toutefois reprocher à cet auteur que l'intervalle de temps de ses données est relativement court, 1930-1980, ce n'est plus le cas des études de Woodworth [1990], de Emery & Aubrey [1991] ou de Douglas [1992], qui portent sur des données anciennes remontant au milieu du XIXe siècle. Or, tous concluent au manque d'évidence d'une accélération apparente du niveau des mers, qui serait statistiquement significative. En outre, Emery & Aubrey [1991] constatent un phénomène curieux, d'une part, l'accélération de l'élévation du niveau de la mer dans les sites où l'on avait déjà observé sa montée, et d'autre part, l'accélération de la baisse du niveau de la mer dans les sites où une tendance de baisse était affichée. Ne trouvant pas d'explication physique, les auteurs suggèrent d'en chercher une dans la méthode de calcul. Le paramètre ajouté pour prendre en compte une accélération permettrait de capturer davantage de variance, mais il apporterait une vision fictive et erronée des données.

Malgré les résultats annoncés ci-dessus, le lecteur avisé se gardera de conclure hâtivement, car la réponse du niveau des mers à l'augmentation exponentielle des gaz à effet de serre au cours de ce siècle pourrait bien présenter un retard. En particulier, nous avons vu au premier chapitre que les processus océaniques avaient des temps de réponse plus long que les processus atmosphériques. Pourtant, la tendance du niveau des mers estimée à partir des marégraphes semble bien plus forte que la tendance obtenue de l'analyse des données géologiques et archéologiques sur les deux derniers millénaires [P. Pirazzoli, 1976]. Ce constat suppose une accélération, mais la datation de celle-ci est encore incertaine. A la vue des résultats de Emery & Aubrey [1991] ou de Douglas [1992], elle aurait démarré avant 1850. Enfin, n'oublions pas que les données marégraphiques se font rares à mesure que l'on remonte dans le temps. Ce faisant, l'échantillon reste-t-il représentatif ?

Le modèle fonctionnel adopté est donc le suivant:

Equation (E.II.3)

Il est en accord avec la recherche d'un signal a priori global, uniforme sur l'ensemble des océans, et linéaire sur la période d'observation des marégraphes. Nous appellerons bruit toute autre composante dans l'enregistrement marégraphique qui n'est pas ce signal linéaire, en particulier toute composante saisonnière, cyclique ou irrégulière.

L'analyse descriptive traditionnelle décompose une série temporelle en quatre composantes: linéaire, cyclique, saisonnière et irrégulière. Son objectif étant d'isoler l'une ou l'autre. Les composantes cycliques sont caractérisées par un comportement périodique, qui n'apparaît pas clairement si les données ne couvrent pas au moins deux fois leur période. Les composantes saisonnières peuvent également être qualifiées de cycliques, car elles sont supposées périodiques. Toutefois, elles se distinguent par une période manifestement liée aux influences de l'environnement, qui se retrouvent d'une année à l'autre dans l'enregistrement. La catégorie cyclique englobe alors tous les autres phénomènes périodiques. Quant à la composante irrégulière, elle regroupe ce qui ne peut être classé ailleurs.

Le bruit résulte d'erreurs d'observation ou d'erreurs de modélisation. La théorie statistique de la régression linéaire par moindres carrés s'appuie sur l'hypothèse que ces erreurs sont de nature aléatoire. Dans ce cadre, on développe des estimateurs sans biais des paramètres du modèle, de la précision de leur estimation, mais aussi de la qualité du propre calcul. Cette technique statistique est souvent employée même si l'hypothèse n'est pas vérifiée. Elle permettrait d'extraire la tendance linéaire du signal marégraphique avec assez de précision lorsque l'enregistrement est long.

Les paramètres de l'équation de régression {a,b} sont déterminés suivant le critère des moindres carrés. Je ne m'étendrai pas sur la description détaillée de la méthode, mais je rappelle qu'elle consiste à minimiser la somme des carrés des résidus. La solution est unique et rend maximale la densité de probabilité des observations:

Equation (E.II.4)

Les indicateurs de qualité que nous pouvons calculer sont:

  • le facteur de variance de poids unitaire:
  • Equation (E.II.5)

    La racine carrée du facteur de variance de poids unitaire ([[sigma]]0) informe de la qualité du calcul par moindres carrés. Il donne une idée du niveau de bruit présent dans la série temporelle. De ce fait, il nous instruit de la présence de systématismes, dus à des erreurs de modèle ou à des erreurs dans le procédé de mesure.

  • le coefficient de corrélation linéaire (R). Cette quantité mesure l'intensité de la liaison linéaire entre les deux variables {t,y}. Son calcul peut s'effectuer de la manière suivante:
  • Equation (E.II.6)

    Lorsque R=0, la valeur de t ne joue aucun rôle pour prévoir y. En revanche, on vérifie aisément que si la relation linéaire est exacte, alors |R|=1. La prévision est parfaite, et les écarts ui sont nuls. Remarque: -1 <= R <= +1

  • l'écart-type ([[sigma]]) d'une variable aléatoire (y). Il chiffre la dispersion des valeurs de cette variable autour de sa moyenne arithmétique (m). D'après la propriété de Bienayme-Tchebychev, la probabilité pour une loi quelconque d'avoir une valeur de la variable comprise entre (m-2[[sigma]]) et (m+2[[sigma]]) est d'au moins 75% [Bougeard, 1990].
  • Equation (E.II.7)

    Dans le cas de la régression linéaire, les écart-types associés aux paramètres du calcul {a,b}, considérés aussi comme des variables aléatoires, s'obtiennent en prenant la racine carrée des termes diagonaux de leur matrice de variance, calculée à partir de l'inverse de la matrice normale du système et du facteur de variance de poids unitaire. En l'occurrence, l'écart-type de notre paramètre vitesse {a} s'écrit:

    Equation (E.II.8)

  • le coefficient de variation. Il s'agit du rapport de l'écart-type à la valeur absolue de la moyenne, il donne une idée de l'homogénéité de la distribution de la variable en question.
  • Equation (E.II.9)



  • Précédent: II.2.1. Choix des stations
  • Suivant: II.2.2.2. Résultats
  • Sommaire

  • Guy Woppelmann
    Last modified: Wed Dec 30 11:51:35 MET 1998