II.2.2.3. Qualité de l'estimation des paramètres de tendance

Au regard des résultats précédents, il apparaît que la tendance du niveau de la mer en un site est déterminée avec d'autant plus de précision que la série chronologique est longue. L'histogramme de la figure 24 indique un mode principal de 0.5 mm/an pour les écart-types des paramètres de vitesse estimés par régression linéaire. Lorsque nous avons plus de 30 ans de données, l'écart-type est inférieur à 1 mm/an, sauf cas très exceptionnel, avec un mode principal de 0.3 mm/an.

Mais, quelle confiance accorder à cet estimateur de précision que nous obtenons par la méthode des moindres carrés ? Chiffre-t-il de manière réaliste la précision du paramètre de tendance estimé ?

Il convient ici d'éclaircir quelque peu la qualité de précision. Il s'agit d'une notion complexe, toute imprégnée d'un caractère relatif associé à l'objet auquel on l'applique. Intimement liée à la métrologie, nous aurons l'occasion de développer cette notion de précision tout au long du mémoire, en particulier lors du chapitre sur l'étalonnage des marégraphes.

La précision n'est pas une qualité qui puisse être appréhendée d'une manière immédiate. A cet égard, Lachenaud [1970] cite fort à propos A. Pérard: "La précision d'un instrument est caractérisée par l'imperfection de précision, elle-même égale à la somme des imperfections de fidélité, de justesse et d'incertitude de lecture; l'imperfection de précision, ou la précision elle-même, s'exprime en unités de la grandeur". Autrement dit, la précision est évaluée par son absence. Elle n'est pas directement accessible par la mesure. Aussi, la valeur de notre estimateur de précision, l'écart-type, est d'autant plus élevée que la grandeur est mal déterminée, donc que sa précision est faible.

Reprenons la définition se rapportant à la formule E.II.7: "l'écart-type chiffre la fluctuation des valeurs d'une variable aléatoire autour de son espérance mathématique", et appliquons la à notre paramètre de vitesse {a}. Seulement, nous n'avons qu'une valeur de {a} calculée par régression linéaire sur les données d'une série temporelle. Toutefois, sous couvert des hypothèses suivantes:

nous pouvons écrire que l'espérance mathématique de {a} sur l'intervalle de temps Ti est égale à l'espérance mathématique de {a} sur un autre intervalle Tk, de même durée mais centré sur une autre date.

Equation (E.II.10)

Autrement dit, les tendances calculées par régression linéaire sur différents intervalles de temps, de longueur spécifiée, d'au moins 30 ans, ont la même espérance mathématique. Nous pouvons alors estimer cette espérance par la moyenne arithmétique des tendances individuelles ainsi obtenues, et, indépendamment de la méthode des moindres carrés, calculer leur écart-type par la formule E.II.7. Ce dernier sera désigné par écart-type expérimental pour le distinguer. Le terme est repris du vocabulaire métrologique de l'organisation internationale de normalisation [ISO, 1993], il correspond bien à la définition E.II.7.

Comme cette étude nécessite des séries chronologiques longues, nous avons repris les stations de Brest, Marseille, San Francisco, Buenos Aires, et Sydney, dont la couverture temporelle moyenne est de 120 ans, et qui, par ailleurs, se trouvent réparties autour du globe. Pour chacune, j'estime les tendances par régression linéaire sur un intervalle de temps de durée T, centré sur une date mobile. La figure 32 présente les résultats sous forme de table. La première colonne indique le marégraphe et la durée considérés; la deuxième colonne donne l'intervalle des valeurs minimum et maximum du paramètre vitesse {amin; amax}, sa moyenne arithmétique {amoy} et son écart-type expérimental {[[sigma]]e} suivant la formule E.II.7; quant à la troisième colonne, elle fournit l'intervalle des valeurs minimum et maximum de l'écart-type estimé par régression linéaire {[[sigma]]rl-; [[sigma]]rl+} suivant E.II.8, sa moyenne {[[sigma]]rl} et son écart-type {[[sigma]][[sigma]]} suivant E.II.7; enfin, la dernière colonne présente le rapport entre les deux estimateurs de précision que nous obtenons de manière indépendante {[[sigma]]e; [[sigma]]rl}.

Figure 32 : Résultats de l'analyse des séries chronologiques de Brest (B), Marseille (M), San Francisco (SF), Buenos Aires (BA), et Sydney (S), par régression linéaire (R.L.), appliquée sur des intervalles de temps mobiles de T années.
Station / T
(années)
Tendances linéaires (mm/an) Ecart-types calculés par R.L. sige / sigrl
[amin ; amax]

(amoy +/- sigmae)

[sigrl- ; sigrl+]

(sigrl +/- sigsig)

B / 20

B / 30

B / 40

B / 50

B / 60

B / 80

[-4 ; +7.3]

[-2.1 ; +4.4]

[-1.1 ; +2.9]

[-0.3 ; +2.4]

[-0.3 ; +2.4]

[+0.1 ; +1.9]

(0.8 +/- 2.5)

(0.8 +/- 1.5)

(0.9 +/- 0.9)

(0.9 +/- 0.7)

(0.96 +/- 0.7)

(1.0 +/- 0.5)

[0.65 ; 3.65]

[0.5 ; 1.4]

[0.4 ; 0.8]

[0.3 ; 0.5]

[0.2 ; 0.35]

[0.15 ; 0.24]

(1.5 +/- 0.6)

(0.8 +/- 0.2)

(0.5 +/- 0.07)

(0.4 +/- 0.05)

(0.3 +/- 0.03)

(0.2 +/- 0.02)

1.7

1.9

1.8

1.8

2.3

2.5

M / 20

M / 30

M / 40

M / 50

M / 60

M / 80

[-3.4 ; +5.4]

[-2.1 ; +4.7]

[-1.0 ; +2.6]

[+0.4 ; +2.3]

[+0.6 ; +2.1]

[+1.1 ; +1.7]

(1.0 +/- 1.9)

(1.4 +/- 1.6)

(1.2 +/- 0.8)

(1.4 +/- 0.5)

(1.4 +/- 0.4)

(1.4 +/- 0.2)

[0.6 ; 1.4]

[0.35 ; 0.75]

[0.3 ; 0.45]

[0.2 ; 0.3]

[0.16 ; 0.21]

[0.12 ; 0.14]

(0.9 +/- 0.2)

(0.5 +/- 0.1)

(0.4 +/- 0.05)

(0.3 +/- 0.03)

(0.2 +/- 0.02)

(0.13 +/- 0.005)

2.1

3.2

2

1.7

2

1.5

SF / 20

SF / 30

SF / 40

SF / 50

SF / 60

SF / 80

[-4.2 ; +7]

[-1.8 ; +2.9]

[-1.3 ; +3.0]

[-0.8 ; +2.6]

[-0.4 ; +2.5]

[+0.5 ; +2.3]

(1.6 +/- 2.3)

(1.1 +/- 1.3)

(1.3 +/- 1.2)

(1.2 +/- 1.0)

(1.2 +/- 0.9)

(1.2 +/- 0.6)

[0.8 ; 2.1]

[0.6 ; 1.0]

[0.4 ; 0.7]

[0.3 ; 0.5]

[0.2 ; 0.35]

[0.15 ; 0.22]

(1.3 +/- 0.3)

(0.7 +/- 0.1)

(0.5 +/- 0.07)

(0.35 +/- 0.05)

(0.3 +/- 0.03)

(0.2 +/- 0.01)

1.8

1.9

2.4

2.9

3

3

BA / 20

BA / 30

BA / 40

BA / 50

BA / 60

BA / 80

[-2.1 ; +9.2]

[-0.3 ; +3.7]

[+0.1 ; +3.1]

[+0.6 ; +2.0]

[+0.8 ; +1.7]

[+1.4 ; +1.7]

(1.7 +/- 2.5)

(1.4 +/- 1.0)

(1.3 +/- 0.7)

(1.2 +/- 0.4)

(1.3 +/- 0.3)

(1.6 +/- 0.1)

[1.3 ; 2.0]

[0.75 ; 1.1]

[0.5 ; 0.7]

[0.4 ; 0.5]

[0.30 ; 0.35]

[0.222 ; 0.226]

(1.6 +/- 0.2)

(0.9 +/- 0.08)

(0.6 +/- 0.03)

(0.4 +/- 0.03)

(0.32 +/- 0.02)

(0.225 +/- 0.002)

1.6

1.1

1.2

1

0.94

0.44

S / 20

S / 30

S / 40

S / 50

S / 60

S / 80

[-4.4 ; +4.8]

[-2.0 ; +2.7]

[-1.4 ; +2.2]

[-0.7 ; +1.9]

[+0.1 ; +1.6]

[+0.6 ; +1.0]

(0.5 +/- 2.0)

(0.5 +/- 1.4)

(0.7 +/- 1.2)

(0.9 +/- 0.8)

(0.9 +/- 0.5)

(0.76 +/- 0.12)

[0.6 ; 1.2]

[0.4 ; 0.6]

[0.3 ; 0.4]

[0.2 ; 0.3]

[0.17 ; 0.23]

[0.13 ; 0.15]

(0.9 +/- 0.2)

(0.5 +/- 0.06)

(0.34 +/- 0.03)

(0.26 +/- 0.03)

(0.20 +/- 0.02)

(0.14 +/- 0.01)

2.2

2.8

3.5

3.1

2.5

0.9



La figure 33 illustre les résultats pour les durées T=30 ans et T=50 ans sous une forme graphique. L'étude révèle que, selon l'intervalle considéré, de durée T spécifiée, la variation linéaire du niveau de la mer peut donner des tendances de signe différent.

Figure 33 : Représentation graphique des tendances du niveau de la mer estimées par régression linéaire sur des intervalles de temps mobiles de trente ans et de cinquante ans, pour les séries temporelles des marégraphes de Brest, Marseille, San Francisco, Buenos Aires et Sydney.


La comparaison des estimateurs de précision suggère que l'écart-type obtenu par la régression linéaire est en général optimiste. Il indique une dispersion deux fois plus faible en moyenne, sauf dans le cas particulier de Buenos Aires où leur accord est remarquable.

Toutefois, cette conclusion repose sur certaines hypothèses. La persistance de signaux non linéaires de basse fréquence expliquerait, d'une part, les valeurs tantôt négatives tantôt positives des tendances suivant la date de l'intervalle de temps considéré, et, d'autre part, l'écart-type expérimental plus élevé. D'ailleurs, regardons d'un peu plus près le cas du marégraphe de Buenos Aires. A l'inverse des autres marégraphes, il fournit un accord notable entre les deux estimateurs de précision. Sa série chronologique présente des oscillations interdécennales moins importantes en amplitude et en durée (cf. figure 17.a), si bien que l'hypothèse incriminée semble ici valide: l'influence des signaux non linéaires sur la détermination de la tendance est négligeable lorsqu'on considère des périodes de plus de trente ans. Ce cas particulier conforte quelque part nos soupçons, mais, par ailleurs, l'enregistrement de Buenos Aires indique également une pente régulière dès l'application d'un filtrage par moyennes mobiles d'ordre 30 (cf. figure 17.b), voire d'ordre 20. En revanche, les autres stations témoignent de changements plus ou moins prononcés de pente à des moments différents. L'hypothèse ne serait pas mise en cause, mais le comportement linéaire par morceaux ne permet pas d'écrire l'équation E.II.10.

La table B26 résume l'étude en généralisant les valeurs obtenues pour les cinq marégraphes par la moyenne de leurs résultats respectifs. On constate que les pentes estimées par régression linéaire à partir des séries temporelles de 30 ans d'observations ont une précision vraisemblable de 1.4 mm/an, alors que pour une durée de 60 ans elle diminue à environ 0.6 mm/an (1 écart-type expérimental).

Figure 34 : Résumé des résultats de l'analyse des séries chronologiques de Brest (B), Marseille (M), San Francisco (SF), Buenos Aires (BA), et Sydney (S), par régression linéaire (R.L.), appliquée sur des intervalles de temps mobiles de T années.
T (années) Ecart-type expérimental
(mm/an)
Ecart-type calculé parR.L.
(mm/an)
sigmae / sigmarl

20

30

40

50

60

80

2.2

1.4

1.0

0.7

0.6

0.3

1.2

0.7

0.5

0.3

0.3

0.2

1.8

2

2

2.3

2

1.5



Notons que le rapport entre nos deux estimateurs de précision ne peut être attribué à un facteur racine carrée du nombre de pentes intervenant dans le calcul de la moyenne et de son écart-type expérimental, facteur qui serait analogue à celui de l'équation E.II.2. En effet, celui-ci est de l'ordre de neuf dans le cas présent alors que notre rapport est de deux ! En divisant notre écart-type expérimental par ce facteur racine carrée, on obtient un estimateur de la précision de la moyenne arithmétique des tendances {amoy}, alors considérée comme une variable aléatoire.

Enfin, les résultats obtenus par moindres carrés semblent sensibles aux oscillations interannuelles en début ou en fin d'une série de données. L'effet apparaît comme une fluctuation de courte période et de faible amplitude des pentes calculées d'une année à l'autre. L'incertitude qu'elles occasionnent sur les pentes calculées sur des intervalles de trente ans est de l'ordre de 1 à 2 mm/an lorsque le phénomène est important. L'effet est moins important à mesure que le nombre de moyennes annuelles considérées croît. Il est plus visible sur certaines stations, par exemple San Francisco ou Buenos Aires (cf. figure 33 pour T=30 ans).

Les autres critères de qualité concernent davantage le calcul même de régression linéaire par la méthode des moindres carrés.

Par exemple, le facteur de variance unitaire (formule E.II.5) ne permet pas vraiment d'évaluer la qualité de la pente estimée par régression linéaire. En revanche, sa valeur plus ou moins élevée atteste la présence de signaux non linéaires qui sont ignorés dans la modélisation, et qui sont considérés ici comme du bruit. Il n'est alors pas surprenant de constater un niveau de bruit cohérent d'une série temporelle à l'autre suivant leur localisation géographique. L'histogramme de la figure 35 montre que le mode principal du bruit, indiqué par l'amplitude du facteur de variance unitaire, se situe autour de 3 cm, 56% des valeurs se trouvant dans l'intervalle [+2,+4] cm.

Figure 35 : Histogramme des facteurs de variance unitaire obtenus par régression linéaire appliquée aux 714 séries temporelles marégraphiques de plus de dix données annuelles (dont 146 GLOSS).


Bien que parfois il semble exister une correspondance entre les pics des deux courbes de la figure 26, on s'aperçoit qu'un bruit élevé ne signifie pas toujours une mauvaise précision du paramètre de tendance. En effet, c'est le cas de certaines séries chronologiques, qui présentent une assez forte composante interannuelle, mais qui sont assez longues pour mettre en évidence une pente de manière précise. La figure 36 présente les données de l'observatoire de Hamina, en Finlande, pour lequel nous obtenons un facteur de variance unitaire bien au-dessus de la moyenne (7.4 cm), et une pente négative estimée avec un écart-type de 0.6 mm/an.

Figure 36 : Données annuelles du marégraphe de Hamina, Finlande.


A l'inverse de ce que nous avons constaté pour la précision, le bruit ne diminue pas forcément lorsque la longueur de la série temporelle augmente. La figure 37 montre qu'il n'y a pas de relation claire entre le nombre d'années d'observation et le facteur de variance unitaire. En revanche, une élévation du seuil de bruit semble manifeste au-delà de 30 ans de données. Ce phénomène s'expliquerait par un paramètre de tendance linéaire qui est capable d'absorber un effet cyclique dont la période serait sensiblement supérieure au nombre de moyennes annuelles présentes dans la série chronologique.

Figure 37 : Facteur de variance unitaire et nombre d'années d'observation dans la série temporelle.


Un autre indicateur de qualité que nous pouvons calculer est le coefficient de variation de la relation (E.II.9). Une valeur faible de ce coefficient indique une distribution homogène de la variable {a}. Mais, c'est un indicateur relatif à utiliser avec précaution. Une tendance estimée avec un degré de précision donné, écart-type faible, a généralement un coefficient de variation faible (cf. figure 38). Sauf, lorsque les valeurs estimées pour la pente sont voisines de zéro. Dans ce cas, le même degré de précision donnera un coefficient de variation plus fort. A cet égard, notons que 13% des valeurs sont situées entre [-0.5 ; + 0.5] mm/an. Enfin, une pente élevée induira aussi un coefficient de variation faible, même si elle est estimée avec un degré de précision moindre.

Figure 38 : Coefficient de variation et écart-type issus de l'ajustement linéaire des séries temporelles de plus de dix données annuelles (714).


Le coefficient de corrélation linéaire (E.II.6) mérite qu'on s'y attarde un peu. Sa valeur absolue serait d'autant plus élevée que la valeur d'un caractère implique celle de l'autre, donc, que le modèle linéaire est licite. Le test de Student apporte une dimension probabiliste à l'interprétation de ce coefficient. Il stipule que l'on acceptera l'hypothèse H0: (a=0) contre H1: (a!=0) au niveau [[alpha]] si :

Equation (E.II.11)

La condition (E.II.11) conduit à un système classique du second degré en R, dont la solution dépend du degré de liberté. Elle est représentée par la courbe en trait continu sur la figure 39 pour le niveau [[alpha]]=5%, et par la courbe en trait pointillé pour le niveau [[alpha]]=1%. Le modèle linéaire est jugé valide au vu du test de la non nullité de {a}, les valeurs de R qui se trouvent au dessus de la courbe [[alpha]]=5% attestent un coefficient de corrélation significatif au niveau de probabilité de 95%.

Figure 39 : Résultats de l'étude statistique du coefficient de corrélation linéaire. Test de Student et validité du modèle linéaire ajusté aux séries temporelles marégraphiques de plus de dix données annuelles (714).


Le coefficient de corrélation linéaire informe sur la qualité de l'ajustement et le bien fondé du modèle linéaire. En revanche, il ne permet pas d'apprécier directement la qualité du paramètre de pente {a} estimé par le calcul. A l'égard du coefficient de corrélation linéaire, P. Tassi [1992] nous prévient qu'en aucun cas il ne faut interpréter la validité du modèle comme représentant le degré de liaison causale entre yi et ti. Le coefficient de corrélation linéaire peut être très élevé pour d'autres raisons qu'une relation d'explication. La figure 40 montre qu'un coefficient de corrélation linéaire supérieur à 0.7 est souvent associé à un écart-type inférieur à 2 mm/an, mais des pentes estimées avec précision, suivant un écart-type inférieur à 1 mm/an, ont des coefficients de corrélation très hétérogènes.

Figure 40 : Coefficient de corrélation linéaire et écart-type des séries temporelles marégraphiques pour lesquelles l'ajustement par un modèle linéaire semble correct au regard du test de Student.



  • Précédent: II.2.2.2. Résultats
  • Suivant: II.2.3. Estimations de la tendance séculaire du niveau des mers
  • Sommaire

  • Guy Woppelmann
    Last modified: Wed Dec 30 15:19:42 MET 1998