TP : An Introduction to Extreme Value Theory

Exercice 1 - Marseille

** Pour la suite de l’exercice, les données pluviométriques ont été divisées par 10 pour correspondre à des mm de pluie. **

Statistiques descriptives

summary(pluies)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   0.000   0.000   1.584   0.000 221.500
sum(pluies == 0)/NROW(pluies)
## [1] 0.7762917
quantile(pluies,probs=c(seq(.75,.95,.05),seq(.96,1,.01)))
##   75%   80%   85%   90%   95%   96%   97%   98%   99%  100% 
##   0.0   0.2   1.0   3.3   9.7  12.1  15.8  20.9  30.8 221.5
  • Il pleut en moyenne 15,8 par jours sur la période étudiée (1864–1991)
  • 77,6% des jours n’enregistrent aucune pluie
  • Le quantile à 80% est à 2 de pluie: 4/5 des jours ont une pluviométrie très faible ou nulle.
  • le quantile à 90% est seulement 2 fois plus grand que la moyenne (3.3 mm)
  • le quantile à 99% est environ 20 fois plus grand que la moyenne (31 mm)
  • le maximum atteint 221.5 mm de pluie

Globalement on constate que la majorité des jours sont sans pluie avec des événements très important, mais rare, sur quelques jours par an; plus quelques événements exceptionnels avec une pluviométrie plus de 20 à 100 fois supérieure à la moyenne.

grid.arrange(G1, G2, G3, ncol=1)

On constate, après avoir retiré les jours sans pluie, une décroissance “exponentielle” des niveaux de pluie jusqu’à 500 mm. Entre 500 et 1000, on dénombre encore une centaine d’événements (sur une période de 127 ans). Au-dessus de 100 mm de pluie, les événements extrêmes sont rares.

grid.arrange(G4, G5, ncol=1)

La représentation de la distribution des jours de pluie illustre les éléments décris précédemment. Après le pic de jours sans pluie, on constate une convergence rapide vers 100% de la distribution (des 500mm) ainsi que les événements extrêmes au-dessus de 750/1000 de pluie.

Méthode GEV

Par maximum de vraisemblance (MLE)

gev.diag(gev.fit(maxPluies))
## $conv
## [1] 0
## 
## $nllh
## [1] 585.7141
## 
## $mle
## [1] 45.9274163 19.6773659  0.1003259
## 
## $se
## [1] 1.9455068 1.4532200 0.0608235

Par moments pondérés (PWM)

gevFit(maxPluies, type = "pwm",block=1)
## 
## Title:
##  GEV Parameter Estimation 
## 
## Call:
##  gevFit(x = maxPluies, block = 1, type = "pwm")
## 
## Estimation Type:
##   gev pwm 
## 
## Estimated Parameters:
##        xi        mu      beta 
##  0.123604 45.675999 19.269356 
## 
## Description
##   Mon Jan 28 02:59:56 2019

Comparaison niveaux de retour MLE / PWM:

plot(QPWM~1/seq(100,2000,50), type = "l" , col = "red",xlab="Return Period (années)",
        ylab='Return Level (mm de pluie)', main="")
lines(QMLE~1/seq(100,2000,50), col = "blue")
text(500,200,expression("MLE"))
text(450,240,expression("PWM"))

fExtremes::qgev( 1/200, xi = 0.1001558, mu = 459.2857046, beta = 196.7513408, lower.tail = F)
## [1] 1833.662
## attr(,"control")
##         xi       mu     beta lower.tail
##  0.1001558 459.2857 196.7513      FALSE
fExtremes::qgev( 1/200, xi = 0.123604, mu = 456.759987, beta = 192.693556, lower.tail = F)
## [1] 1897.77
## attr(,"control")
##        xi     mu     beta lower.tail
##  0.123604 456.76 192.6936      FALSE
  • L’estimation par maximum de vraisemblance donne un niveau de retour plus faible que par les moments pondérés
  • Le jeu de données est relativement grand (127 points), on à tendance à préférer la méthode MLE.

Domaine d’attraction et conclusion

Pour les deux méthodes on à * MLE : gamma = 0.1003975 * PWM : gamma = 0.123604

On se trouve donc dans le domaine d’attraction de Fréchet, la distribution du niveau de pluie journalier est à queue lourde. À noter que gamma est tout de même assez proche de 0, ce qui est cohérent avec la distribution observée sur les 127 ans d’historique: une concentration de pluie proche de 0 et quelques événement très extrême.

Méthode GPD

Détermination du seuil

mrl.plot(pluies)

gpd.fitrange(pluies,30,120)

  • Le MRLP semble linéaire en u jusqu’à environ 90
  • le Scale parameter semble attendre un minimum local autour de 60 et 90. On regarde de plus près ces paramètres de seuils:
mrl.plot(pluies,umin = 0, umax = 100)

gpd.fitrange(pluies,40,70)

  • Le MRLP est linéaire en u jusqu’à environ 65, entre 65 et 90 la tendance reste linéaire mais la courbe oscille autour de la tendance. On choisit donc un seuil autour de 50-70.
  • L’analyse du minimum de du scale parameter restant stable nous amène à sélectionner un seuil à 62.5.

Commentaire sur les jours sélectionnés

Par cette méthode on conserve 82 jours, soit moins que par maximum annuel pour la GEV (127 jours). Cependant la moyenne des jours de la GEV est de 59.5 alors qu’elle est de 83 pour les jours sélectionnés par seuil (GPD). Bien que les données de la GPD soient moins nombreuses, elles sont de meilleure qualité pour estimer des événements extrêmes.

Niveaux de retours et comparaison MLE / PWM:

GPD_MLE1 = gpdFit(pluies.ts, u = 62.5, type = "mle")
GPD_PWM1 = gpdFit(pluies.ts, u = 62.5, type = "pwm")
GPD_MLE1
## 
## Title:
##   GPD Parameter Estimation 
## 
## Call:
##  gpdFit(x = pluies.ts, u = 62.5, type = "mle")
## 
## Estimation Method:
##   gpd mle 
## 
## Estimated Parameters:
##         xi       beta 
##  0.3554287 13.7004328 
## 
## Description
##   Mon Jan 28 02:59:57 2019 by user: jb
GPD_PWM1
## 
## Title:
##   GPD Parameter Estimation 
## 
## Call:
##  gpdFit(x = pluies.ts, u = 62.5, type = "pwm")
## 
## Estimation Method:
##   gpd pwm 
## 
## Estimated Parameters:
##         xi       beta 
##  0.3292524 13.7535969 
## 
## Description
##   Mon Jan 28 02:59:57 2019 by user: jb
plot(QMLE_GPD$quantile~1/seq(100,2000,50), type = "l" , col = "red",xlab="Return Period (années)",
        ylab='Return Level (mm de pluie)', main="")
lines(QPWM_GPD$quantile~1/seq(100,2000,50), col = "blue")
text(500,250,expression("MLE"))
text(400,350,expression("PWM"))

  • Comme pour l’approche par GEV, l’estimation par maximum de vraisemblance donne un niveau de retour plus faible que par les moments pondérés

comparaison GEV / GPD

Pour comparer les deux méthodes, on se base sur l’approche par maximum de vraisemblance.

GEV

## $conv
## [1] 0
## 
## $nllh
## [1] 585.7141
## 
## $mle
## [1] 45.9274163 19.6773659  0.1003259
## 
## $se
## [1] 1.9455068 1.4532200 0.0608235

On constate dans le return level plot par GEV que les données s’eloigne du modèle à partir d’une période de retour d’environ 50 ans. Pour le point maximum des 127 années de données la pluviométie se trouve au dessus de l’intervale de confiance à 95%. ce phénomene se retrouve également dans les hautes valeurs du quantile plot. Ainsi la modélisation par GEV semble sous-estimer le niveau de retour. Cela s’explique notamment par une perte d’information lors de la selection des maximum anuelles (comme évoqué précédement).

GDP

## $threshold
## [1] 62.5
## 
## $nexc
## [1] 82
## 
## $conv
## [1] 0
## 
## $nllh
## [1] 325.7653
## 
## $mle
## [1] 13.6946765  0.3558629
## 
## $rate
## [1] 0.001768957
## 
## $se
## [1] 2.7003079 0.1680563

On constate dans le return level plot par GDP que les données suivent bien le modèle. Le quantile plot est également bien meilleur que par l’approche GEV.

Comparaison des niveaux de retour à 100 et 1000 ans

#GEV: MLE
fExtremes::qgev( 1/c(100,1000),  xi = 0.1003062, mu = 45.9285978, beta = 19.6778771, lower.tail = F)[1:2]
## [1] 160.9538 241.9864
#GEV: PWM
fExtremes::qgev( 1/c(100,1000), xi = 0.123604, mu = 45.675999, beta = 19.269356, lower.tail = F)[1:2]
## [1] 165.0591 255.8970
#GDP: MLE
gpdRiskMeasures(GPD_MLE1,p=1-1/(c(100,1000)*365.25))
#GDP: PWM
gpdRiskMeasures(GPD_PWM1,p=1-1/(c(100,1000)*365.25))
  • Les niveaux de retour pour le GEV à 100 ans sont de l’ordre de 160 mm, cependant sur le jeu de données de 127 ans le maximum est 221.5 et deux autres jours sont à plus de 160 mm. Cela se retrouve également sur le return plot par GEV (valeurs au dessus de l’intervalle de confiance). Ainsi l’approche par GEV tend à sous-estimer le niveau de retour pour 100 ans.
  • Les niveaux de retour pour le GPD 100 ans sont de l’ordre de 190 mm. Le retourn plot est également bien meilleur et les données suivent l’estimation par GDP. Ainsi l’approche pas GDP estime mieux le niveau de retour à 100 ans.
  • Les niveaux de retour pour le GEV à 1000 ans sont de l’ordre de 250 mm alors que l’approche par GDP estime un retour de l’ordre de 390 mm de pluies, soit 1.5 fois plus environ. Sachant que le record de pluviométrie journalière moniale est de 1825 mm, on estime donc les prévisions de la méthode GDP à 1000 ans et notamment le shortfall à 620 mm sont également plausible (même si la valeur semble élevée).

Conclusion

Pour cet exercice la comparaison entre les approches par MLE et PWM a également été creusé, in fine ces approches donnent des résultats proches, car les données sont suffisantes. Pour les exercices suivant, afin de se concentrer sur d’autres éléments, le choix de l’approche par MLE ou PWM sera effectué sur la base des données.

Globalement, on constate que la sélection arbitraire de maximums annuels de la méthode GEV entraine la non-prise en compte de valeur extrême. Le modèle par GEV sous-estime donc les niveaux de retour à 100 ans (visible grâce aux données) et donc très probablement les retours à 1000 ans également. La méthode par seuils, même avec moins de données, prend en comptes toutes les valeurs extrêmes, elle donne des niveaux de retours validés par les données et de meilleures qualités.

summary(portpirie)
##       Year         SeaLevel    
##  Min.   :1923   Min.   :3.570  
##  1st Qu.:1939   1st Qu.:3.830  
##  Median :1955   Median :3.960  
##  Mean   :1955   Mean   :3.981  
##  3rd Qu.:1971   3rd Qu.:4.110  
##  Max.   :1987   Max.   :4.690
quantile(portpirie$SeaLevel,probs=c(seq(.75,.95,.05),seq(.96,1,.01)))
##    75%    80%    85%    90%    95%    96%    97%    98%    99%   100% 
## 4.1100 4.1860 4.2280 4.2980 4.3680 4.4492 4.5500 4.5500 4.6004 4.6900
boxplot(portpirie$SeaLevel, ylab = "Sea level")

  • Le jeu de données représente le maximum annuel du niveau de la mer à Port Pirie entre 1923 et 1987
  • le niveau moyen se trouve à environ 4
  • On constate la présence de 3 outliers: 2 à 4.55 et 1 à 4.69 (le maximum du dataset)
GP1

On constate une distribution des maximums annuels globalement centrés sur la médiane et légèrement faussés vers la droite, avec quelques valeurs extrêmes (au-dessus de 4.5).

GP2

La représentation de la distribution du niveau de la mer ressemble à la fonction de répartition d’une loi normale avec une pente qui converge moins rapidement à droite. Cela est dû aux valeurs extrêmes élevées sur l’axe des x.

Méthode GEV

Par maximum de vraisemblance (MLE)

gev.diag(gev.fit(portpirie$SeaLevel))
## $conv
## [1] 0
## 
## $nllh
## [1] -4.339058
## 
## $mle
## [1]  3.87474692  0.19804120 -0.05008773
## 
## $se
## [1] 0.02793211 0.02024610 0.09825633

Par moments pondérés (PWM)

gevFit(portpirie$SeaLevel, type = "pwm",block=1)
## 
## Title:
##  GEV Parameter Estimation 
## 
## Call:
##  gevFit(x = portpirie$SeaLevel, block = 1, type = "pwm")
## 
## Estimation Type:
##   gev pwm 
## 
## Estimated Parameters:
##          xi          mu        beta 
## -0.05119127  3.87314570  0.20321876 
## 
## Description
##   Mon Jan 28 02:59:59 2019

Comparaison niveaux de retours MLE / PWM:

plot(E2QPWM~1/seq(100,2000,50), type = "l" , col = "red",xlab="Return Period (années)",
     ylab='Return Level (mm de pluie)', main="")
lines(E2QMLE~1/seq(100,2000,50), col = "blue")
text(500,4.87,expression("MLE"))
text(450,5,expression("PWM"))

  • L’estimation par maximum de vraisemblance donne un niveau de retour légèrement plus faible que par les moments pondérés
  • Globalement l’estimation des paramètres par MLE et PWM sont très proches.

Domaine d’attraction et conclusion

Pour les deux méthodes on à * MLE : $gamma = -0.05013639 * PWM : $gamma = -0.05119127

On se trouve donc dans le domaine d’attraction de Weibull, la distribution du niveau de pluie journalier est à queue légère. À noter que gamma est tout de même assez proche de 0, ce qui est cohérent avec la distribution observée sur les 64 ans d’historique: une concentration des hauteurs d’eau proche de la médiane et quelques événement extrêmes.

Pour l’estimation des niveaux de retour on choisi d’utiliser la moyenne des paramètres estimés par PWM et MLE:

xim= mean(-0.05013639,-0.05119127)
mum = mean(3.87475503,3.87314570)
betam = mean(0.19804734,0.20321876)

Niveaux de retours à 100 et 1000 ans

#100 ans , 1000 ans
fExtremes::qgev( 1/c(100,1000),  xi = xim, mu = mum, beta = betam , lower.tail = F)[1:2]
## [1] 4.688374 5.030983
5.030983 - 4.688374
## [1] 0.342609

Conclusion

Le niveau de retour à 100 ans est similaire au maximum des données (sur une période de 64 ans). L’estimation des valeurs extrêmes de Port Pirie fait ressortir un modèle à queue légère. Pour un niveau de retour à 1000 ans on se trouve seulement 34 cm plus haut que pour un retour à 100 ans.

Bien que le phénomène de marée, dépendant de la position de la lune, est plutôt similaire au fil des ans. Les valeurs extrêmes de niveau donc sont conditionnées par des phénomènes météorologiques. Dans l’exercice précédent, on à pu constater que l’approche GEV tend à sous-estimés les niveaux de retours. Il serait surement préférable de refaire l’exercice avec des données journalières. Surtout dans l’hypothèse ou une telle analyse serait utilisé pour définir des normes de sécurités. De plus, les niveaux de retours ne prennent pas en compte les effets du réchauffement climatique et de la montée des eaux qui atteindra certainement plusieurs mètres à 100 ans peut-être des dizaines à 1000 ans.

Exercice 3 - Temps100m

Transformation des données

Les temps, en secondes pour 100m, sont transformés en vitesse moyenne (sur 100m): en kilomètres par heures.

speed = (100/time) * 3.6

Statistiques descriptives

summary(speed)
##      speed      
##  Min.   :34.93  
##  1st Qu.:35.08  
##  Median :35.31  
##  Mean   :35.45  
##  3rd Qu.:35.74  
##  Max.   :37.58
quantile(speed$speed,probs=c(seq(.75,.95,.05),seq(.96,1,.01)))
##      75%      80%      85%      90%      95%      96%      97%      98% 
## 35.74443 35.80828 35.93467 36.06109 36.25977 36.31006 36.39488 36.50140 
##      99%     100% 
## 36.58983 37.57829
boxplot(speed$speed, ylab = "km/h" , main = "Boxplot des vitesses moyennes au 100m")

max(speed)/min(speed)-1
## [1] 0.07566806

Les records individuels de vitesses sur 100m sont tous très proches avec moins de 2 km/h de différence entre le min et le max, soit une vitesse seulement 7,6% supérieure pour le meilleur temps contre le plus long. La majorité du temps est compris entre 35 et 35 km/h avec une médiane de 35,3 km/h,les valeurs “extrêmes” sont au-dessus de 36,7 km/h.

Le jeu de données ne comportant que les meilleurs athlètes de la discipline, la distribution de la vitesse commence vers 35 km/h avec un pic entre 35 et 35.4 km/h. On observe que le nombre de records diminue de façon régulière avec un creux autour de 35.5 km/h. Ceci quel que soit le choix du nombre de bandes de l’histogramme. Ce phénomène est aussi visible sur la courbe de distribution des temps dont la pente diminue légèrement autour du même intervalle de temps. On observe bien les valeurs extrêmes et rares dans la queue de distribution pour des vitesses supérieures à 36.6 km/h.

Méthode GPD

Détermination du seuil

mrl.plot(speed)

gpd.fitrange(speed$speed,35,37.1)

  • Le MRLP semble linéaire en u jusqu’à environ 36.5
  • le Scale parameter semble attendre un minimum local autour de 36.2 et 36.5 On regarde de plus près ces paramètres de seuils:
mrl.plot(speed,umin = 36, umax = 36.6)

gpd.fitrange(pluies,36,36.6)

NROW(which(speed >36.246))
## [1] 54
NROW(which(speed >36.494))
## [1] 22

L’opération est répétée en rétrécissant les intervalles de seuils observés. On repère deux choix potentiels pour le seuil :

  • u1 = 36.246
  • u2 = 36.494

Le nombre de valeurs au-dessus de ces seuils est:

  • u1 : 54 valeurs
  • u2 : 22 valeurs

Étant données la très faire différences entres les records, on observe que la très petite différence entre les seuils entraine une diminution du nombre de données conservées d’un facteur supérieur à 2 ! Par ailleurs, vu le petit nombre de données il sera pertinent de comparer les estimations par MLE et PWM en complément de celle avec les deux seuils.

Comparaison des niveaux de retour selon plusieurs seuils et approche par MLE / PWM

Afin de bien comparer l’effet du choix du seuil, on regarde également les niveaux de retour pour u0 = 36.1.

Les records de temps ont été collectés entre janvier 1991 et avril 2017, soit une période d’observation de 26.33 ans. Cela représente environ 38.16939 observations par ans. Cetee valeur est utilisé pour le paramètre npy de la fonction (au lieu de 365 par défaut).

NROW(speed)/26.33
## [1] 38.16939
gpd.diag(gpd.fit(speed$speed, 36.1, type = "mle" , npy = 38.16939))
## $threshold
## [1] 36.1
## 
## $nexc
## [1] 90
## 
## $conv
## [1] 0
## 
## $nllh
## [1] -29.54477
## 
## $mle
## [1]  0.26867039 -0.01395765
## 
## $rate
## [1] 0.08955224
## 
## $se
## [1] 0.03913187 0.10052251

gpd.diag(gpd.fit(speed$speed, 36.246, type = "mle", npy = 38.16939))
## $threshold
## [1] 36.246
## 
## $nexc
## [1] 54
## 
## $conv
## [1] 0
## 
## $nllh
## [1] -21.01285
## 
## $mle
## [1] 0.23352138 0.06540733
## 
## $rate
## [1] 0.05373134
## 
## $se
## [1] 0.04798648 0.15423494

gpd.diag(gpd.fit(speed$speed, 36.494, type = "mle", npy = 38.16939))
## $threshold
## [1] 36.494
## 
## $nexc
## [1] 22
## 
## $conv
## [1] 0
## 
## $nllh
## [1] -11.45763
## 
## $mle
## [1] 0.1344225 0.4860081
## 
## $rate
## [1] 0.02189055
## 
## $se
## [1] 0.05990692 0.40485443

On observque que les niveaux de retours pour u1 et u2 sont très différent. * u0 et u1: les niveaux retours à 100 sont infèrent à 38 km/h, à 1000 ans ils sont inférieurs à 40 km/h avec l’intervalle la partie supérieure de l’intervalle de confiance qui ne diverge pas beaucoup et reste inférieure à 42 km/h * u2 : Le niveau de retour augmente rapidement pour des périodes supérieures à 100 ans (vitesse supérieure à 50 km/h). La partir supérieur de l’intervalle de confiance explose é plus de 120 km/h pour 1000 ans. Le quantile plot pour ce seuil est également moins bon que pour u0 et u1

Ce jeu de donnée illustre bien l’importance du choix du seuil, avec u2: les niveaux de retour sont calculés avec peu de valeurs et l’information sur la distribution des temps est perdue. Dans ce cas : le poids du record à 37.6 km/h pèse plus dans l’algorithme et le niveau de retour croît plus rapidement. L’intervalle de confiance plus grand est également dû au plus petit nombre de données disponibles pour un seuil élevé.

En détail pour des retours à 100 et 1000 ans:

gpdRiskMeasures(gpdFit(speed$speed, 36.1, type = "mle"),p=1-1/(c(100,1000,1000000)*38.16939)) #u0 ; xi = -0.01386947
gpdRiskMeasures(gpdFit(speed$speed, 36.1, type = "pwm"),p=1-1/(c(100,1000,1000000)*38.16939)) #u0 ; xi = -0.05177775
gpdRiskMeasures(gpdFit(speed$speed, 36.246, type = "mle"),p=1-1/(c(100,1000,1000000)*38.16939)) #u1 ; xi = 0.06558299
gpdRiskMeasures(gpdFit(speed$speed, 36.246, type = "pwm"),p=1-1/(c(100,1000,1000000)*38.16939)) #u1 ; xi = 0.08638675
gpdRiskMeasures(gpdFit(speed$speed, 36.494, type = "mle"),p=1-1/(c(100,1000,1000000)*38.16939)) #u2 ; xi = 0.4859933
gpdRiskMeasures(gpdFit(speed$speed, 36.494, type = "pwm"),p=1-1/(c(100,1000,1000000)*38.16939)) #u2 ; xi = 0.3749370

interprétation des résultats / conclusion

Comme illustré sur les courbes précédents, les niveaux de retours pour les seuils u0 et u1 sont compris entre 37.5 et 37.8 sur 100 ans et entre 38 et 38.7 sur 1000 ans. Le shortfall maximum pour ces 2 seuils est de 39.1 km/h. Ces estimations sont cohérentes avec phénomène que l’on souhaite modéliser. En effet, la vitesse maximale est déterminée par des aspects physiologiques, le corps humain est déjà poussé au maximum pour le 100m et les améliorations de chronomètres sont extrêmement minimes.

Les niveaux de retours pour le seuil u2 sont excessivement grands pour le phénomène analysé et donc faux. Ce seuil permettre cependant de constater quelque chose d’intéressant pour la comparaison des approches MLE et PWM: contrairement aux seuils précédents ou les retours sont proche, l’approche PWM avec u2 donne des retours beaucoup plus faibles pour de longues périodes. On voit bien que les moments pondérés marchent mieux quand le nombre de données est faible.

Finalement, on remarque aussi que le gamma change beaucoup selon le seuil utilisé: * Pour u0 le signe est négatif on à donc une convergence vers une vitesse maximum (inférieur à 40 km/h qui ne peut pas être dépassé. Ce seuil permet donc de trouver la limite théorique du corps humain. * Pour u1, gamma est positif et proche de 0 donc le maximum augmente très longtemps. Ce résultat pourrait être étament valide dans la mesure ou le niveau de retour croit très lentement avec environ 42 km/h pour 1 million d’années. Sur des périodes aussi longues, il serait possible de voir émerger des variations dans l’ADN permettant de courir plus vite. Après tout, l’homme de Néandertal dont les traces datent de 35 000 ans BC avant une masse musculaire bien plus importante que nous. * Pour u2, la gamme reste inférieure à 1: donc les queues reste légères, le niveau de retour à 1 million d’années pour l’approche MLE donne une vitesse de voiture de course, ne pouvant évidemment pas être atteinte par le corps humain ou relevant plutôt de la science-fiction d’un humain augmenté…

Au vu des ces éléments on retient le seuil u1 avec une approche MLE comme le meilleur modèle.

Discussion

Le choix de diviser l’intervalle de temps par le nombre de records est assez arbitraire, car évident le dataset ne prends pas en compte tous les coureurs hauts niveaux…. le nombre de records est également fonction de la population mondiale totale qui était de 5.4 milliards en 1990; 7,5 B en 2017 et estimés à 11.2 B en 2100. l’augmentation du nombre de records modifiai la période de retour uniquement pour u1.