Qu'est-ce que l'interpolation?
L'interpolation implique la découverte d'un motif dans un ensemble de points de données pour estimer une valeur entre deux points. L’interpolation linéaire est l’un des moyens les plus simples d’interpoler: une ligne reliant deux points sert à estimer les valeurs intermédiaires. Les polynômes d'ordre supérieur peuvent remplacer les fonctions linéaires pour des résultats plus précis, mais plus compliqués. L'interpolation peut être comparée à l'extrapolation, qui est utilisée pour estimer des valeurs en dehors d'un ensemble de points plutôt qu'entre eux.
Un ensemble discret de points de données a des points avec deux coordonnées ou plus. Dans un diagramme de dispersion XY typique, la variable horizontale est x et la variable verticale est y. Les points de données avec une coordonnée x et y peuvent être tracés sur ce graphique pour une visualisation facile. Dans les applications pratiques, x et y représentent tous deux des quantités finies du monde réel. X représente généralement une variable indépendante, telle que le temps ou l'espace, tandis que y représente une variable dépendante, telle que la population.
Souvent, les données ne peuvent être rassemblées qu'à des points distincts. Dans l'exemple du suivi de la population d'un pays, un recensement ne peut être effectué qu'à certaines heures. Ces mesures pourraient être représentées sous forme de points de données discrets sur un graphique XY.
Si un recensement n'est effectué que tous les cinq ans, il est impossible de connaître la population exacte entre les recensements. En interpolation linéaire, deux points de données sont connectés à une fonction linéaire. Cela signifie que la variable dépendante (population) est supposée changer à un taux constant pour atteindre le prochain point de données. Si la population est nécessaire un an après un recensement, on peut interpoler linéairement les deux points de données pour estimer une valeur intermédiaire basée sur la ligne de raccordement. Il est généralement évident que la variable réelle ne change pas linéairement entre les points de données, mais cette simplification est souvent suffisamment précise.
Parfois, cependant, l’interpolation linéaire introduit trop d’erreur dans ses estimations. La population, par exemple, présente une croissance exponentielle dans de nombreux scénarios. En croissance exponentielle, le taux de croissance lui-même augmente - une population plus élevée entraîne plus de naissances, ce qui augmente le taux total d'augmentation de la population. Dans un diagramme de dispersion XY, ce type de comportement indiquerait une tendance «incurvée vers le haut». Une méthode d'interpolation plus précise peut être appropriée pour ce type d'étude.
L'interpolation polynomiale implique la connexion de nombreux points de données avec une fonction polynomiale. Une fonction linéaire est en réalité une simple variété d'une fonction polynomiale, à savoir un polynôme d'ordre un. Les polynômes peuvent cependant avoir des ordres supérieurs à un: ordre deux est une parabole, ordre trois est une fonction cubique, etc. Un ensemble de points de données de population peut être mieux interpolé avec une fonction polynomiale qu’une fonction linéaire car la première peut être courbée vers le haut ou le bas pour correspondre aux données.