Che cos'è l'interpolazione?
L'interpolazione implica la scoperta di un modello in un insieme di punti dati per stimare un valore tra due punti. L'interpolazione lineare è uno dei modi più semplici per interpolare: una linea che collega due punti viene utilizzata per stimare i valori intermedi. I polinomi di ordine superiore possono sostituire le funzioni lineari per risultati più precisi, ma più complicati. L'interpolazione può essere contrapposta all'estrapolazione, che viene utilizzata per stimare i valori al di fuori di un insieme di punti anziché tra di loro.
Un insieme discreto di punti dati ha punti con due o più coordinate. In un tipico diagramma a dispersione XY, la variabile orizzontale è x e la variabile verticale è y. I punti dati con coordinate X e Y possono essere tracciati su questo grafico per una facile visualizzazione. Nelle applicazioni pratiche, sia x che y rappresentano quantità finite del mondo reale. X rappresenta generalmente una variabile indipendente, come il tempo o lo spazio, mentre y rappresenta una variabile dipendente, come la popolazione.
Spesso, i dati possono essere raccolti solo in punti discreti. Nell'esempio di monitoraggio della popolazione di un paese, un censimento può essere preso solo in determinati momenti. Queste misurazioni potrebbero essere tracciate come punti dati discreti su un grafico XY.
Se un censimento viene eseguito solo ogni cinque anni, è impossibile conoscere la popolazione esatta tra i censimenti. Nell'interpolazione lineare, due punti dati sono collegati con una funzione lineare. Ciò significa che si presume che la variabile dipendente (popolazione) cambi a velocità costante per raggiungere il successivo punto dati. Se è necessaria la popolazione un anno dopo il censimento, si potrebbero interpolare linearmente i due punti dati per stimare un valore intermedio basato sulla linea di collegamento. È in genere ovvio che la variabile reale non cambia linearmente tra i punti dati, ma questa semplificazione è spesso sufficientemente accurata.
A volte, tuttavia, l'interpolazione lineare introduce troppi errori nelle sue stime. La popolazione, ad esempio, mostra una crescita esponenziale in molti scenari. Nella crescita esponenziale, il tasso di crescita stesso sta aumentando: una popolazione più elevata porta a più nascite, il che aumenta il tasso totale con cui la popolazione aumenta. In un diagramma a dispersione XY, questo tipo di comportamento mostrerebbe una tendenza che "curva verso l'alto". Un metodo più accurato di interpolazione può essere appropriato per questo tipo di studio.
L'interpolazione polinomiale comporta il collegamento di numerosi punti dati con una funzione polinomiale. Una funzione lineare è in realtà una semplice varietà di una funzione polinomiale, vale a dire un polinomio di ordine uno. I polinomi, tuttavia, possono avere ordini più alti di uno: l'ordine due è una parabola, l'ordine tre è una funzione cubica e così via. Un insieme di punti di dati sulla popolazione potrebbe essere meglio interpolato con una funzione polinomiale rispetto a una funzione lineare perché il primo può curvare su e giù per abbinare i dati.