Che cos'è un errore a cascata?
Un guasto a cascata è una condizione dei sistemi interconnessi quando il guasto di una parte o componente può portare a un guasto nelle aree correlate del sistema che si propaga fino al punto di un guasto generale del sistema. Esistono molti tipi di eventi di guasto a cascata che possono verificarsi in sistemi naturali e artificiali, dai sistemi elettrici e informatici a sistemi politici, economici ed ecologici. Il campo di ricerca noto come scienza della complessità tenta di definire le cause profonde di tali fallimenti in modo da integrare garanzie che potrebbero essere in grado di prevenirle in futuro.
Un tipo comune ma difficile da prevedere di eventi a cascata in cascata è un singolo punto di errore, in cui un componente si guasta e inspiegabilmente porta a un effetto domino, innescando una rapida diffusione della condizione ad altre parti del sistema. Un esempio di ciò ebbe luogo nel 1996 negli Stati Uniti, quando una linea elettrica nello stato dell'Oregon fallì e innescò un grave fallimento della rete elettrica negli Stati Uniti occidentali e in Canada, colpendo tra 4.000.000 e 10.000.000 di clienti. Quando la linea di trasmissione si guastò, causò la rottura della rete elettrica regionale in isole di trasmissione separate che non erano in grado di gestire l'aumento del carico, e quindi fallirono, portando al crollo dell'intero sistema. Un analogo fallimento a cascata si è verificato nello stato medio-occidentale degli Stati Uniti dell'Ohio nel 2003, che ha portato al più grande blackout elettrico nella storia degli Stati Uniti.
Spesso, un errore a cascata coinvolge più sistemi che falliscono a causa dell'effetto farfalla, in cui un evento apparentemente molto piccolo si diffonde per produrne uno molto più grande. Ne è un esempio lo schianto di un aereo DC-10 su Parigi, in Francia, nel 1974, che uccise tutti a bordo. Un'indagine successiva sulla causa dell'incidente ha rivelato che una porta della stiva non era stata chiusa correttamente. L'uomo più direttamente responsabile di ciò, presumibilmente, non sapeva leggere l'inglese e quindi non era in grado di leggere le istruzioni su come chiudere correttamente la porta.
Il design tecnico della porta cargo ha permesso di chiuderla senza che i fermi fossero completamente agganciati. Mentre l'aereo saliva a 3.962 metri (13.000 piedi), la pressione interna causava il cedimento della porta e l'esplosiva decompressione attorno alla porta mentre faceva esplodere i controlli idraulici danneggiati nell'area, il che causava alla fine la perdita del controllo completo dei piloti velivoli. La causa principale di tale fallimento a cascata è difficile da determinare. Comprende le regioni dell'istruzione, le politiche governative per l'assunzione di immigrati, i progetti di ingegneria per l'idraulica e l'avionica e i sistemi informali di supporto sociale all'interno dell'ambiente di lavoro.
Le reti elettriche dei sistemi ad alta tensione sono l'esempio più evidente di grandi eventi di guasto a cascata, ma i guasti nei sistemi di grandi dimensioni non sono rari. Dagli ingorghi agli arresti del mercato o agli incendi boschivi che iniziano con una sola scintilla, i grandi arresti anomali del sistema sono spesso il risultato diretto di ciò che è noto come un evento di fallimento bizantino, in cui un elemento di un sistema si guasta in modo insolito, continuando spesso a funzione e corrompendo il suo ambiente prima che si spenga completamente. Tali eventi rivelano una condizione di base di tutti i sistemi complessi descritti dalla teoria del caos, che è quella della dipendenza sensibile. Ci si aspetta che ogni parte di un sistema si comporti entro un certo intervallo di parametri e, quando si allontana da tale intervallo, può iniziare una reazione a catena che altera il comportamento dell'intero sistema.
La sindrome di Kessler è un esempio tra i molti in cui la scienza sta cercando di anticipare la curva e prevedere un fallimento a cascata prima che si verifichi. Basato sulle teorie di Donald Kessler nel 1978, uno scienziato americano che lavora per la National Aeronautics and Space Administration (NASA), traccia gli effetti della collisione di oggetti nell'orbita terrestre bassa (LEO). Tali collisioni nel tempo alimenteranno un aumento esponenziale del numero di piccole particelle in LEO, noto come cinghia di detriti, rendendo i viaggi nello spazio molto più rischiosi di prima. Oltre 500.000 pezzi di detriti in orbita che viaggiano fino a 17.500 miglia all'ora (28.164 chilometri all'ora) sono rintracciati a partire dal 2011 su base continua per evitare future collisioni catastrofiche. Una particella piccola come un marmo potrebbe arrecare danni irreparabili a un veicolo spaziale militare o scientifico all'impatto, causando possibili morti o impatti politici ed ecologici di proporzioni impreviste.