Vad är korsvalidering?
Korsvalidering är en metod som används inom kemi och ett brett spektrum av andra vetenskapliga områden för att jämföra resultaten från flera experimentella metoder med samma mål. Helst validerar korsvalidering av båda experimentella metoderna genom att returnera samma resultat. Olika resultat kan indikera mänskliga fel eller fel i experimentell design. Skillnaderna kan användas för att identifiera fel och för att förfina en eller flera av de experimentella metoderna tills konsekventa och repeterbara resultat erhålls.
För att korsvalidering ska bli framgångsrik är det i allmänhet nödvändigt för forskare att veta att en av metoderna ger exakta resultat. Målet är då att göra den nya och okontrollerade metoden, eller komparatorn, tillbaka resultat som är identiska med de för den kända metoden eller referensen. Om ingen av metoderna är kända för att vara korrekta, kan de antagligen justeras för att ge samma resultat, men det finns fortfarande ingen garanti för att dessa resultat är korrekta.
Forskare använder ofta korsvalidering när de introducerar en ny, mer effektiv experimentell metod som är avsedd att ersätta en äldre metod. Den nya metoden är bara användbar om den kan användas för samma ändamål som den metod som den är avsedd att ersätta. Korsvalidering används för att säkerställa att den nya metoden är lika effektiv som den gamla och att effektiviteten inte kommer till priset på noggrannhet.
Resultaten av experiment som används för korsvalidering kan beredas kvalitativt eller kvantitativt baserat på experimentets art. Framgången för några enkla kemiexperiment kan bedömas genom enkla visuella signaler som färgförändring. En ny metod som resulterar i samma färgförändring kan i vissa fall bedömas som framgångsrik. Den mest moderna vetenskapliga forskningen baseras dock till stor del på kvantitativa metoder. Som sådan måste kvantitativ information jämföras och skillnader i numerisk data används för att bedöma framgången eller misslyckandet med ett valideringsexperiment.
Mycket korsvalideringsresultat förlitar sig på stora mängder statistiska data snarare än på kvalitativ information eller på ett eller två värden som temperatur eller surhet. För sådana statistiska uppgifter finns det inget enda specifikt antal eller uppsättning nummer som är korrekta medan alla andra är felaktiga. Framgången för en korsvalidering bedöms utifrån huruvida de returnerade uppgifterna faller inom ett visst tröskel för acceptabelt fel. I sådana experiment kan vissa av de återgivna värdena vara acceptabla medan andra är felaktiga, vilket indikerar att vissa delar av de testade metoderna måste revideras.