Hva er kryssvalidering?
Kryssvalidering er en metode som brukes i kjemi og et bredt spekter av andre vitenskapelige felt for å sammenligne resultatene fra flere eksperimentelle metoder med samme mål. Ideelt sett vil kryssvalidering validere begge eksperimentelle metoder ved å returnere de samme resultatene. Ulike resultater kan indikere menneskelig feil eller feil i eksperimentell design. Forskjellene kan brukes til å identifisere feil og for å avgrense en eller flere av de eksperimentelle metodene inntil konsistente og repeterbare resultater er oppnådd.
For at kryssvalidering skal være vellykket, er det generelt nødvendig for forskere å vite at en av metodene gir nøyaktige resultater. Målet er da å gjøre den nye og ubekreftede metoden, eller komparatoren, tilbake resultater som er identiske med den kjente metoden, eller referansen. Hvis ingen av metodene er kjent for å være nøyaktige, kan de sannsynligvis justeres for å gi de samme resultatene, men det er fortsatt ingen garanti for at resultatene er riktige.
Forskere bruker ofte kryssvalidering når de introduserer en ny, mer effektiv eksperimentell metode som er ment å erstatte en eldre metode. Den nye metoden er bare nyttig hvis den kan brukes til samme formål som metoden den er ment å erstatte. Kryssvalidering brukes for å sikre at den nye metoden er like effektiv som den gamle, og at effektiviteten ikke kommer til prisen for nøyaktighet.
Resultatene fra eksperimenter brukt for kryssvalidering kan utarbeides kvalitativt eller kvantitativt basert på eksperimentets art. Suksessen til noen enkle kjemieksperimenter kan vurderes gjennom enkle visuelle signaler som fargeendring. En ny metode som resulterer i samme fargeendring, kan i noen tilfeller bedømmes som vellykket. Mest moderne vitenskapelig forskning er imidlertid i stor grad basert på kvantitative metoder. Som sådan må kvantitativ informasjon sammenlignes, og forskjeller i numeriske data brukes for å bedømme suksess eller fiasko av et valideringseksperiment.
Mye kryssvalideringsresultat er avhengig av store mengder statistiske data snarere enn på kvalitativ informasjon eller på en eller to verdier som temperatur eller surhet. For slike statistiske data er det ikke et enkelt spesifikt antall eller sett med tall som er riktige mens alle andre er uriktige. Suksessen med en kryssvalidering bedømmes ut fra om de returnerte dataene faller innenfor en viss terskel for akseptabel feil. I slike eksperimenter kan noen av de returnerte verdiene være akseptable mens andre er feilaktige, noe som indikerer at bestemte deler av de testede metodene må revideres.