Hva er kryssvalidering?
Kryssvalidering er en metode som brukes i kjemi og et bredt spekter av andre vitenskapelige felt for å sammenligne resultatene av flere eksperimentelle metoder med samme mål. Ideelt sett vil kryssvalidering validere begge eksperimentelle metoder ved å returnere de samme resultatene. Ulike resultater kan indikere menneskelig feil eller feil i eksperimentell design. Forskjellene kan brukes til å identifisere feil og for å avgrense en eller flere av eksperimentelle metoder inntil konsistente og repeterbare resultater er oppnådd.
For at kryssvalidering skal være vellykket, er det generelt nødvendig at forskere vet at en av metodene returnerer nøyaktige resultater. Målet er da å gjøre den nye og ubekreftede metoden, eller komparatoren, avkastningsresultater som er identiske med de som er kjent med den kjente metoden, eller referansen. Hvis ingen av metoden er kjent for å være nøyaktig, kan de sannsynligvis justeres for å returnere de samme resultatene, men det er fremdeles ingen garanti for at resultatene er riktige.
Forskere bruker ofte kryss-validaNår du introduserer en ny, mer effektiv eksperimentell metode som er ment å erstatte en eldre metode. Den nye metoden er bare nyttig hvis den kan brukes til samme formål som metoden den er ment å erstatte. Kryssvalidering brukes for å sikre at den nye metoden er like effektiv som den gamle og at effektiviteten ikke kommer til prisen for nøyaktighet.
Resultatene fra eksperimenter som brukes til kryssvalidering kan fremstilles kvalitativt eller kvantitativt basert på eksperimentet. Suksessen til noen enkle kjemieksperimenter kan vurderes gjennom enkle visuelle signaler som fargeendring. En ny metode som resulterer i samme fargeendring kan i noen tilfeller bedømt vellykket. Mest moderne vitenskapelig forskning er imidlertid i stor grad basert på kvantitative metoder. Som sådan må kvantitativ informasjon sammenlignes, og forskjeller i numeriske data brukes til å bedømme Success eller svikt i et valideringseksperiment.
Mye kryssvalideringsresultat er avhengig av store organer av statistiske data snarere enn på kvalitativ informasjon eller på en eller to verdier som temperatur eller surhet. For slike statistiske data er det ikke noe spesifikt antall eller sett med tall som er riktige mens alle andre er feil. Suksessen med en kryssvalidering blir bedømt ut fra om dataene som returneres faller innenfor en viss terskel for akseptabel feil. I slike eksperimenter kan noen av de returnerte verdiene være akseptable, mens andre er feilaktige, noe som indikerer at bestemte deler av de testede metodene må revideres.