Hvad er tværvalidering?

Krydsvalidering er en metode, der anvendes inden for kemi og en lang række andre videnskabelige felter for at sammenligne resultaterne af flere eksperimentelle metoder med det samme mål. Ideelt set validerer krydsvalidering af begge eksperimentelle metoder ved at returnere de samme resultater. Forskellige resultater kan indikere menneskelig fejl eller fejl i eksperimentelt design. Forskellene kan bruges til at identificere fejl og til at forfine en eller flere af de eksperimentelle metoder, indtil der er opnået konsistente og gentagne resultater.

For at krydsvalidering skal være vellykket, er det generelt nødvendigt for forskere at vide, at en af ​​metoderne giver nøjagtige resultater. Målet er derfor at gøre den nye og ubekræftede metode, eller komparatoren, returnerende resultater identiske med dem, der er kendt for den kendte metode eller referencen. Hvis ingen af ​​metoderne vides at være nøjagtige, kan de sandsynligvis justeres for at returnere de samme resultater, men der er stadig ingen garanti for, at disse resultater er korrekte.

Forskere bruger ofte krydsvalidering, når de introducerer en ny, mere effektiv eksperimentel metode, der er beregnet til at erstatte en ældre metode. Den nye metode er kun nyttig, hvis den kan bruges til samme formål som den metode, den er beregnet til at erstatte. Krydsvalidering bruges til at sikre, at den nye metode er lige så effektiv som den gamle, og at effektiviteten ikke kommer til prisen for nøjagtighed.

Resultaterne af eksperimenter anvendt til krydsvalidering kan fremstilles kvalitativt eller kvantitativt baseret på eksperimentets art. Succesen med nogle enkle kemieksperimenter kan vurderes gennem enkle visuelle signaler såsom farveændring. En ny metode, der resulterer i den samme farveændring, kan i nogle tilfælde vurderes som vellykket. Mest moderne videnskabelig forskning er dog stort set baseret på kvantitative metoder. Som sådan skal kvantitativ information sammenlignes, og forskelle i numeriske data bruges til at bedømme succes eller fiasko med et valideringseksperiment.

Meget krydsvalideringsresultat er afhængig af store organer af statistiske data snarere end på kvalitativ information eller på en eller to værdier såsom temperatur eller surhedsgrad. For sådanne statistiske data er der ikke et enkelt specifikt antal eller sæt af numre, der er korrekte, mens alle andre er forkerte. Succesen med en krydsvalidering vurderes ud fra, om de returnerede data falder inden for en bestemt tærskel for acceptabel fejl. I sådanne eksperimenter kan nogle af de returnerede værdier være acceptable, mens andre er forkerte, hvilket indikerer, at bestemte dele af de testede metoder skal revideres.

ANDRE SPROG

Hjalp denne artikel dig? tak for tilbagemeldingen tak for tilbagemeldingen

Hvordan kan vi hjælpe? Hvordan kan vi hjælpe?