Wat is kruisvalidatie?
Kruisvalidatie is een methode die wordt gebruikt in de chemie en een breed scala van andere wetenschappelijke velden om de resultaten van meerdere experimentele methoden met hetzelfde doel te vergelijken. Idealiter valideert kruisvalidatie beide experimentele methoden door dezelfde resultaten te retourneren. Verschillende resultaten kunnen wijzen op menselijke fouten of fouten in het experimentele ontwerp. De verschillen kunnen worden gebruikt om fouten te identificeren en een of meer van de experimentele methoden te verfijnen totdat consistente en herhaalbare resultaten worden verkregen.
Om cross-validatie succesvol te laten zijn, is het in het algemeen noodzakelijk dat onderzoekers weten dat een van de methoden nauwkeurige resultaten oplevert. Het doel is dan om de nieuwe en niet-bevestigde methode, of de vergelijker, de resultaten identiek te maken aan die van de bekende methode, of de referentie. Als van geen van beide methoden bekend is dat ze nauwkeurig zijn, kunnen ze waarschijnlijk worden aangepast om dezelfde resultaten te geven, maar er is nog steeds geen garantie dat deze resultaten correct zijn.
Onderzoekers gebruiken vaak kruisvalidatie bij het introduceren van een nieuwe, efficiëntere experimentele methode die bedoeld is om een oudere methode te vervangen. De nieuwe methode is alleen nuttig als deze voor hetzelfde doel kan worden gebruikt als de methode die deze moet vervangen. Kruisvalidatie wordt gebruikt om ervoor te zorgen dat de nieuwe methode net zo effectief is als de oude en dat efficiëntie niet ten koste gaat van de nauwkeurigheid.
De resultaten van experimenten die worden gebruikt voor kruisvalidatie kunnen kwalitatief of kwantitatief worden opgesteld op basis van de aard van het experiment. Het succes van enkele eenvoudige chemie-experimenten kan worden beoordeeld door eenvoudige visuele aanwijzingen, zoals kleurverandering. Een nieuwe methode die resulteert in dezelfde kleurverandering kan in sommige gevallen als succesvol worden beschouwd. Het meeste moderne wetenschappelijke onderzoek is echter grotendeels gebaseerd op kwantitatieve methoden. Als zodanig moet kwantitatieve informatie worden vergeleken en worden verschillen in numerieke gegevens gebruikt om het succes of falen van een validatie-experiment te beoordelen.
Veel cross-validatieresultaten berusten op grote hoeveelheden statistische gegevens in plaats van op kwalitatieve informatie of op een of twee waarden zoals temperatuur of zuurgraad. Voor dergelijke statistische gegevens is er geen specifiek nummer of een reeks getallen die correct is, terwijl alle andere onjuist zijn. Het succes van een kruisvalidatie wordt beoordeeld op basis van het feit of de geretourneerde gegevens al dan niet binnen een bepaalde drempel van aanvaardbare fouten vallen. In dergelijke experimenten kunnen sommige van de geretourneerde waarden acceptabel zijn, terwijl andere onjuist zijn, wat aangeeft dat bepaalde delen van de geteste methoden moeten worden herzien.