Vilka är de olika typerna av backteststrategier?
Det finns tre vanliga strategier för backtestingstrategier: med faktiska prisuppgifter uppdelade i tre grupper; bootstrap, som använder faktiska prisdata men omampulerar den; och Monte Carlo-simulering. Det finns teoretiska problem som delar systembyggare över vilken metod som är bäst. Det som är viktigt för näringsidkaren är att han korrekt använder minst en av backteststrategierna i sitt system innan han litar på sitt handelskapital till det. En avgörande fråga när man väljer en backteststrategi är antalet genererade handel; åtminstone 1 000 affärer behövs i varje fas av systembyggarens arbete.
Att använda faktiska prisuppgifter, indelade i tre delar, är den vanliga utgångspunkten för de flesta systembyggare. Systemet skapas med den första tredjedelen av data. Vid denna tidpunkt har byggaren hittat algoritmer som verkar generera tillräckligt med vinst med tillräckligt liten risk för att kunna erbjuda goda utsikter. Den andra tredjedelen av data används för att optimera systemet.
När systemet har optimerats kommer det att tillämpas på den återstående tredjedel av data. Detta kallas provtagning utan prov, och det är där de flesta system misslyckas. Om systemet fortfarande har goda resultat över minst 1 000 affärer har systembyggaren ett livskraftigt system. Om systemet genererar färre än 1 000 affärer i testet utan prov, bör byggaren överväga en annan strategi för backtesting.
Bootstrapping är en metod för att dra vissa data från den totala uppsättningen, testa, sätta tillbaka data och dra mer data, eller resampla och testa om igen. Det ideala antalet resamples är n, eller n till n: e kraften, där n är antalet data i det ursprungliga provet. För en näringsidkare som troligen hanterar minst 2 500 datapunkter - 250 dagar om året över tio år - är det inte praktiskt. Lyckligtvis kommer 100 resampler att ge en hög grad av förtroende för att bootstrap-provet speglar originaldata, vilket gör resultaten tillförlitliga. Om att ta 100 resamples inte ger de nödvändiga 1 000 handeln, måste näringsidkaren fortsätta att resampla tills det målet uppnås om han förväntar sig att systemet, snarare än bara omampling av data, ska vara tillförlitligt.
Den sista metoden för backtesting strategier är Monte Carlo (MC) simulering. Denna metod använder en dator för att generera simulerade data, och systemet testas sedan på den datan. Fördelen med MC-simulering är att man kan skapa obegränsade mängder data, vilket gör att man kan generera 10 000 affärer eller något annat antal affärer. En annan fördel är att varje ny datamängd är ur urvalet. Detta ger möjlighet att göra upprepade optimerings- och testkörningar; helt enkelt optimera den här datauppsättningen och applicera sedan systemparametrarna på nästa data som datorn genererar.
En nackdel med MC-simulering är att uppgifterna kanske inte har exakt samma sannolikhetsfördelningsfunktion som handelsdata har, vilket kan skeva resultaten. I bästa av alla möjliga världar bör alla tre strategier för backtesting användas i processen för att få kontroll av systemet. Framgång i alla tre borde ge en mycket stor sannolikhet för framgång i den verkliga handeln.