Quels sont les différents types de stratégies de backtesting?
Il existe trois approches classiques des stratégies de backtesting: utiliser les données de prix réelles divisées en trois groupes; bootstrap, qui utilise les données de prix réelles mais les rééchantillonne; et simulation de Monte Carlo. Il existe des problèmes théoriques qui divisent les constructeurs de systèmes sur la meilleure méthode. Ce qui est important pour le trader, c’est qu’il utilise correctement au moins l’une des stratégies de backtest de son système avant de lui faire confiance. Le nombre de transactions générées est un problème critique dans le choix d’une stratégie de backtesting. au moins 1 000 métiers sont nécessaires à chaque phase du travail du constructeur du système.
L'utilisation des données de prix réelles, divisées en trois parties, constitue le point de départ habituel de la plupart des constructeurs de systèmes. Le système est créé en utilisant le premier tiers des données. À ce stade, le constructeur a trouvé des algorithmes qui semblent générer suffisamment de bénéfices avec un risque suffisamment petit pour offrir de bonnes perspectives. Le deuxième tiers des données est utilisé pour optimiser le système.
Une fois le système optimisé, il sera appliqué au tiers restant des données. Ceci s'appelle des tests hors échantillon, et c'est là que la plupart des systèmes échouent. Si le système produit toujours de bons résultats sur au moins 1 000 transactions, le constructeur du système dispose d'un système viable. Si le système génère moins de 1 000 transactions lors du test hors échantillon, le constructeur doit envisager une autre stratégie de backtesting.
L’amorçage est une méthode qui consiste à extraire certaines données de l’ensemble, à les tester, à les réintégrer et à extraire davantage de données, ou à ré-échantillonner et à réessayer. Le nombre idéal de rééchantillons est n n , ou n à la n ième puissance, où n est le nombre de données de l'échantillon d'origine. Pour un commerçant qui traite probablement avec au moins 2 500 points de données - 250 jours par an sur 10 ans - cela n’est pas pratique. Heureusement, 100 rééchantillons garantissent que l’échantillon d’amorçage reproduira les données originales, ce qui rend les résultats fiables. Si prendre 100 rééchantillons ne fournit pas les 1 000 transactions nécessaires, le commerçant doit poursuivre le rééchantillonnage jusqu'à ce que cet objectif soit atteint s'il s'attend à ce que le système, plutôt que le rééchantillonnage des données, soit fiable.
La dernière méthode de stratégies de backtesting est la simulation de Monte Carlo (MC). Cette méthode utilise un ordinateur pour générer des données simulées et le système est ensuite testé sur ces données. L’avantage de la simulation MC est qu’il est possible de créer un nombre illimité de données, ce qui permet de générer 10 000 transactions ou un nombre différent de transactions. Un autre avantage est que chaque nouvel ensemble de données est en dehors de l'échantillon. Cela offre la possibilité d'effectuer des optimisations et des tests répétés; optimisez simplement sur cet ensemble de données, puis appliquez ces paramètres système aux données suivantes générées par l'ordinateur.
Un inconvénient de la simulation MC est que les données peuvent ne pas avoir exactement la même fonction de distribution de probabilité que les données de transaction, ce qui pourrait fausser les résultats. Dans le meilleur des mondes possibles, les trois stratégies de backtest devraient être utilisées dans le processus de vérification du système. Le succès dans les trois domaines devrait offrir une très grande probabilité de succès dans le commerce réel.