Overfitting, noto come adattamento eccessivo, è un fenomeno che si verifica nel machine learning, quando un modello si adatta troppo ai dati di allenamento, rendendo le sue prestazioni ottimali solo per questi dati, ma non generalizzabili per dati nuovi o sconosciuti.
I principali motivi per cui si verifica l’overfitting sono:
- Dimensione troppo ridotta dei dati di allenamento: ad esempio, basare una strategia solo su un arco temporale di un anno o due anni
- Troppe informazioni irrilevanti nei dati di allenamento: ad esempio, notizie del calendario economico, indicatori tecnici e oscillatori
- Addestramento troppo lungo su un singolo set di dati: come ad esempio, backtest troppo lunghi che non prendono in considerazione le mutazioni del mercato
- Complessità elevata del modello che porta a riconoscere informazioni irrilevanti nei dati di allenamento: come ad esempio una strategia che viene adattata fin troppo bene ai dati disponibili.