Indietro

Reinforcement Learning

Il Reinforcement Learning (Apprendimento per Rinforzo) è un tipo di Machine Learning in cui un agente AI impara a prendere decisioni procedendo per tentativi ed errori all'interno di un ambiente virtuale, ricevendo premi per le azioni giuste o penalità per gli errori.


Immagina di addestrare un cane con dei biscotti: se fa un bel salto gli dai un premio, se morde le scarpe lo ignori. Il Reinforcement Learning funziona esattamente in questo modo, ma su scala informatica.

È il sistema che viene usato per insegnare a giocare ai computer. Quando i ricercatori hanno creato un'AI per giocare a Super Mario, non le hanno spiegato i comandi. Le hanno solo detto: 'Il punteggio a schermo è il tuo premio, cerca di massimizzarlo'.

L'AI ha iniziato a muoversi a caso, morendo mille volte, finché non ha capito quali sequenze di tasti portavano a non cadere nei fossi e prendere le monete. È la tecnica alla base della robotica avanzata e del controllo dei droni autonomi.