Indietro

Instruction Tuning

L'Instruction Tuning è una fase dell'addestramento AI in cui un modello di base viene addestrato su migliaia di coppie di 'istruzioni-risposte', insegnandogli a comportarsi come un assistente che esegue i compiti richiesti dall'utente.


Se prendi un LLM puro (che ha letto solo internet) e gli scrivi 'Spiegami la rivoluzione francese', lui potrebbe risponderti 'La rivoluzione francese è l'argomento del mio prossimo tema'. Questo perché cerca solo di completare la frase. L'Instruction Tuning è il momento in cui gli sviluppatori gli forniscono migliaia di esempi fatti così: 'Istruzione: Spiegami la rivoluzione francese -> Risposta corretta: La rivoluzione francese fu un evento storico che...'. Attraverso questo processo, l'AI 'capisce' che tu non vuoi che lei continui la tua frase, ma che tu sei un capo che le sta dando un compito da eseguire.