Decodifica Parametri LLM, Parte 1: Temperatura

Parametri dell’MLM

Come qualsiasi modello di apprendimento automatico, i grandi modelli di linguaggio hanno diversi parametri che controllano la varianza dell’output del testo generato. Abbiamo iniziato una serie multiparte per spiegare in dettaglio l’impatto di questi parametri. Concluderà imponendo il giusto equilibrio nella generazione del contenuto utilizzando tutti questi parametri discussi nella nostra serie multiparte.

Benvenuti alla prima parte, dove discutiamo del parametro più noto, la “Temperatura”.

Temperatura

Se l’obiettivo è controllare la casualità delle previsioni, allora la temperatura è quella giusta per te. Valori più bassi della temperatura rendono l’output più deterministico, mentre valori più alti lo rendono più creativo permettendo risultati diversi.

Osserviamo la temperatura in azione utilizzando il seguente codice e output. Per presentare l’importanza in maniera semplice, abbiamo scelto di utilizzare Hugging Face Transformers e in particolare il modello GPT2.

Python

 

Output:

PowerShell

 

Scopriamo l’output:

  • Temperatura bassa (0.3):Il modello userà le scelte di parola più probabili. Se precisione e consistenza sono importanti per te, fornisci una temperatura in questo range. Tuttavia, ricorda che il modello potrebbe rimanere bloccato nel ripetere frasi simili, come è il nostro output qui.
  • Temperatura Media (0.5): Questa temperatura equilibra perfettamente coerenza e creatività. È un ottimo punto di mezzo se vuoi una certa varietà senza perdere struttura. Come vedete nell’output, è stato aggiunto un po’ di equilibrio, ma potete ancora vedere alcuni aspetti di ripetizione nell’output.
  • Temperatura Alta (0.9): Questa temperatura esplode l’MLM per essere più creativo possibile. Come potete vedere, questo output è diverso dai precedenti due, introducendo molta casualità e varietà nel contenuto.

L’esempio precedente stabilisce una comprensione fondamentale della temperatura. Ora guardiamo alla temperatura in un modo un po’ più dettagliato con alcuni casi d’uso: “Generazione di Storie Creative” e “Spiegazione Tecnica”.

Consideriamo questo con il seguente codice per capire come la temperatura influenza i due casi d’uso precedenti.

Python

 

Output:

PowerShell

 

Ora analizziamo l’output per la generazione di storie creative e la spiegazione tecnica in base ai settaggi di temperatura e come l’output sia stato influenzato. Inoltre, osserviamo come un impostazione della temperatura funziona perfettamente per un caso d’uso e ha l’effetto opposto per l’altro.

Generazione di Storie Creative

  • Temperatura bassa (Impatto negativo):Come potete vedere, l’output della storia è altamente ripetitivo e manca di varietà. Questo risultato non è soddisfacente per un compito creativo, e la ripetizione estrema causata dalla mancanza dell’abilità dell’MLM di introdurre idee nuove e innovative rende tale output non desiderabile per la narrazione.
  • Alta Temperatura (Impatto perfetto): Come potete vedere dall’output, la storia prende direzioni interessanti ed è molto creativa. L’output aggiunge anche molti aspetti alla storia, rendendola varia, immaginativa e perfetta per una narrazione innovativa.

Spiegazione Tecnica

  • Alta Temperatura (Impatto negativo): E’ importante ricordare che mantenere l’accuratezza fattuale è molto importante per un caso d’uso come una spiegazione tecnica. L’alta temperatura porta a molta casualità e a parole meno probabili che vengono introdotte nel contenuto generato, rendendolo insoddisfacente per la scrittura tecnica. Lo stesso si può dedurre dall’output sopra che è troppo vago e include idee irrilevanti.
  • Temperatura Regolata (Impatto perfetto):  Abbiamo regolato la temperatura a un valore che raggiunge un perfetto equilibrio per la generazione di contenuti tecnici. Come potete vedere, l’output è molto più ordinato in questo momento. Con questa impostazione della temperatura, il modello evita la ripetizione come succede a temperature più basse e non perde coerenza come succede a temperature più alte.

Conclusione

Avete visto tutti i modi in cui la temperatura può influenzare la generazione del contenuto e a quale impostazione di temperatura è perfetta per qualunque caso d’uso. Inoltre, notate che la regolazione della temperatura non è l’unico approcio alla generazione del contenuto; dovrete anche aggiustare altri parametri. Vedremo tutto ciò negli articoli successivi della serie.

Source:
https://dzone.com/articles/decoding-llm-parameters-temperature