Scegliere il modello giusto per Copilot in Visual Studio Code

Gli LLM di frontiera sono potentissimi ma anche onerosi nei piani di abbonamento, i cui costi sono destinati solo a salire. È facile che la mano scappi: ritrovarsi col piano bruciato o con il rate limit delle 5 ore raggiunto in decine di minuti. Ecco perché è fondamentale scegliere l’LLM più idoneo per l’attività che eseguiamo.

Perché scegliere il modello giusto?

Due motivi principali rendono importante dedicare tempo all’apprendimento della scelta corretta:

1. Ottimizzare i tempi di risposta

I vari modelli hanno velocità diverse. Alcuni rispondono in pochi secondi, altri richiedono più tempo per approfondire il ragionamento. Quando cerchiamo semplicemente informazioni o vogliamo completamenti rapidi, un modello leggero come Claude Haiku è perfetto. Per ragionamenti complessi, sarà necessario attendere un po’ di più, ma riceveremo risposte più accurate e approfondite.

2. Contenere i costi

Diversi modelli hanno costi diversi per l’interpretazione del prompt (token in input) e per la generazione della risposta (token in output). Con la crescente competizione e l’evoluzione dei pricing model, diventa essenziale capire il moltiplicatore di costo di ciascun modello. Alcuni modelli hanno un costo standard (moltiplicatore 1×), mentre altri più potenti consumano più richieste premium (ad esempio, 3× per Claude Opus 4.6).

Il catalogo di modelli disponibili

GitHub Copilot offre un’ampia gamma di modelli. Nella documentazione ufficiale troverai la sezione AI models divisa in due parti:

Supported Models

La lista completa include:

OpenAI: GPT-4.1, GPT-5.3 Codex, GPT-5.4 Mini
Anthropic: Claude Haiku, Claude Sonnet, Claude Opus (4.5, 4.6, 4.7)
Google: Gemini (varie versioni)
Fine-tuned GitHub: Raptor Mini, Golden Eye
X (ex-Twitter): Grock e altri

Model Comparison

Per orientarsi nella scelta, esiste una utile categorizzazione basata su tre macrocategorie di attività:

1. Agentic Software Development

Attività dove il modello lavora autonomamente come uno sviluppatore: scrivere codice, testarlo, correggere e verificare risultati. Il modello deve essere in grado di seguire istruzioni, lavorare in autonomia anche per lunghi periodi (decine di minuti).

Modelli consigliati: GPT-5.3 Codex

2. Deep Reasoning and Debugging

Attività che richiedono ragionamento profondo e problem-solving complesso: debugging di problemi difficili, decisioni architetturali, analisi di parti corpose della codebase. Anche in fase esplorativa, quando devi toccare elementi importanti del progetto.

Modelli consigliati: GPT 5.5, GPT 5.4, Claude Opus 4.6, Claude Opus 4.7

3. General Purpose

Attività generiche quotidiane dove non cerchi skill specifici: domande dirette, piccole modifiche, ricerche veloci.

Modelli consigliati: Claude Sonnet 4.5, Claude Sonnet 4.6, GPT-5 Mini

Come scegliere il modello in Visual Studio Code

Accedi al pannello della chat e guarda in basso dove inserisci il prompt. Troverai due selezioni importanti:

1. Selezionare il Language Model

Clicca sul nome del modello e vedrai:

I modelli più recenti in alto
L’ingranaggio per accedere al catalogo completo

Nel catalogo puoi vedere per ogni modello:

Finestra di contesto: quanti token può processare
Abilità: supporto per immagini
Pricing: il moltiplicatore di costo (ad esempio, 1× per Sonnet, 3× per Opus 4.6 con il sistema attuale)

Pro tip: Puoi disabilitare dalla vista i modelli che non usi frequentemente, semplificando il selettore.

2. Thinking Effort (Sforzo di Ragionamento)

Alcuni modelli supportano un livello di thinking configurabile. Prima di generare la risposta, il modello esegue un ragionamento interno—proprio come facciamo noi quando pensiamo a qualcosa di complesso.

Come funziona:

Questi token di ragionamento vengono conteggiati
Conteranno come token effettivamente spesi

Linee guida:

High o Extra High: per attività lunghe e complesse (decisioni architetturali, debug multi-step)
Low: per codice semplice o risposte dirette

Nota importante: La documentazione suggerisce di lasciare i default, poiché Copilot ha meccanismi adattivi che scelgono il livello appropriato in base alla richiesta.

Esempio pratico: velocità a confronto

Claude Haiku per la ricerca veloce

Chiedendo “come è gestita la login in questa applicazione?” a Haiku:

Risposta in pochi secondi
Recupero rapido di informazioni
Struttura ben organizzata
Ideale per: ricerche veloci, piccole modifiche, attività superficiali

GPT-5.4 per l’analisi profonda

Stessa domanda con GPT-5.4:

Risposta più lenta (i token arrivano più gradualmente)
Ragionamento più profondo
Attiva il thinking automaticamente
Analisi più completa e dettagliata
Consuma più risorse e tempo

La scelta dipende dall’esigenza: per una semplice ricerca di funzionalità, Haiku è perfetto. Per un’analisi complessa, GPT-5.4 vale l’attesa.

La scelta “Auto” e lo sconto del 10%

Vedrai un’opzione Auto con la scritta “10% discount”. Ecco cosa significa:

Non è il modello più idoneo all’attività che stai facendo
GitHub Copilot sceglie in autonomia tra i modelli disponibili
Ottimizza: i tempi di risposta e il carico sui server GitHub
Assicura un buon livello di servizio generale

Dopo una risposta con Auto, puoi scoprire quale modello è stato usato:

Passando il mouse sulla risposta (hover)
Vedrai il modello e il moltiplicatore applicato (ad esempio, 0.9× per lo sconto del 10%)

Utilità della Auto: Perfetta quando non hai esigenze specifiche e vuoi delegare a GitHub la scelta ottimale per il server.

Custom Prompts: il trucchetto per automatizzare la scelta

Per attività ripetitive, crea custom prompt personalizzati:

Clicca sull’ingranaggio nella chat
Seleziona Open customization → Prompts
Clicca in alto a destra per creare un nuovo prompt
Assegna un nome (es. “ricerca rapida”)
Aggiungi una descrizione (es. “Recupera informazioni di alto livello in modo rapido”)
Nel corpo del prompt, aggiungi la configurazione:

Se scritto correttamente, il modello Haiku verrà selezionato automaticamente ogni volta che usi questo prompt.

Opzioni aggiuntive:

Puoi limitare i tool disponibili (es. solo lettura file, no web search)
Puoi abilitare/disabilitare l’accesso alla memoria
Puoi salvare nel workspace (per condividere con il team) o nel profilo personale

Beneficio: Non dovrai più cambiare manualmente il modello ogni volta. Il prompt farà tutto per te.

Conclusione

Scegliere il modello giusto non è complicato, ma richiede pratica:

Impara la mappa (agentic, deep reasoning, general purpose)
Conosci i modelli del tuo catalogo e i loro costi
Sperimenta: vedi come reagiscono a compiti diversi
Automatizza con custom prompts le scelte ricorrenti

Con il tempo, diventerà istintivo capire quale modello usare senza doverci pensare troppo.