Gli LLM di frontiera sono potentissimi ma anche onerosi nei piani di abbonamento, i cui costi sono destinati solo a salire. È facile che la mano scappi: ritrovarsi col piano bruciato o con il rate limit delle 5 ore raggiunto in decine di minuti. Ecco perché è fondamentale scegliere l’LLM più idoneo per l’attività che eseguiamo.
Perché scegliere il modello giusto?
Due motivi principali rendono importante dedicare tempo all’apprendimento della scelta corretta:
1. Ottimizzare i tempi di risposta
I vari modelli hanno velocità diverse. Alcuni rispondono in pochi secondi, altri richiedono più tempo per approfondire il ragionamento. Quando cerchiamo semplicemente informazioni o vogliamo completamenti rapidi, un modello leggero come Claude Haiku è perfetto. Per ragionamenti complessi, sarà necessario attendere un po’ di più, ma riceveremo risposte più accurate e approfondite.
2. Contenere i costi
Diversi modelli hanno costi diversi per l’interpretazione del prompt (token in input) e per la generazione della risposta (token in output). Con la crescente competizione e l’evoluzione dei pricing model, diventa essenziale capire il moltiplicatore di costo di ciascun modello. Alcuni modelli hanno un costo standard (moltiplicatore 1×), mentre altri più potenti consumano più richieste premium (ad esempio, 3× per Claude Opus 4.6).
Il catalogo di modelli disponibili
GitHub Copilot offre un’ampia gamma di modelli. Nella documentazione ufficiale troverai la sezione AI models divisa in due parti:
Supported Models
La lista completa include:
- OpenAI: GPT-4.1, GPT-5.3 Codex, GPT-5.4 Mini
- Anthropic: Claude Haiku, Claude Sonnet, Claude Opus (4.5, 4.6, 4.7)
- Google: Gemini (varie versioni)
- Fine-tuned GitHub: Raptor Mini, Golden Eye
- X (ex-Twitter): Grock e altri
Model Comparison
Per orientarsi nella scelta, esiste una utile categorizzazione basata su tre macrocategorie di attività:
1. Agentic Software Development
Attività dove il modello lavora autonomamente come uno sviluppatore: scrivere codice, testarlo, correggere e verificare risultati. Il modello deve essere in grado di seguire istruzioni, lavorare in autonomia anche per lunghi periodi (decine di minuti).
Modelli consigliati: GPT-5.3 Codex
2. Deep Reasoning and Debugging
Attività che richiedono ragionamento profondo e problem-solving complesso: debugging di problemi difficili, decisioni architetturali, analisi di parti corpose della codebase. Anche in fase esplorativa, quando devi toccare elementi importanti del progetto.
Modelli consigliati: GPT 5.5, GPT 5.4, Claude Opus 4.6, Claude Opus 4.7
3. General Purpose
Attività generiche quotidiane dove non cerchi skill specifici: domande dirette, piccole modifiche, ricerche veloci.
Modelli consigliati: Claude Sonnet 4.5, Claude Sonnet 4.6, GPT-5 Mini
Come scegliere il modello in Visual Studio Code
Accedi al pannello della chat e guarda in basso dove inserisci il prompt. Troverai due selezioni importanti:
1. Selezionare il Language Model
Clicca sul nome del modello e vedrai:
- I modelli più recenti in alto
- L’ingranaggio per accedere al catalogo completo
Nel catalogo puoi vedere per ogni modello:
- Finestra di contesto: quanti token può processare
- Abilità: supporto per immagini
- Pricing: il moltiplicatore di costo (ad esempio, 1× per Sonnet, 3× per Opus 4.6 con il sistema attuale)
Pro tip: Puoi disabilitare dalla vista i modelli che non usi frequentemente, semplificando il selettore.
2. Thinking Effort (Sforzo di Ragionamento)
Alcuni modelli supportano un livello di thinking configurabile. Prima di generare la risposta, il modello esegue un ragionamento interno—proprio come facciamo noi quando pensiamo a qualcosa di complesso.
Come funziona:
- Questi token di ragionamento vengono conteggiati
- Conteranno come token effettivamente spesi
Linee guida:
- High o Extra High: per attività lunghe e complesse (decisioni architetturali, debug multi-step)
- Low: per codice semplice o risposte dirette
Nota importante: La documentazione suggerisce di lasciare i default, poiché Copilot ha meccanismi adattivi che scelgono il livello appropriato in base alla richiesta.
Esempio pratico: velocità a confronto
Claude Haiku per la ricerca veloce
Chiedendo “come è gestita la login in questa applicazione?” a Haiku:
- Risposta in pochi secondi
- Recupero rapido di informazioni
- Struttura ben organizzata
- Ideale per: ricerche veloci, piccole modifiche, attività superficiali
GPT-5.4 per l’analisi profonda
Stessa domanda con GPT-5.4:
- Risposta più lenta (i token arrivano più gradualmente)
- Ragionamento più profondo
- Attiva il thinking automaticamente
- Analisi più completa e dettagliata
- Consuma più risorse e tempo
La scelta dipende dall’esigenza: per una semplice ricerca di funzionalità, Haiku è perfetto. Per un’analisi complessa, GPT-5.4 vale l’attesa.
La scelta “Auto” e lo sconto del 10%
Vedrai un’opzione Auto con la scritta “10% discount”. Ecco cosa significa:
- Non è il modello più idoneo all’attività che stai facendo
- GitHub Copilot sceglie in autonomia tra i modelli disponibili
- Ottimizza: i tempi di risposta e il carico sui server GitHub
- Assicura un buon livello di servizio generale
Dopo una risposta con Auto, puoi scoprire quale modello è stato usato:
- Passando il mouse sulla risposta (hover)
- Vedrai il modello e il moltiplicatore applicato (ad esempio, 0.9× per lo sconto del 10%)
Utilità della Auto: Perfetta quando non hai esigenze specifiche e vuoi delegare a GitHub la scelta ottimale per il server.
Custom Prompts: il trucchetto per automatizzare la scelta
Per attività ripetitive, crea custom prompt personalizzati:
- Clicca sull’ingranaggio nella chat
- Seleziona Open customization → Prompts
- Clicca in alto a destra per creare un nuovo prompt
- Assegna un nome (es. “ricerca rapida”)
- Aggiungi una descrizione (es. “Recupera informazioni di alto livello in modo rapido”)
- Nel corpo del prompt, aggiungi la configurazione:
Se scritto correttamente, il modello Haiku verrà selezionato automaticamente ogni volta che usi questo prompt.
Opzioni aggiuntive:
- Puoi limitare i tool disponibili (es. solo lettura file, no web search)
- Puoi abilitare/disabilitare l’accesso alla memoria
- Puoi salvare nel workspace (per condividere con il team) o nel profilo personale
Beneficio: Non dovrai più cambiare manualmente il modello ogni volta. Il prompt farà tutto per te.
Conclusione
Scegliere il modello giusto non è complicato, ma richiede pratica:
- Impara la mappa (agentic, deep reasoning, general purpose)
- Conosci i modelli del tuo catalogo e i loro costi
- Sperimenta: vedi come reagiscono a compiti diversi
- Automatizza con custom prompts le scelte ricorrenti
Con il tempo, diventerà istintivo capire quale modello usare senza doverci pensare troppo.