Claude Code e GitHub Copilot sono i due agenti di coding più discussi del 2026: si rincorrono a colpi di funzionalità, modelli e piani di abbonamento. Ho deciso di metterli fianco a fianco su un task reale, con lo stesso LLM sotto il cofano, per capire dove fanno davvero la differenza e chi ne esce vincitore.
Nel video vedi il test integrale, qui sotto trovi il recap scritto con il verdetto, i pro e i contro che ho rilevato lavorando con entrambi gli agenti in parallelo.
Come ho impostato il test
Per fare un confronto onesto ho voluto neutralizzare il più possibile le variabili che non riguardano l’agente in sé. Stesso repository (la mia app companion Marvel Zombies Hero, che uso spesso come cavia per dimostrare concetti di agentic coding), stesso prompt, stesso modello dietro le quinte: Claude Sonnet 4.6 con reasoning effort high sia per Claude Code sia per GitHub Copilot.
Il task: aggiungere alla scheda personaggio una foto, scegliendo tra caricamento da file system (PC o mobile) e scatto istantaneo dalla webcam, posizionata sotto il nome dell’eroe.
Per evitare che i due agenti si pestassero i piedi, ho chiesto a entrambi di lavorare in un git worktree dedicato (feature-claude e feature-copilot) partendo dallo stesso branch. Poi ho attivato la modalità di pianificazione su entrambi: la modifica non era banale, e volevo prima vedere come ragionavano e cosa proponevano.
Se ti interessa portare nel tuo team o nella tua azienda le pratiche di intelligenza artificiale, dalla raccolta dei requisiti fino all’agentic coding, prenota un incontro gratuito con me.
Pianificazione: due stili molto diversi
Già nei primi minuti emerge la prima differenza sostanziale, che riguarda il modo in cui i due agenti gestiscono la fase di planning prima dell’implementazione.
- GitHub Copilot è partito leggendo i file in giro e, dopo poco, ha iniziato a farmi domande di chiarimento: forma e dimensione della foto, ridimensionamento automatico, presenza di un pulsante per rimuoverla. Mi è piaciuto vedere esposto il ragionamento del modello sottostante mentre lo faceva.
- Claude Code ha invece lanciato due sub-agenti di esplorazione in parallelo e, nella maggior parte dei casi, non mi ha fatto domande: è andato dritto per la sua strada, presentando direttamente il piano.
Sui tempi di pianificazione siamo lì: circa un minuto e mezzo per entrambi. Sulla qualità del piano finale è di fatto un pareggio, con Claude Code più tecnico nei dettagli (anche con frammenti di componenti e HTML) e Copilot più orientato a problema/approccio/file da modificare.
Il mio preferito qui è Copilot, perché in questo come in altri test mi ha sistematicamente fatto domande quando una decisione era ambigua. È un comportamento che, se sai dare le istruzioni giuste al tuo coding agent, rende il risultato finale molto più allineato alle tue intenzioni.
Implementazione: chi è arrivato prima al risultato
Confermati i piani, li ho lasciati lavorare in parallelo nei rispettivi worktree.
- Claude Code ha gestito il worktree dentro la cartella del repository e non ha avuto problemi con i
node_modules: implementazione fluida e arrivata in fondo per prima, con UI a foto circolare e flusso completo (caricamento da file, scatto da webcam, rimozione foto). - GitHub Copilot ha creato il worktree in una cartella separata, scelta concettualmente più pulita ma che gli si è ritorta contro: i
node_modulesmancavano, se n’è accorto da solo, ha lanciatonpm installed è ripartito. Risultato funzionante, UI più minimale e rettangolare come da prompt, ma con un evidente rallentamento sulla validazione finale.
Verifica funzionale a parte, entrambi hanno portato a casa il task in modo completo: caricamento da file, accesso webcam, scatto, rimozione. La differenza l’ha fatta come ognuno ha gestito il proprio ambiente di lavoro.
Token, velocità e qualità: i numeri del confronto
| Metrica | Claude Code | GitHub Copilot |
|---|---|---|
| Domande di chiarimento in plan | Quasi nessuna | Diverse, mirate |
| Gestione worktree | Dentro al repo, nessun attrito | Cartella separata, attrito su node_modules |
| Tempo fino a feature funzionante | Più rapido | Più lento (per il fix node_modules) |
| Token consumati | ~19.900 | ~22.400 |
| UI prodotta | Foto circolare, esperienza più curata | Minimale, rettangolare come da prompt |
Sul consumo di token vince Claude Code, ma di poco: la differenza è in larga parte dovuta alle iterazioni extra che Copilot ha dovuto fare per uscire dall’angolo dei moduli mancanti. È un buon esempio di come la gestione del contesto e degli strumenti dell’agente impatti direttamente sul costo finale.
Superficie e funzionalità: più simili di quanto sembri
Guardando le macrofunzionalità, Claude Code e GitHub Copilot sono oggi sorprendentemente simili.
- Modalità di pianificazione:
/plan(oShift+Tab) su entrambi. Claude Code ha in più una/ultra-plan; Copilot ha una modalitàresearchche fa anche ricerche sul web. - Bypass dei permessi:
bypass-permissionssu Claude Code,yolo(aliasallow-all) su Copilot. Stessa idea, nome diverso. - Sub-agenti e task in parallelo: comando
taskssu entrambi. - Status, sessione e contesto:
/status,/session-info,/contextcon output e perfino impaginazione molto simili. - Pricing: Claude Code è già a consumo di token. GitHub Copilot passerà a un modello a token dal 1° giugno 2026, abbandonando le richieste premium. Anche da questo punto di vista la distanza si annulla.
- Open source: Copilot lo era già, Claude Code lo è diventato a fine marzo 2026.
- Integrazione con VS Code: Copilot ci è nato dentro, Claude Code è nato in terminale e poi è arrivato anche nell’IDE. Oggi entrambi vivono bene in CLI e in VS Code.
In altre parole, il vendor lock-in sull’esperienza quotidiana è basso: passare dall’uno all’altro è meno traumatico di quanto si creda.
Pro e contro: cosa mi ha convinto e cosa no
Claude Code
- Più veloce ad arrivare alla feature funzionante.
- Gestione del worktree più pragmatica: niente attrito sui
node_modules. - Consumo di token leggermente inferiore.
- UI prodotta più curata in questo specifico test.
- Tende a non chiedere: in casi ambigui rischia di andare lungo nella direzione sbagliata.
GitHub Copilot
- Pianificazione più collaborativa: domande di chiarimento puntuali.
- Ragionamento del modello esposto in modo leggibile durante il plan.
- UX in VS Code molto matura.
- La scelta di mettere il worktree fuori dal repo gli ha creato attrito sulle dipendenze.
- In questo test ha chiuso il task più lento, con qualche token in più.
Il mio verdetto
Sul task specifico ho mandato in produzione la versione di Claude Code, soprattutto per l’aspetto grafico finale e per la rapidità con cui è arrivato in fondo. È un vincitore pratico, sul singolo esperimento.
Sul piano complessivo, però, il mio verdetto è di pareggio. La superficie funzionale, i comandi, le modalità, il modello di pricing in arrivo, l’integrazione con gli IDE e perfino la grafica delle schermate di status si stanno avvicinando in modo evidente. Quale dei due sia “il migliore” dipende sempre meno dallo strumento e sempre più da come tu prepari il contesto, dai istruzioni, validi il risultato e fai lavorare l’agente. Se ti interessa quel lato del problema, ho raccolto la mia esperienza in un articolo sulla mentalità giusta per l’agentic coding.
Il mio daily driver attuale resta GitHub Copilot, ma è una scelta di abitudine e di integrazione, non di superiorità tecnica.
E tu, qual è il tuo daily driver tra Claude Code e GitHub Copilot? Fammelo sapere nei commenti del video su YouTube: mi aiuta a capire su quali confronti tornare nei prossimi contenuti.