Per capire bene cos'è l'HTML5 dobbiamo partire dal principio, ovvero dall'HTML.
L'HTML (Hyper Text Markup Language) è un linguaggio, o ancora meglio un codice, usato per formattare (costruire, scrivere) le pagine web di ogni sito. Praticamente sono tutte le "scritte" che compongono il codice sorgente di ogni pagina su Internet, che permettono la formattazione dei documenti ipertestuali (pagine web con link).
L'HTML quindi, in breve, è un linguaggio di markup, che, a differenza dei linguaggi di programmazione (che prevedono regole di sintassi ben precise), comprende tutte le regole che servono a definire e a standardizzare le pagine web.
L'HTML però si è "evoluto" più volte (anche se non è una vera e propria evoluzione, ma i nuovi linguaggi cercano di mantenere molte regole usate precedentemente, per non creare troppe pagine incompatibili), passando per l'XHTML, fino ad arrivare all'HTML5. Sembrano dei passaggi semplici, ma dietro ad ogni linguaggio ci sono anni e anni di studio, dove vengono sperimentate moltissime funzioni e soprattutto si cerca di semplificare la vita anche agli sviluppatori.
E dietro all'HTML5 c'è un team formato da: Apple, Mozilla, Opera, e Google. Questi grandi del web hanno formato il team WHATWG (Web Hypertext Application Technology Working Group) per poi sperimentare anche con il famoso gruppo W3C, che poi però ha abbandonato perchè voleva una versione unica, che non si evolvesse nel tempo (ogni versione uno standard diverso).
Insomma i lavori sono iniziati nel 2004 e più o meno a fine 2015 possono dichiararsi conclusi, almeno per quanto riguarda la sperimentazione.
Di fatto però esistono due versioni HTML5, una creata dal W3C dopo la scissione (versione unica), e l'altra creata dal WHATWG (in continua evoluzione), ma entrambi portano enormi miglioramenti sia per chi sviluppa pagine html sia per chi naviga normalmente su Internet:
1. Regole più semplici per la strutturazione della pagina: capitoli, paragrafi e sezioni;
2. Introdotti nuovi markup per la gestione dei menu di navigazione;
3. Vengono migliorati ed estesi gli elementi di controllo per i moduli elettronici;
4. Regole più semplici per l'aggiunta di audio e video: tag <audio> e <video> che vanno a sostituire molti plugin (come il Flash Player ad esempio);
5. Aggiunti gli attributi a tutti i tag per migliorare la pubblicazione (finora erano previsti solo per alcuni);
6. Migliorie nel mondo JavaScript grazie al supporto a Canvas e ai Web Workers (nuove standardizzazioni) che danno anche la possibilità di utilizzare alcuni siti offline;
7. Sostituzione dei cookie con il sistema Web Storage, più efficiente e di prestazioni migliori;
8. Introdotta la geolocalizzazione, data la diffusione degli smartphone;
9. Sostituito il doctype, la stringa che definisce il tipo di codice HTML utilizzato nella pagina, con un tag più semplice;
10. Eliminati elementi poco utilizzati fino ad ora.
Tra le novità più importanti c'è sicuramente la possibilità di poter eliminare molti plugin (YouTube l'ha già fatto) e con loro vengono eliminati anche molteplici problemi, poi c'è anche la possibilità di sfruttare numerose WebApp (anche offline), oltre a nuovi Web Workers che vanno a sostituire i cookie.
Queste descritte sono solo le funzioni che gli utenti possono "utilizzare", mentre tutte le altre appartengono al mondo degli sviluppatori, che vengono aiutati enormemente nella scrittura delle pagine html, oltre che a renderle ottimizzate sia per computer che per smartphone, tablet e qualsiasi altro dispositivo in un colpo solo.