Lo standard video H.264/AVC chiamato anche MPEG-4 Parte 10/AVC – (AVC è l'acronimo di Advanced Video Coding) è uno standard video sviluppato nel 2003 dal Video Coding Experts Group insieme al Moving Picture Experts Group con lo scopo di ottenere una tecnologia di compressione video capace di avere un'elevata qualità dell'immagine con un bitrate molto inferiore agli standard disponibili in quel momento per consentire la fruizione di video di alta qualità in streaming su diversi tipi di rete; Apple è la prima ad utilizzarlo nel 2005 all'interno di QuickTime.
A differenza dei suoi predecessori che erano dei codec – cioè definivano l'intera catena di codifica (coder) e decodifica (decoder) - H.264/AVC è un decoder, cioè uno standard che definisce la sintassi del flusso dati e il metodo per decodificarlo.
Lo standard H.264 a parità di qualità d'immagine è in grado di comprimere il flusso video di oltre il 50% rispetto al formato MPEG-2 e del 80% rispetto al formato Motion JPEG; questa caratteristica ne ha permesso la diffusione e l'utilizzazione su moltissimi dispositivi quali: televisori e videocamere HD, Blu-Ray, telefoni cellulari 3G e dispositivi mobili oltre che nell’utilizzo su Internet dai più diffusi server video fino ad arrivare all'utilizzo nel broadcast per le trasmissioni video terrestri in DVB-T e DVB-T2 e via satellite in DVB-S e DVB-S2.
Le principali caratteristiche di questo standard sono:
- riduzione media del bitrate di trasmissione del 50%, a parità di qualità video, rispetto ad altri standard video;
- processo di codifica e decodifica con limitato numero di errori;
- bassa latenza e un migliore qualità in presenza di latenza alta;
- maggiore tolleranza alla perdita di dati e agli errori di trasmissione;
- standard aperto, quindi facilmente implementabile in dispositivi e applicazioni;
Lo standard H.264/AVC utilizza diversi strumenti innovativi per ottenere i risultati dichiarati, tra cui:
- Multi-picture inter-picture prediction: utilizza immagini codificate precedentemente come riferimento in un modo molto più flessibile rispetto agli standard precedenti, consentendo fino a 16 fotogrammi di riferimento (o 32 campi di riferimento, nel caso di codifica interlacciata).
- Spatial prediction: la codifica dei campioni si basa su quella dei blocchi adiacenti per codifica "intra", piuttosto che la previsione "DC" del formato MPEG-2.
- Variable block-size motion compensation (VBSMC): con blocchi di dimensioni grandi da 16x16 fino al più piccolo 4x4, che consente la segmentazione precisa delle parti in movimento.
- Utilizzo di diversi vettori di movimento per macroblocco: tra cui gli "I-macroblocks" con conseguente codifica molto più efficiente.
- Quarter-pixel precision for motion compensation: consente una descrizione precisa degli spostamenti delle aree in movimento.
- Six-tap filtering: ottiene previsioni dei campioni di luminanza che coordinate con l'algoritmo di motion-compensation permette di avere immagini più nitide.
- Lossless macroblock coding: è una modalità di rappresentazione del macroblocco che permette la rappresentazione perfetta di specifiche regioni del fotogramma video.
- Flexible interlaced-scan video coding: migliora la codifica di video interlacciati.
- Filtro di deblock: aiuta a prevenire gli artefatti di blocco delle immagini comuni ad altre tecniche di compressione DCT-based, con conseguente migliore aspetto visivo ed efficienza di compressione.
- Redundant slices (RS): in caso errori o perdita di informazioni del flusso video l'encoder può ricreare l'area dell'immagine mancante.
- Supporto di diversi chroma subsampling: in base al profilo scelto si può avere un campionamento del segnale chroma in 4:4:4, 4:2:2, 4:2:0 o 4:0:0 (monocromatico).
- Sample bit depth precision ranging: supporta diversi tipi di campionamento che va da 8 a 14 bit per campione, a seconda del profilo utilizzato.
- Picture order count: è una funzione che serve a mantenere l'ordinamento delle immagini e dei valori dei campioni nelle immagini decodificate isolati da informazioni di temporizzazione, consentendo di agire sulle informazioni di temporizzazione senza compromettere i contenuti delle immagini.
- Impiego di due algoritmi avanzati di codifica entropica: Context-Adaptive Variable Lenght Coding, (CAVLC), e Context-Adaptive Binary Arithmetic Coding, (CABAC). L'algoritmo CABAC ha un'efficienza di compressione maggiore rispetto al CAVLC, ma anche una maggiore complessità computazionale.
Nella attuale versione 16 dello standard H.264/AVC sono stati definiti 21 profili ognuno dei quali è stato ottimizzato per una precisa applicazione.
Constrained Baseline Profile (CBP)
Principalmente utilizzato per applicazioni a basso costo, viene solitamente usato per videoconferenze e applicazioni mobile.
Baseline Profile (BP)
Utilizzato anch’esso per applicazioni a basso costo che richiedono però robustezza contro la perdita di dati, viene utilizzato in applicazioni di videoconferenza e mobile.
Main Profile (MP)
Questo profilo è utilizzato per le trasmissioni TV in digitale a definizione standard che utilizzano il formato MPEG-4, come definito nello standard DVB.
Extended Profile (XP)
E' un profilo per streaming video, ha una capacità relativamente elevata di compressione ed è abbastanza robusto contro la perdite di dati.
High Profile (HiP)
E' il profilo utilizzato nel broadcast per le trasmissioni televisive in alta definizione e per l'archiviazione su disco (Blu-Ray).
Progressive High Profile (PHiP)
Simile al profilo HiP, ma supporta solo il video progressivo.
Constrained High Profile
Simile al profilo PHiP, ma senza supporto del B (bi-predictive) slices.
High 10 Profile (Hi10P)
Profilo per applicazioni professionali simile al profilo HiP ma con campionamento a 10 bit.
High 4:2:2 Profile (Hi422P)
Profilo per applicazioni professionali che utilizzano il video interlacciato, ha le stesse caratteristiche del profilo Hi10P con l'aggiunta del chroma subsampling 4:2:2.
High 4:4:4 Predictive Profile (Hi444PP)
Profilo per applicazioni professionali, ha le stesse caratteristiche del profilo Hi422P con l'aggiunta del chroma subsampling 4:4:4 e con campionamento a 14 bit.
High 10 Intra Profile
E' un sottoinsieme del profilo Hi10P che utilizza l'algoritmo di compressione intra-frame.
High 4:2:2 Intra Profile
E' un sottoinsieme del profilo Hi422P che utilizza l'algoritmo di compressione intra-frame.
High 4:4:4 Intra Profile
E’ un sottoinsieme del profilo Hi444PP che utilizza l'algoritmo di compressione intra-frame.
CAVLC 4:4:4 Intra Profile
E' un sottoinsieme del profilo Hi444PP che utilizza l'algoritmo di compressione intra-frame e supporta la codifica CAVLC.
Scalable Baseline Profile
Profilo utilizzato per applicazioni di videoconferenze, mobile e videosorveglianza, è un sottoinsieme del profilo CBP in cui sono disponibili strumenti per gestire la scalabilità.
Scalable Constrained Baseline Profile
E' un sottoinsieme scalabile del profilo BP destinato principalmente per applicazioni di comunicazione in tempo reale.
Scalable High Profile
Utilizzato per applicazioni broadcast e streaming, è un sottoinsieme del profilo HiP in cui sono disponibili strumenti per gestire la scalabilità.
Scalable Constrained High Profile
Destinato principalmente per applicazioni di comunicazione in tempo reale, è un sottoinsieme del profilo Constrained High Profile in cui sono disponibili strumenti per gestire la scalabilità.
Scalable High Intra Profile
Utilizzato principalmente per applicazioni di produzione, questo profilo è scalabile e utilizza l'algoritmo di compressione intra-frame.
Stereo High Profile
Questo profilo è utilizzato per il video 3D stereoscopico e combina gli strumenti del profilo HiP con l'inter-view prediction MVC.
Multiview High Profile
Questo profilo supporta due o più visualizzazioni utilizzando sia l'inter-picture (temporale) insieme all'inter-view prediction MVC
Per videocamere, editing e applicazioni video professionali in alta definizione si utilizzano normalmente i profili High 10 Intra Profile, High 4:2:2 Intra Profile, High 4:4:4 Intra Profile e il CAVLC 4:4:4 Intra Profile.
Lo standard H.264/AVC supporta diversi tipi di container e questo può generare confusione per gli utilizzatori; i file video prodotti con lo standard H.264/AVC possono essere:
- .mp4 - è il container H.264 definito nello standard MPEG-4 (ISO 14496-15)
- .mpg - è il container H.264 definito nello standard MPEG-2 (ISO 13818-1 AMD3)
- .avi – è un container che permette l'uso del H.264, anche se non supporta tutte le caratteristiche di questo standard, ma non e standardizzato e quindi può provocare problemi di compatibilità.
I file con estensione .264 o .h264. non sono dei container, ma contengono il bitstream video puro.
L'elevato numero di profili disponibili e le eccellenti caratteristiche tecniche fanno dello standard H.264/AVC uno sistema di compressione video nettamente migliore rispetto agli attuali standard video in un'ampia varietà di situazioni e in una vasta gamma di ambienti applicativi.
Solo il codec VP8 sviluppato da On2 Technologies e acquistato da Google si avvicina molto per qualità e performance allo standard H.264/AVC.