MP3
Da Wikipedia, l'enciclopedia libera.
| Motion Picture Expert Group-1/2 Audio Layer 3 | |
|---|---|
| Estensione | .mp3 |
| Sviluppatore | Istituto Fraunhofer |
| Tipo | Compressione audio digitale |
| Sviluppatore | Istituto Fraunhofer |
| Tipo | Compressione audio digitale |
| Lossy / Lossless | Lossy |
| Licenza | Formato brevettato, specifiche pubbliche |
| Sito web | Istituto Fraunhofer |
MP3 (per esteso Motion Picture Expert Group-1/2 Audio Layer 3) è un algoritmo di compressione audio di tipo lossy in grado di ridurre drasticamente la quantità di dati richiesti per memorizzare un suono, rimanendo comunque una riproduzione accettabilmente fedele del file originale non compresso.
Indice |
[modifica] Storia
La codifica MPEG-1/2 Layer 2 iniziò come progetto presso la DAB e promosso dalla Fraunhofer IIS-A. Venne finanziato dall'Unione europea come parte di un programma di ricerca più vasto chiamato EUREKA comunemente conosciuto con il codice EU-147.
EU-147 fu attivo dal 1987 al 1994. Nel 1991 vennero fatte due proposte per uno standard disponibile: Musicam (conosciuto come Layer II) e ASPEC (Adaptative Spectral Perceptual Entropy Coding) (con analogie con l'MP3). Venne scelto Musicam perché più semplice ed affidabile.
Un gruppo di lavoro condotto da Karlheinz Brandenburg e Jürgen Herre fece confluire gli studi su Musicam e ASPEC con alcune loro idee e creò l'MP3, che fu progettato per realizzare la stessa qualità a 128 kbit/s dell'MP2 a 192 kbit/s.
Entrambi gli algoritmi furono completati nel 1992 con la sigla MPEG-1, come prima fase di sviluppo del progetto denominato MPEG e definito come standard internazionale con il codice ISO/IEC 11172-3 e pubblicato nel 1993. Un'ulteriore fase del progetto MPEG Audio si concluse nel 1994 con la creazione dell'MPEG-2 definito come standard internazionale con il codice ISO/IEC 13818-3 e pubblicato nel 1995.
L'efficienza di un algoritmo di compressione è tipicamente giudicata dal bitrate finale che riesce ad ottenere, mentre la metrica del tasso di compressione, che sembrerebbe più naturale, dipende sia dalla frequenza che dal numero di bit del segnale in ingresso. Ciononostante, vengono comunemente comunicati tassi di compressione che utilizzano i CD come riferimento, uno dei più comuni è quello a 44.1 kHz e 2x16bit. Qualche volta vengono utilizzati anche parametri DAT SP (48KHz, 2x16bit). Il tasso di compressione in questo sistema di riferimento è maggiore, il che dimostra le difficoltà nel definire il termine compressione come perdita di qualità nella codifica. Karlheinz Brandenburg ha utilizzato il CD di Suzanne Vega, "Tom's Diner" come modello di riferimento dell'algoritmo di compressione per l'MP3. Questo CD è stato scelto per la sua dolcezza e semplicità, rendendo facile l'ascolto di qualsiasi imperfezione che la compressione può causare durante la registrazione.
La pagina web ufficiale pubblica i seguenti tassi di compressione per l'MPEG-1 Layer 1,2 e 3.
- Layer 1: 384 kbit/s, compressione 4:1
- Layer 2: 192...256 kbit/s, compressione 6:1...8:1
- Layer 3: 112...128 kbit/s, compressione 10:1...12:1
Questi sono valori piuttosto aleatori in quanto:
- La qualità dipende non solo dal formato di codifica del file, ma anche dalla qualità psico acustica del codificatore. Il codificatore tipico layer 1 usa un modello psicoacustico molto elementare che finisce per richiedere molti più bit per un risultato soddisfacente.
- La codifica Layer 1 a 384 kbit/s, anche con questo semplice "psico acustico" è migliore della codifica Layer 2 a 192 … 256 kbit/s.
- La codifica Layer 3 a 112 … 128kbit/s è peggiore del Layer 2 a 192 … 256 kbit/s
Un modo più realistico per considerare il bitrate è:
- Layer 1: eccellente a 384 kbit/s
- Layer 2: eccellente a 256...320 kbit/s, molto buono a 224...256 kbit/s, buono a 192...224 kbit/s, non si dovrebbe usare sotto i 160 kbit/s
- Layer 3: eccellente a 224...256 kbit/s, molto buono a 192...224 kbit/s, buono a 160...192 kbit/s, non si dovrebbe usare sotto i 128 kbit/s
Il confronto di un nuovo formato di file, viene fatto confrontando la qualità media di compressione del nuovo formato con un encoder di alta qualità e molto ottimizzato, del vecchio formato.
L'algoritmo che utilizza il formato MP3, si basa su una trasformazione ibrida che trasforma il segnale dal dominio temporale a quello delle frequenze.
- 32 band filtro in quadratura polifase
- 36 or 12 Tap MDCT, la dimensione può essere selezionata indipendentemente dalla sottobanda 0...1 e 2...31
- processamento addizionale per ridurre gli effetti di aliasing
L'AAC MPEG-4, è il formato erede dell'MP3 sempre secondo le specifiche MPEG. Tra i successori del formato MP3 è degno di nota l'Ogg Vorbis per la qualità di codifica e per il fatto di essere un progetto Free Software. Quasi tutti gli altri formati sono legati a delle aziende proprietarie di diverse brevetti e licenze legate alle specifiche MPEG.
La diffusione del formato MP3 e di software gratuiti (come Winamp) apportarono una piccola rivoluzione nel mondo della musica, la diffusione delle playlist. In precedenza le canzoni di successo erano attentamente intercalate ai motivi meno riusciti nei CD e nelle audiocassette che si potevano ascoltare solamente nell'ordine studiato dal produttore. Con l'avvento dei supporti digitali questo non accade più ed è possibile una maggiore personalizzazione.
[modifica] Qualità del formato MP3 audio
Molti ritengono di qualità accettabile per il formato MP3 il bitrate di 128 kilobits al secondo, qualità che si avvicina a quella di un CD. Questo bitrate è il risultato di un tasso di compressione che si avvicina al rapporto di 11.02:1. Tuttavia test di ascolto mostrano che, attraverso un po' di pratica, molti sono in grado di distinguere un formato MP3 a 128 kbit/sec da un CD originale. Per molti altri, 128 kbit/s è una qualità di ascolto bassa, da un'analisi condotta dalla rivista SUONO, l'opinione dei conduttori al termine della prova, risulta che solo a 256 kbit/s si può parlare di alta fedeltà.
Possibili codificatori
- codice di riferimento ISO dist10: è la qualità peggiore; file MP3 difettoso (tutti i blocchi audio sono marcati come difettosi)
- Xing: principalmente basato sul codice ISO, qualità simile all'ISO dist10.
- Blade: qualità simile all'ISO dist10
- FhG: Alcune di loro sono buone, ma altre hanno gravi difetti.
- ACM Producer Pro: Alcune versioni generano dei disturbi fastidiosi
- L.A.M.E (è un acronimo ricorsivo, per "Lame Ain't MP3 Encoder", letteramente "Lame non è un codificatore MP3", iniziò come una patch dimostrativa GPL che modificava l'originale codificatore dist10 ISO, realizzata da Mike Cheng all'inizio del 1998, ed era quindi incapace di produrre file MP3 per conto suo o di essere compilato separatamente. Nel maggio 2000 gli ultimi resti del codice sorgente ISO furono sostituiti conferendo così al codice sorgente LAME piena funzionalità come codificatore LGPL MP3, in grado di competere con i principali codificatori presenti sul mercato. Lame development at Sourceforge.
Nel sito [1] è possibile trovare un front end di Windows per il codificatore LAME (il "popolo" di JTHZ.com utilizza LAME dal 1998).
La qualità di un file MP3 dipende dalla qualità della codifica e dalla difficoltà con la quale il segnale deve essere codificato. Buoni codificatori hanno una qualità accettabile da 128 a 160 kbit/s, la chiarezza perfetta di un brano si ottiene da 160 a 192 kbit/s. Un codificatore che ha bassa qualità lo si riconosce ascoltando persino un brano a 320 kbit/s. Per questo non ha senso parlare di qualità di ascolto di un brano di 128 kbit/s o 192 kbit/s. Una buona codifica MP3 a 128 kbit/s prodotta da un buon codificatore produce un suono migliore di un file MP3 a 192 kbit/s codificato con uno scarso codificatore.
Una caratteristica importante dell'MP3 è la perdita di dati dovuta alla compressione – è il modo con cui si rimuove l'informazione dal file audio originale allo scopo di risparmiare spazio. Nei moderni codificatori MP3 gli algoritmi più efficaci fanno di tutto per assicurare che i suoni rimossi siano quelli che non possono essere rilevati dall'orecchio umano. Questo risultato è stato ottenuto anche grazie alla scienza della psicoacustica.
Tuttavia molti ascoltatori sono in grado di riconoscere la differenza confrontando un CD originale con un formato MP3 da 192 kbit/s e persino a 256 kbit/s di alcuni codificatori meno potenti e più obsoleti. Se il vostro scopo è di memorizzare file audio con una fedeltà massima indirizzatevi su un compressione audio del tipo FLAC, SHN, o LPAC. Questi generalmente comprimono un file audio PCM a 16-bit approssimativamente dal 50 al 75% dell'originale[senza fonte] (questo dipende dalla caratteristiche del file audio stesso).
[modifica] Bit rate
Il bit rate è il numero di unità binarie che fluiscono al secondo ed è variabile per i file MP3. La regola generale è che maggiore è il bitrate, più informazione è possibile includere dall'originale, maggiore è la qualità del file audio compresso. Attualmente per le codifiche dei file MP3 fissano un tasso di compressione equivalente per tutto il file audio.
Per l'MPEG-1 layer 3 i bitrate disponibili sono: 32, 40, 48, 64, 80, 96, 112, 128, 160, 192, 224, 256 e 320 kbit/s (103 bits per secondo), e le frequenze campionate disponibili sono 32, 44.1 e 48 Khz. La frequenza di campionamento a 44.1 kHz è quasi sempre utilizzata per i CD audio, mentre i 128 Kbit/s come una sorta di bitrate standard "abbastanza buono". L'MPEG-2 e l'MPEG-2.5 (non-ufficiale) contemplano un numero maggiore di bitrate: 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144 e 160 kbit/s
I file MP3 audio sono suddivisi in settori ("chunks" in inglese) chiamati frames, ("fotogrammi" in italiano). Ognuno di questi settori è provvisto di un marcatore del tasso di compressione; in questo modo, mentre il file audio viene riprodotto, è possibile modificarlo dinamicamente. Questa tecnica rende possibile utilizzare più bit per la parte del suono ad alta dinamica (suoni più complessi) e meno bit per la parte a bassa dinamica (suoni meno complessi).
[modifica] Individuazione dei difetti nei file MP3
Vi sono diversi difetti nel formato dei file MP3, che non possono essere individuati neanche dal migliore dei codificatori e sono insiti nelle caratteristiche stesse del formato (In parentesi il formato file dove questo difetto viene corretto).
- Un tempo di risoluzione troppo basso per un segnale transiente molto alto (AAC, Ogg Vorbis)
- ritardo complessivo di codifica/decodifica non definito (Ogg Vorbis)
- nessun fattore di banda per frequenze sotto i 15.5/15.8 kHz (AAC, Ogg Vorbis)
- Il collegamento stereo è fatto sulla base di un frame, o "fotogramma" (AAC, Ogg Vorbis)
- Il bitrate è limitato a 320 kbit/s (AAC, Ogg Vorbis)
[modifica] Codificatori di file MP3 audio
Lo standard MPEG-1 non definisce specifiche precise per i codificatori MP3. L'algoritmo di decodifica e il formato del file, invece sono definiti molto bene. Si presume che il creatore dello standard abbia escogitato un algoritmo per rimuovere appropriate parti di informazioni da un file originale, o piuttosto una rappresentazione in dominio di frequenza (MDCT). Questo processo si basa tipicamente sulla codifica psico acustica, ossia vengono rimossi quei suoni che l'orecchio umano non è in grado di percepire sia mediante l'orecchio che il cervello.
Come risultato, vi sono molti codificatori MP3 differenti, ognuno in grado di riprodurre file di qualità differente; al 30 settembre 2001 il migliore codificatore ad alto bitrate (128 kbit/s e superiori) è LAME. Per i bitrate più bassi il miglior codificatore è il Fraunhofer, ma vi sono diverse opinioni. La decodifica MP3, è tuttavia ben definita da uno standard. Molti decodificatori sono "bitstream compliant", ossia sono in grado di riprodurre esattamente un brano dello stesso file MP3 non compresso.
[modifica] ID3
| Per approfondire, vedi la voce ID3 tag. |
L'ID3 tag è una classificazione dei formati che permettono l'inserimento, nel file MP3, della descrizione, del titolo, dell'artista e dell'album, o il numero della traccia.
[modifica] Alternative all'MP3
Vi sono molti altri codec audio alternativi all'MP3:
- Ogg Vorbis dalla Xiph.Org Foundation, libero da brevetti;
- mp3PRO dalla Thomson Multimedia;
- MPEG-1/2 Audio Layer 2 (MP2), predecessore dell'MP3;
- MP+, una derivato dell'MP2;
- MPEG-4 AAC, utilizzato da LiquidAudio e Apple Inc. nell'iTunes Store;
- ATRAC, usato dai Minidisc della Sony;
- AC-3, usato dalla Dolby Digital per i DVD;
- QDesign, usato da QuickTime per alti bitrate;
- Windows Media Audio (WMA) da Microsoft;
- RealAudio da RealNetworks.
mp3PRO, MP3, AAC, e MP2 sono tutti membri della stessa famiglia tecnologica e si basano su modelli psicoacustici simili.
Il Fraunhofer Gesellschaft è proprietario di alcune licenze di codec: Dolby Labs, Sony, Thompson Consumer Electronics, mentre AT&T possiede altri brevetti. Su Internet si trovano altri metodi di compressione privi di perdite. Pur non essendo simili all'MP3, essi sono buoni esempi di altri metodi di compressione disponibili:
- SHN
- FLAC
- Monkey's Audio (APE)
Il formato MP3 fu progettato per essere utilizzato in parallelo al formato Video MPEG-1/2, e per questo non in grado di riprodurre adeguatamente i suoni al di sotto dei 48 kbit/s (mono) o degli 80 Kbit/s (stereo).
Nonostante alcuni fautori di codec più recenti come WMA, mp3PRO e RealAudio affermino che i loro rispettivi algoritmi sono in grado raggiungere una qualità CD già con 64 kbit/s, i test di ascolto cieco sembrano smentirli. Va comunque apprezzata l'indiscussa superiorità di questi e altri formati su MP3 a pari larghezza di banda impiegata.
Tra gli altri, la Xiph.Org Foundation, sviluppatrice dell'algoritmo Vorbis utilizzato assieme al container multimediale Ogg, in supporto al proprio formato di compressione Free Software, fornisce in una pagina web dei test di ascolto comparato tra diversi formati audio.
[modifica] Licenze e brevetti
La Thomson Consumer Electronics è proprietaria del brevetto MPEG-1/2 Layer 3 in U.S.A. e in Giappone. La Microsoft, che ha progettato il sistema operativo Windows, ha scelto di creare il proprio formato proprietario WMA invece di utilizzare l'MP3, in questo modo evita di dover pagare le relative royalties.
Per informazioni sui costi vedere: [2] e [3].
Sotto la presidenza di Mario Monti, l'antitrust europeo multò Microsoft per abuso di posizione dominante con il massimo della sanzione, il 10% del fatturato. Microsoft fu costretta ad abilitare l'installazione su Windows di lettori audio diversi dal nativo Windows Media Player, venduto insieme al sistema operativo. Questi software permettevano di ascoltare l'mp3 e altri formati diversi dal ".wma": alla fine, lo stesso software "Windows Media Player" è stato modificato per la lettura di molti codec e la loro masterizzazione, fra i quali c'è l'mp3.
Nonostante queste scelte, il formato MP3 continua ad essere ampiamente utilizzato. Vediamo perché:
- Ormai la maggior parte degli utenti ha familiarità con il formato
- La maggior parte della musica disponibile è in formato MP3
- Una grande varietà di software e di hardware hanno ottenuto dei notevoli vantaggi da questo formato, rivoluzionando l'industria musicale e le leggi sul copyright.
- Assenza di controlli sulla copia e distribuzione. Assenza di DRM (Digital Rights Management)
- L'mp3 è un file generalmente poco pesante rispetto a molti altri formati. Tuttavia è superato nel rapporto qualità/bitrate sia da WMA che da Ogg Vorbis , AAC.[senza fonte] Fornisce una qualità audio più che buona con file che occupano da 3 ai 5 MB (MegaByte), per una tipica canzone di 5 minuti compressa ad un bitrate di 128 kbit/secondo. Ciò consente il download di singoli brani anche ad utenti che non hanno una connessione ADSL, di memorizzare parecchie ore di musica nei lettori Multimediali.
- La rivoluzione dell'mp3 sta nel fatto che i modelli psicoacustici usati per la codifica del flusso audio sfruttano il fenomeno del mascheramento. L'orecchio umano infatti non è in grado di percepire determinati suoni sovrapposti. In questo modo viene codificata minore informazione, senza disturbare però la qualità percettiva.
[modifica] Voci correlate
[modifica] Note
[modifica] Collegamenti esterni
- MP3 su Open Directory Project (Segnala su DMoz un collegamento pertinente all'argomento "MP3")

