MPEG-(1/2) Layer III, conocido comúnmente como MP3, nació a finales de la década de los 80, por manos del Moving Picture Experts Group (MPEG); un formato de audio maravillo que prometía tamaños 11 veces menor que un archivo similar en CD.
A mediados del 2000, muchos formatos de audio entraron al mercado como WMA, OGG y AAC, haciendo pensar que el MP3 –un formato más veterano- podría comenzar a decaer, no obstante sólo consiguió crecer más.
Teléfonos celulares, reproductores portátiles, equipos de música y computadores pueden reproducir este maravilloso archivo que, en un par de megabytes nos entrega nuestra música favorita.
¿De qué está hecho un archivo de Audio sin Compresión
El formato mp3, como es archiconocido, es un formato de audio, basado en un algoritmo de compresión con pérdida.
¿Qué significa esto?
Podríamos decir que el mp3 es sólo un aproximado del audio original. Se le ha quitado mucha información para hacerlo más liviano, como frecuencias que son inaudibles para el humano, entre otros.
Por otra parte el wav, es un formato sin compresión y casi sin pérdidas, aunque se le dice que no tiene, pero toda conversión análogo-digital implica pérdida de información.
Para la construcción de un archivo de audio sin pérdidas, se subdivide toda la pista en “muestras” de algunos milisegundos.
Veamos el siguiente ejemplo de una muestra en la clásica transformación Análogo-Digital:
He aquí la muestra de una onda análoga
Y aquí una onda digital
Y aquí una onda vital.
Lo siento, no podía dejarlo pasar…
Verán que la onda digital no es más que una emulación de la onda análoga. Cada columna está representado por grupos de bits. Entre más bits por muestra, mejor será la calidad y más parecida a la realidad será el audio.
¿Cómo construimos un mp3?
Este bello formato ocupa algo mucho mejor: Las matemáticas.
Sucede que el clásico archivo WAV (sin compresión y casi sin pérdidas) funciona de la siguiente manera: cada muestra se forma mediante la union de distintos niveles, en el caso del formato CD, éstos usan niveles de 16 bits, es decir, 216: 65.536 posibles niveles.
En esta imagen podemos ver una reconstrucción de 4 bits (24), es decir, 16 niveles distintos. En rojo se ve la onda original, y los puntos azules son los distintos niveles que intentan emular la información.
Pero si sacamos la cuenta, 1 minuto de archivo wav equivaldrían a 10MB, cosa que para hoy no es mucho, pero para los años 90-2000, era demasiado.
El mp3 en cambio, toma cada muestra y la separa en 576 bandas de frecuencia distintas. Gracias a la Transformada de Fourier, cada frecuencia se reconstruye mediante una función matemática como una sumatoria de senos y cosenos.
Aquí tenemos un ejemplo de cómo funciona:
Al superponer cada frecuencia con distintas amplitudes, se logra reconstruir la onda de la muestra y… ¡et voilà!
¿Cómo se mide la calidad de un mp3?
La calidad podría considerarse como el bitrate o en español “tasa de bits”, ésta nos indica cuántos bits por segundo tenemos en cada muestra. Como menciono anteriormente, entre mayor bitrate mayor será la calidad, porque –obviamente- habrá menos pérdida de información.
En el caso de esta canción, el bitrate es de 192kb/s. Lo anterior quiere decir que por cada segundo de audio, hay 192.000 bits de información, haciendo un audio bastante aceptable y muy similar a la calidad CD.
El bitrate puede ser constante, es decir, cada segundo de la pista tiene la misma cantidad de bits, o variable. Gracias al bitrate variable algunos segundos pueden tener más o menos bits dependiendo de la sección. Por ejemplo, para una sección de audio que no tiene sonido o sonido muy bajo, es contraproducente gastar la misma cantidad de bits que se pueden usar en otra sección que tenga más frecuencias y niveles.
Otra cosa que también influye en la calidad de un archivo de audio, es la frecuencia del muestreo, esta nos indica cuántas muestras por segundo se tomarán, para reconstruir el archivo original.
En la ilustración anterior, tenemos 44.100 muestras por segundo.
Gracias a la tasa de bits y la duración del audio, podemos fácilmente calcular el tamaño del archivo resultante.
La formula anterior sólo funciona con audios con bitrate constante. Obviamente para bitrate variable no funciona, ya que no todas las muestras tienen la misma tasa de bits.
Podemos observar que el tamaño nos da muy similar a lo calculado anteriormente, los bytes restantes son ocupados en metadatos y otros.
Si quieres aprender más, puedes leer acerca del algoritmo de Huffman y la transformada de Fourier, elementos vitales para la creación de un mp3, y –como todos saben- elementos que también pueden convertirte en el alma de la fiesta, tal como mis amigos y yo.