– “¡Hola! ¿Me podría poner “Mai nei is Luka”? Es que me encanta bailar ese bolero con mi novia y se lo quiero dedicar…”
Esta frase, repetida de varias maneras y con diferentes pronunciaciones, la recibía diariamente cuando hacía mi turno de disc-jockey en Veracruz Estéreo de Medellín por allá en 1987. Obviamente, el oyente se refería a la canción “Luka” de Suzanne Vega.
Claro, con esa voz cálida e inocente, cualquiera que no sepa inglés podría pensar que se trataba de una canción romántica. Y no lo era…
Realmente, “Luka” es una canción que habla sobre un niño que sufre abuso y trata de llamar la atención de los adultos para que lo ayuden, pero de manera sutil y silenciosa. La letra es un poco oscura, pero es una reflexión sobre la violencia infantil y la importancia de escuchar a los que no pueden hablar.
Es decir, no tenía nada de romántica, y mucho menos se trataba de un tema para dedicárselo a alguien o para bailarlo.
Pero la historia que voy a contar, y que tiene como protagonista a la misma Suzanne Vega, no tiene nada que ver con las letras de sus canciones ni de sus melodías, sino de su sonido.
Durante años, esta cantante estadounidense no lo supo, pero su voz fue el campo de pruebas más exigente de una de las tecnologías más influyentes del siglo XX.
No se usó la grabación de una orquesta sinfónica ni una de rock progresivo. Fue una voz sola, casi aislada, cantando a cappella. Y precisamente por eso fue muy importante para el desarrollo de un proyecto que le cambiaría la cara a toda la industria musical.
“Todo lo demás sonaba bastante bien, pero la voz de Suzanne Vega quedaba destruida”, recordaría tiempo después Karlheinz Brandenburg, uno de los inventores del MP3.
La canción era “Tom’s Diner”, que también estaba incluida en el álbum “Solitude Standing”, una grabación muy sencilla: la voz de Vega en el centro, un acompañamiento ambiental muy ligero y ningún instrumento que sirviera de apoyo.
Para los primeros sistemas de compresión digital, este parecía ser el peor escenario posible porque en las pruebas que se hacían, cada respiración, cada vibración de la voz, cada detalle quedaba expuesto y el resultado era terrible: la voz sonaba metálica, frágil y difícil de reconocer.
Pero, aunque usted no lo crea, “Tom’s Diner” se terminó convirtiéndose en la canción más escuchada y analizada por los ingenieros que inventaron el MP3.
El problema no era el archivo, sino el oído
La compresión digital es como un súper poder para ahorrar espacio en los archivos digitales. Básicamente, es un proceso que reduce el tamaño de los archivos de audio, video o imagen, sin perder mucha calidad.
Se creó para hacer que los archivos fueran más fáciles de almacenar y compartir, especialmente cuando el espacio era limitado o la velocidad de internet era lenta. Es como meter un montón de ropa en una maleta pequeña, usando esas bolsas plásticas que permiten ‘chupar’ el aire y comprimir las prendas, pero sin arrugarlas mucho.
Y para comprenderlo, primero hay que decir que, a finales de los años 80, los primeros sistemas de codificación de audio digital funcionaban de manera rígida.
Dividían la señal sonora en capas o bandas de frecuencia que podían guardarse o descartarse según su supuesta importancia. El método era eficiente, pero poco flexible.
Brandenburg, uno de los padres del MP3, lo explicaba así: “Los primeros procesos de codificación estaban diseñados para filtrar una señal en capas de sonido, cada una de las cuales podía guardarse o desecharse según su relevancia relativa. Pero el sistema era muy estructurado e inflexible”.
La solución vino de otro campo: la psicoacústica. No se trataba solo de comprimir audio, sino de entender cómo escucha el ser humano. Qué sonidos percibe, cuáles no y cuáles quedan “enmascarados” por otros más fuertes.
“Otros tuvieron la idea de que realmente debíamos usar el conocimiento psicoacústico sobre lo que oímos y lo que no oímos, lo que se conoce como ‘enmascaramiento’: a veces escuchamos un sonido, otras veces queda oculto por otros”, explicaba Brandenburg.
“Con este sistema gané, por un lado, eficiencia -la posibilidad de reducir las tasas de bits de la música comprimida- y, por otro, la flexibilidad necesaria para adaptarme mejor a las propiedades del sistema auditivo humano”.
El nacimiento de MPEG y la apuesta por el Layer III
En 1988, la Organización Internacional de Estandarización convocó a un equipo internacional para desarrollar estándares de codificación de audio. Ese grupo se llamó Grupo de Expertos de Imagen en Movimiento (Moving Picture Experts Group), abreviado MPEG.
Brandenburg dice que se inspiró en Leonardo Chiariglione para su visión inicial de comprender que esos estándares podrían ser realmente útiles.
“En un grupo de estandarización, las personas tienen que llegar a un consenso sobre una buena idea para un sistema. Ese fue el punto de partida original del trabajo de MPEG. En ese momento, todo el mundo que trabajaba en este tema pensó: ‘Esta es nuestra oportunidad, contribuyamos al estándar’”.
La idea original de Chiariglione y otros investigadores era llevar video al CD-ROM. Esa fue la primera aplicación, pero desde esa época ya se pensaba en muchas otras posibilidades, prácticamente todas las que hoy usamos para audio y video comprimidos.
Dentro del grupo de imagen en movimiento se creó un subgrupo de audio. Tras largos debates, se llegó a un compromiso técnico: diferentes modos de compresión llamados Layer I, Layer II y Layer III (‘Layer’ quiere decir ‘Capa’ o ‘Nivel’).
“Al final, todos juntos llegamos a un acuerdo que incluía distintos modos. La mayoría de nuestras ideas se incorporaron al modo más complejo, el que ofrecía la mejor calidad a bajas tasas de bits. Ese modo se llamó Layer III”.
Hasta que escucharon “Tom’s Diner”
Para 1988, Brandenburg pensó que el sistema estaba casi perfecto, pero un día escuchó “Tom’s Diner” y se dio cuenta de que tenían que avanzar más en su idea. “Es realmente el peor caso posible para el sistema tal como lo teníamos en 1988”, reconoció.
Al transformar la canción en un archivo MP3 (MPEG 1, Audio Layer III), todo se escuchaba de manera aceptable, pero la voz de Suzanne Vega sonaba horrible.
Pero en lugar de dejarse doblegar por lo que parecía un fracaso, esta situación, más bien, se convirtió en una obsesión. Brandenburg trabajó junto a Jim Johnston, de AT&T, ajustando distintos modelos psicoacústicos y métodos de codificación de datos para corregir el sistema y rescatar la voz de Vega.
“Finalmente perfeccionamos el sistema y entonces la voz de Suzanne Vega dejó de ser un problema”, contaría después. Eso sí, el proceso tuvo un precio: Brandenburg dice que tuvo que escuchar la canción entre 500 y 1.000 veces. “De hecho, todavía me gusta. Esa fue la parte buena”.
¿Cómo ayudó la psicoacútica?
La psicoacústica se refiere al estudio de cómo el cerebro humano percibe y procesa los sonidos. Es la ciencia que analiza la relación entre el sonido físico y la percepción subjetiva que tenemos de él.
En otras palabras, la psicoacústica se ocupa de entender cómo nuestro cerebro interpreta los sonidos, teniendo en cuenta factores como la frecuencia, la intensidad, la duración y el contexto, y cómo esto influye en nuestra experiencia auditiva.
Y es que el problema que los científicos estaban tratando de resolver era convertir el audio original en archivos digitales que no fueran muy pesados, de forma que pudieran ser incluidos en un CD o en un DVD.
Para el caso del sonido, ya se habían logrado muy buenos resultados con el formato WAV (Waveform Audio File Format, o Formato de Archivo de Audio de Forma de Onda) surgido en los años 90, desarrollado por Microsoft y IBM como un estándar para almacenar audio digital en computadores y para ser compatible con el sistema operativo Windows.
Sin embargo, se requería de un formato más comprimido, pues una sola canción en formato WAV podía pesar, en promedio, entre 30 y 40 MB.
¿Cómo reducir el tamaño de un archivo de audio sin que el oído humano percibiera una pérdida significativa de calidad?
La respuesta estuvo en la psicoacústica, que permitía estudiar qué sonidos no percibe o distingue el oído humano claramente cuando están acompañados por otros.
El MP3 elimina esa información “irrelevante” para el cerebro y conserva lo esencial, y esto lo hace teniendo en cuenta que el oído humano promedio puede escuchar sonidos en un rango de frecuencias que va desde aproximadamente 20 Hz (muy bajos, como un terremoto) hasta 20.000 Hz (muy altos, como un silbido agudo).
Es decir, cualquier sonido que esté por debajo o por encima de ese rango, no es percibido por nosotros, así que “sobra”. Entonces, mediante un proceso tecnológico, para crear el MP3 lo que se hace es recortar todos esos sonidos ‘sobrantes’ y se concentra en lo que sí podemos escuchar, es decir, solo lo que esté entre los 20 y los 20.000 hertz.
Gracias a esta técnica psicoacústica, el resultado fue un archivo hasta diez veces más liviano que un WAV, sin que la mayoría de las personas notara la diferencia. Como ejemplo, ese mismo archivo de WAV que pesaba entre 30 y 40 MB, ahora pesaría solamente entre 3 y 5 MB.
En una época dominada por el CD y por conexiones telefónicas lentas, esa reducción fue un verdadero milagro tecnológico. Sin proponérselo, el MP3 resolvió el principal cuello de botella del audio digital: el peso.
El surgimiento del MP3
Durante los primeros años, el MP3 fue casi un experimento de laboratorio, pero a mediados de los 90 comenzó a filtrarse fuera del ámbito académico y entró en los computadores personales.
Programas como Winamp convirtieron al MP3 en una experiencia cotidiana. Por primera vez, una persona podía tener su discoteca completa en el disco duro del computador y escucharla en cualquier orden, sin límites físicos.
Pero la verdadera revolución llegó con internet. El MP3 era el formato perfecto para circular por la red: liviano, compatible y fácil de copiar.
Plataformas como Napster no inventaron el MP3, pero sí lo volvieron imparable. La música dejó de estar atada a un soporte físico y pasó a ser un archivo que se podía compartir libremente de computador en computador.
La industria discográfica reaccionó tarde y mal; intentó frenar el fenómeno con demandas, cuando el cambio ya era cultural.
Para la radio, el impacto fue profundo. El MP3 permitió digitalizar fonotecas completas, agilizó la producción, facilitó el intercambio de contenidos y abrió la puerta a los sistemas modernos de automatización.
Las emisoras dejaron atrás las cintas, los cartuchos y, más tarde, incluso los CD. El audio pasó a ser un archivo que se copia, se edita, se programa y se transmite con una flexibilidad impensable décadas atrás. Sin el MP3, difícilmente existirían la radio por Internet, el podcasting o los sistemas actuales de distribución de contenidos.
Paradójicamente, el MP3 también cambió la relación emocional con la música. Al hacerla abundante y accesible, le quitó parte de su ritual. Ya no había que ahorrar para comprar un disco ni esperar a que una emisora programara una canción. Ahora todo está a un clic de distancia.
Con el tiempo aparecieron formatos más eficientes y de mayor calidad, como AAC, OGG o FLAC. Incluso el streaming ha desplazado al archivo descargable en muchos contextos. Sin embargo, el MP3 no desaparece. Sigue siendo el idioma común del audio digital: compatible con casi cualquier dispositivo, suficientemente liviano, suficientemente bueno.
Conclusión
Lo más curioso de toda esta historia es que, tiempo después, el ingeniero Brandenburg conoció personalmente a Suzanne Vega y la escuchó interpretar “Tom’s Diner” en vivo. La experiencia, para él, fue reveladora.
“Fue realmente asombroso: era exactamente como en el CD”, recordó. “Fue como si se abriera una cortina, porque yo conocía todos los pequeños detalles de cómo ella canta la canción… y todavía la canta exactamente igual”.
De esta manera, una canción aparentemente simple terminó convirtiéndose en la prueba definitiva de una revolución tecnológica. “Tom’s Diner” no solo sobrevivió al MP3, sino que lo obligó a ser mejor.
Gracias a esa voz sola y sin mayores acompañamientos o efectos especiales, el formato que transformaría para siempre la radio, la música y el audio digital aprendió, gracias también a la psicoacústica, una lección clave: que antes de comprimir, había que entender cómo funciona el oído humano.

Tito López hace radio desde 1975 y ha creado formatos radiofónicos exitosos en Colombia, Portugal, Chile, Panamá y Costa Rica.
Es coach de talentos, intérprete de investigaciones de audiencia, productor, blogger, libretista y conductor de programas de radio.
Lo puede seguir en Facebook como Oscar.Tito.Lopez y en Twitter como oscartitolopez.















