El final del CD

Por  Fernando Moraleda

 

              Ya están aquí los nuevos formatos de audio digital: el SACD (SuperAudioCD), y el DVD-Audio (DigitalVersatileDisc-Audio), y se nos plantean las siguientes dudas: ¿Valdrá la pena cambiar, serán apreciables las mejoras?. ¿ Tan malo es el entrañable CD?. ¿Es cierto que suena mejor un buen vinilo que el “compacdisc”?. ¿Y si es así, porque?.

 

El sonido digital del CD, es peor que el sonido analógico en ciertos aspectos de una importancia clave para conseguir en la escucha, lo que suele denominarse, naturalidad, calidez, ambiente, resolución en microdetalles, etc. Resumiendo, "musicalidad". Como puede apreciarse, son unos matices muy sujetos a interpretaciones subjetivas, por ello resulta lógico que más de un 90% de usuarios de todo el mundo no perciban la necesidad de cambiar el CD. Pero la mayoría de usuarios no tienen, al parecer, un nivel de exigencia tan elevado como el de muchos aficionados que desde siempre hemos buscado el "sonido absoluto", es decir reproducir la música con la máxima naturalidad y realismo.

 Aquí hay que poner en evidencia que no es el disco CD lo que esta "mal", si no el "idioma" (formato) en que se "escriben" los datos en el mismo, por lo que bastaría mejorar el "idioma" para aumentar las prestaciones del CD. Si no se ha hecho esto antes (salvo excepciones como el HDCD, XRCD y DTS-CD) es entre otras razones, porque se hubiera roto la "intocable" compatibilidad universal, aceptada por la industria y por el mercado en su día.

 

Los problemas del digital: la cuantificación

En el audio digital se mide el valor en amplitud (Cuantificación) de una tensión eléctrica proporcionada por el micrófono a intervalos de tiempo regulares (Muestreo) y muy rápidos (44.100 veces por segundo), estos valores se almacenan en binario en lo que llamamos palabra digital, en que según el tamaño de esta, tenemos más o menos resolución (en el CD los 16 bits, nos dan un total de 65.535 valores diferentes). ¿Pero, porque el sonido digital no es todo lo satisfactorio que se esperaba?. Un ejemplo típico de las dificultades del sonido digital es la reproducción de una onda cuadrada. (Ver figura 1).

Estas deficiencias del audio digital se han venido llamando error de Muestreo, que tiene que ver con la respuesta en frecuencia y por tanto con los armónicos y el timbre de los sonidos. Error de Cuantificación, relacionado con la resolución y causante de  distorsión. Además del "jitter” que se refiere a la sincronización de todo el “tinglado”.

Empecemos por el error de cuantificación. En un sistema digital el valor absoluto de la distorsión es constante con el nivel de la señal, lo que significa que el porcentaje de la misma es  inversamente proporcional al tamaño (amplitud) de la señal, mientras que en un sistema analógico el valor absoluto de la distorsión no es constante con la amplitud, de una forma, que el porcentaje es prácticamente constante con el tamaño de la señal.

Este es el principal “talón de Aquiles” de cualquier sistema digital. Debido a esto es por lo que suele afirmarse que ningún sistema de audio digital sonará jamás mejor que su equivalente analógico, y por ello que la realidad. De ahí que muchos partidarios del sonido analógico, cuestionen que el digital sea el camino idóneo para llegar al sonido absoluto.

La cuestión es similar a lo que ocurre con las imágenes digitalizadas. Si hacemos zoom sobre ellas, llegaremos muy pronto a percibir el pixelado y se pierden progresivamente los detalles más pequeños. Mientras que en imagen analógica, al tener mayor resolución el grano (equivalente a pixel) se apreciará más tarde al hacer el mismo zoom; pero además, a medida que aumentamos los pequeños detalles, se conservan casi inalterados y reconocibles a pesar de cierto emborronamiento debido al grano.

He aquí otro ejemplo: Imaginemos un cuentakilómetros de coche con sus lugares reservados para los diferentes dígitos, las unidades, las decenas, las centenas, los millares etc. Con las unidades en kilómetros, no tendríamos ni idea de las distancias recorridas de menos de un kilómetro, por ejemplo de metro en metro, y estos por tanto se pierden irremisiblemente. Y aquí podemos darnos cuenta de la magnitud del error, que en audio equivale a la distorsión. Un valor de +/-500 metros, es el error que tiene un cuentakilómetros con unidades en kilómetros. Al igual que en digital, este error es constante, o sea es idéntico entre cualquier valor consecutivo, ya sea entre 0 y 1 Km que entre 99.998 y 99.999 Km por ejemplo. Lo que nos da para una cifra de 5.000 Km, solo el 0,01%, pero para un valor de 5 Km el porcentaje es del ¡10%!. Mientras en analógico el porcentaje de distorsión sería casi el mismo en ambos casos. Por tanto cuando la señal es muy pequeña y ocupa unos pocos bits de los 16, tendremos unos porcentajes de distorsión muy elevados, lo que provoca, a diferencia del analógico, que la señal en cuestión sea irreconocible. Para disminuir esta distorsión, hay que saber que un bit más de resolución, equivale a reducirla a la mitad. Por tanto trasladando el ejemplo anterior al audio, si aumentamos la resolución en 4 bits, el valor de error del 10% para 5 (Km) sería 16 veces menor (10:16=0,625%). Lo que significa que aunque no se pueda eliminar la distorsión, esta se puede mantener a niveles más “analógicos” aumentando la resolución lo suficiente para que al hacer “zoom” (en sonido hacer zoom es aumentar el volumen de escucha), pudieran escucharse de forma reconocible los detalles más pequeños. Lo que nos lleva a considerar cual es la cuantificación mínima ideal para que esto ocurra, teniendo en cuenta los límites de percepción humana en cuanto al margen dinámico.

La principal dificultad para establecer la cuantificación idónea estriba en que para determinarla intervienen parámetros que no pueden ponderarse a priori como por ejemplo: criterios del técnico de sonido, márgenes dinámicos de los instrumentos, y por otro lado, nivel de escucha (“zoom”) elegido por el usuario, sensibilidad de los altavoces, potencia del amplificador, y muy importante, ruido ambiente en el lugar de escucha, entre otros. Sin embargo se han llegado a establecer unos valores mas o menos aceptados en la industria, de unos 90 a 110 dB de margen dinámico para el programa y unos 120 dB o más de relación S/R para los sistemas. Que traducido al audio digital significa 20 bits de resolución como mínimo frente a los 16 del CD (20 bits nos dan un total de 1.048.575 valores diferentes, frente a los escasos 65.535 de los 16 bits). Con estos 20 bits se podría hacer “zoom” conservando reconocibles la mayoría de microinformaciones. Ya que estarían en el limite de percepción humana. Lo que situaría a los sistemas digitales, globalmente por encima de cualquier medio analógico existente a nivel domestico e igualaría, posiblemente, a los profesionales.

 Hay que advertir que las tasas de distorsión tan favorables, que se dan del CD, en los catálogos y especificaciones de los fabricantes, solo, lo son en condiciones óptimas de la señal (o sea para señales de nivel alto o medio). Ya que, para señales débiles y pequeñas variaciones, esta distorsión es muy desfavorable; pero tengo que reconocer, que tal vez, no en una magnitud como la que da a entender mi ejemplo. Sobre todo por que dicha distorsión, en señales tan suaves, no es probablemente tan apreciable como da a entender su número; lo que no impide que el CD pierda puntos al compararlo con el analógico.

 

Aún hay más: la forma de las ondas

Pero el CD también tiene dificultades debidas a una escasa frecuencia de muestreo.

La reconstrucción de la forma de una onda, en la codificación digital del CD, es algo parecido a querer definir gráficamente una circunferencia con solo tres puntos unidos por rectas, el resultado obvio es un  triangulo no una circunferencia. Para aproximarse a dicha circunferencia hace falta una cantidad mínima de puntos que podría ser de 8 (octógono), para una reproducción minimamente aceptable.


 Esto equivale, en el CD, a aumentar  la frecuencia de muestreo (con el sistema actual de 44.100 muestras por segundo solo se toman dos muestras de un periodo de una frecuencia de 22.050 hertzios). El muestreo ideal, viene determinado por el número mínimo de muestras que necesitaremos, para aproximarnos de modo óptimo, a la forma de onda real, de la máxima frecuencia que queramos reproducir. En nuestro caso una onda senoidal de 20.000 hertzios. Para la cual son necesarias un mínimo de 8 muestras por ciclo, para una aproximación óptima. Es decir 20.000x8=160.000 muestras por segundo. El cuádruple del CD. (Ver figura 2). O lo que es lo mismo, necesitamos un sistema de grabación y reproducción que cumpla con una banda pasante de 80.000 hertzios o más

 


 

Naturalmente esto afecta más a las frecuencias altas, que son las que dan carácter e identidad a los distintos sonidos e instrumentos. También nos damos cuenta de la diferencia con el analógico, donde el tiempo no está en trozos sino que es continuo, y a pesar de una banda pasante limitada en frecuencia no lo está en el tiempo, de forma que todos los armónicos altos se reproducen de manera natural. No obstante lo que quiero resaltar aquí es la enorme diferencia entre esta aproximación ideal y lo que tenemos realmente en la codificación del formato CD, es decir un “triangulo”, en vez de la figura “octogonal”. Este gran error en la forma de onda es mucho más crucial, en la escucha, de lo que se creía. Como se ha puesto de manifiesto en la experimentación y sobre todo la comparación con los nuevos formatos de alta definición.

Además de lo explicado hasta ahora, no hay que olvidar un problema que es común a todos los sistemas de transmisión digital, y que se llama "jitter", que es una desincronización del flujo de datos digitales (imaginemos un desfile donde algunos soldados pierden el paso), esto se soluciona resincronizando la señal por ejemplo utilizando un buffer (memoria temporal) y relojes de cuarzo ultraprecisos. Es decir los datos entran en el buffer a un ritmo desajustado y salen a otro mas preciso. En este tema los fabricantes, han llegado actualmente a soluciones bastante satisfactorias.

 

Los efectos que causa el “mal”

La acción combinada de estos defectos  incluyendo también el jitter, produce lo que se a dado en llamar, casi de forma despectiva, “sonido digital”, con los atributos de: frío, sin alma, metálico, agresivo, áspero, etc.

Me atrevería ha decir, aun a costa de ser subjetivo, que el error de cuantificación causa la desaparición de los detalles más sutiles de la música (los de más débil amplitud, y por tanto afectados por la distorsión), que proporcionan esa sensación de ambiente y alma en la interpretación. Por otro lado el error de muestreo es el culpable de cierta uniformidad “metálica” de los timbres altos y posiblemente también de la falta de calidez de las frecuencias bajas. Y por último los aspectos relacionados con la aspereza y agresividad tienen, siempre según mi opinión personal, su origen en el jitter y la acción conjunta de los otros dos.

Con esta visión, ya tenemos una idea de cuales son las imperfecciones, ahora habrá que matizar que a pesar de todo hay que reconocer, que una resolución de 16 bits es un buen punto de partida. Recordemos que al principio el estándar propuesto por Philips solo contemplaba una resolución de 14 bits, y que fue la experiencia acumulada en los estudios de grabación con los nuevos sistemas digitales, donde se vio la necesidad de ampliar la resolución a 16. Al grabar, solo en raras ocasiones, usaremos la resolución total de 16 bits ya que durante la mayor parte del tiempo, estaremos usando un promedio de solo 10 bits, o menos. Entenderemos esto, si hemos hecho alguna vez grabaciones en platina de casetes con control manual y nos hemos fijado que las lucecitas o aguja del vúmetro, se mantiene la mayor parte del tiempo en la zona media o baja, y que la zona roja no debe sobrepasarse pues equivale pasando el ejemplo al digital, al rebosamiento de los 16 bits, que produce una distorsión (recorte) de transitorios altos muy perniciosa. En general, esta, se previene por el técnico de grabación, aplicando una cierta compresión de la dinámica de las señales altas, y/o grabando a niveles moderadamente bajos, lo que provoca que huyendo de esta distorsión de alto nivel, caigamos inevitablemente en la de bajo nivel, al aproximar más las señales y cambios pequeños de las mismas al dominio de los bits menos significativos. Son estas distorsiones, las que aconsejaron aumentar la resolución de 14 a16 bits. Y hoy día, no ya a 18 bits, ni siquiera a 20, si no a 24 bits, porque de esta manera se tiene el margen suficiente tanto en alto como en bajo nivel, para grabar las señales con una resolución media elevada y responder con holgura y por tanto con naturalidad a los transitorios de alta energía.

 

Los "remiendos"

Ahora vamos ha ver lo que se ha hecho para intentar poner remedio a todo esto, sin tener que cambiar el formato CD.

Primero nos fijaremos en el error de muestreo. Una solución básica para paliar los efectos perniciosos del citado error es, interpolar, que consiste en que durante la reproducción, el filtro digital realiza cálculos para intercalar entre dos muestras reales, varias ficticias, de un valor similar, forzando con ello un sobremuestreo que ayuda a "redondear" el contorno que gráficamente tendrían las señales (recordando el ejemplo anterior del triangulo y del octógono, sería lo mismo que añadir mas puntos promediando dos consecutivos). Una elaboración mejor de lo anterior, es la interpolación adaptativa, que utiliza un algoritmo que analiza porciones de la señal y de acuerdo con el contenido frecuencial de esta, genera unos valores de interpolación que corresponden, de esta forma, a armónicos relacionados con la señal grabada (que no la real). Las diferentes posibilidades de hacer esto, dan lugar a las distintas soluciones de cada fabricante, desde los filtros digitales convencionales a los de carácter adaptativo, siendo este último el caso de fabricantes como Krell, Wadia, el Legato Link de Pioneer y otros.

Y ahora la resolución. En este caso para disimular, que no resolver, el error de cuantificación, se recurre a un aumento de la resolución matemática de las muestras, para su tratamiento y conversión, (con objeto de evitar los errores de redondeo en el calculo y que no es lo mismo que la resolución real) haciendo hincapié en la máxima precisión. Se tiende a preservar hasta el extremo la integridad de los bits menos significativos (LSB: Low Significant Bit), es decir de los que definen las pequeñas variaciones de la señal y las señales más débiles. Pese a las distintas soluciones de cada fabricante (Denon con su ALPHA o Yamaha con su Pro-BIT y otros), un recurso común es el "dither". Esto consiste en añadir al flujo de muestras digitales, un ruido digital de bajo nivel de la misma amplitud que el intervalo entre dos bits consecutivos; para conseguir forzar la no aleatoriedad del bit menos significativo, ya que estos bits tienen tendencia a variar de forma aleatoria (ruido microfónico, inexactitudes en los cálculos digitales, redondeo, etc.)  y por tanto sin relación con la señal original. Otro de los métodos utilizados, es como si hiciéramos una ampliación de las variaciones de los 2 o 3 bits menos significativos y los sumáramos a continuación a la muestra real, consiguiendo así enfatizar las más pequeñas variaciones de la señal. De este modo se logra un aparente (subjetivo) aumento de la resolución, con tan solo una ligera perdida de dinámica.

 

La alternativa real y definitiva

Con las sucesivas elaboraciones de estas estrategias para disimular los errores del muestreo, la cuantificación y el jitter, se han conseguido mejoras sorprendentes en la apreciación subjetiva de la calidad del Compact Disc. Aunque a ello también a contribuido la continua mejora de los sistemas de grabación digital profesionales y en particular los que en la actualidad utilizan frecuencias de muestreo ampliadas y resoluciones de 24 bits, o sistemas como el DSD, lo que ha permitido almacenar en el Compact Disc, de forma muy optimizada (minimizando así los efectos de la distorsión digital), la información grabada con estos nuevos medios profesionales. Pero también es evidente, a la vista de lo explicado, que se ha hecho todo lo que cabría hacer y por tanto solo se puede mejorar, (siempre que queramos llegar al sonido absoluto), ampliando las especificaciones, lo que significa evidentemente cambiar de formato.

Con todo esto, queda claro que un sistema capaz de superar estas deficiencias debería disponer de un margen dinámico de 120 dB o más y una banda pasante de 80.000 hertzios o más. Es esperanzador que los nuevos formatos en liza para sustituir al CD cumplen sobradamente estas especificaciones. Falta por ver cual de los dos sistemas (SACD y DVD-A) consigue implantarse. Al respecto es interesante señalar una ligera ventaja del SACD en cuanto a la naturalidad de su sonido, referenciada por algunos expertos internacionales. Tal vez debido a dos factores decisivos en ese aspecto, que denotan la presunta superioridad del DSD (Direct Stream Digital, sistema de codificación del SACD) frente al PCM; primero disponer de unas caracteristicas de distorsión más favorables con relación a la amplitud de la señal, junto a una mayor habilidad para seguir la forma de onda original, o sea mayor resolución temporal (ver la figura de más abajo). Y segundo, la garantía de pureza que supone la ausencia de procesos intermedios en la digitalización y posterior reproducción, como los filtros de decimación y otros, que sí precisa el PCM. Aunque se trata de diferencias mínimas, ya que por contra, el DVD-A compensa el tema de la distorsión con una mayor resolución de amplitud (de 24 bits, mientras que la del SACD equivale a 20 bits). En cualquier caso las políticas de marketing de ambos formatos son diferentes aunque complementarias. Por un lado el SACD apela, gracias a la ligera ventaja que mencionaba antes, a los usuarios más audiofilos y tradicionales (los que prefieren separar el Audio puro del Home-Cinema) y el DVD-A se decanta por una vertiente más “populista” que busca el todo en uno. Afortunadamente ya ha aparecido algún lector  en nuestro mercado, compatible con ambos formatos.


 

 

 


Además, tanto con el DVD-A como con el SACD (aquí se puede incluir también el DTS-Audio) se puede superar por fin y de forma satisfactoria, otro aspecto del audio tradicional que desde que se creó se sabía que solo era un "remiendo", me refiero al estéreo de dos canales. Ello es posible gracias a los sistemas de codificación sin pérdidas como el MLP-Meridian Losless Packaging del DVD-Audio y al Direct Stream Transfer-DST de Sony y Philips para el Super Audio CD. Ya que estos nuevos sistemas abren las puertas al verdadero sonido TOTAL, tridimensional y multicanal.

 

Mención al DTS

 El DTS es un sistema de codificación con una versatilidad asombrosa pues nació con dicha premisa. La “escalabilidad” desde la compresión sin perdidas  del DTS-CD o del DTS-DVD-Audio (comparable a los Meridian Lossless Packaging y el Direct Stream Transfer, del DVD-A y el SACD multicanal) hasta la posibilidad de equipararse incluso al MP3 pasando por el DTS que conocemos en los DVD-Video con todas sus variantes. Esta característica lo hace el sistema ideal para la codificación de video clips y conciertos en DVD, al poder proporcionar una calidad en este menester superior a la del CD aunque inferior a los formatos de alta definición como el Super Audio CD y el DVD-Audio. Ya que para llenar de buena música multicanal un DVD-Video de conciertos o álbum de vídeo clips, se tiene que comprimir más de lo que pueden el MLP y el DST. Según pruebas realizadas este sistema, en 6 canales a 20 bits y 96 Khz. comprimidos con algunas perdidas, es casi indistinguible de un PCM con la misma resolución, sin comprimir. El DTS ofrece esta posibilidad  mucho mejor que el Dolby Digital que funciona con una “escalabilidad” menor y en realidad solo puede llegar, en el mejor de los casos, a aproximarse al sonido del CD, de forma algo superior a lo que ha conseguido el ATRAC de última generación del Minidisc. Imaginemos, por ejemplo, unir música multicanal de la más alta calidad con impresionantes imágenes de los músicos (vídeo clips, conciertos, festivales, recitales, etc. (por supuesto en DTS). El DVD da para mucho, sobre todo si se utilizan sistemas de codificación inteligentes y sin pérdidas (o con las mínimas) como el DTS-CD/DVD, el MLP del DVD-A, el Direct Stream Transfer del SACD y similares, y no despilfarradores y/o ineficientes como el PCM lineal, el Dolby Digital del Home Cinema, el ATRAC del Minidisc, el Mp3 en Internet, etc.

 

Conclusión

En resumen y volviendo a las preguntas del principio de este artículo, podemos responder afirmativamente a la primera y también responder de las demás, diciendo que el aumento previsible de la calidad en las grabaciones de los nuevos formatos, nos dará las respuestas definitivas. Pues resulta obvio que el límite a la calidad esta, cada vez más, en las grabaciones. Y que la calidad que proporcionan estos nuevos formatos, me permite afirmar que superan de forma absoluta cualquier sistema doméstico de reproducción sonora existente o que haya existido, incluyendo (ahora sí) al vinilo.

 

Cualquier consulta o comentario de lo tratado en este artículo preguntar en el foro. Agradecido por el interés prestado, un saludo a todos.

Fernando Moraleda Samsó