El final del CDPor Fernando Moraleda
Ya están aquí los nuevos
formatos de audio digital: el SACD (SuperAudioCD), y el DVD-Audio
(DigitalVersatileDisc-Audio), y se nos plantean las siguientes dudas: ¿Valdrá
la pena cambiar, serán apreciables las mejoras?. ¿ Tan malo es el entrañable
CD?. ¿Es cierto que suena mejor un buen vinilo que el “compacdisc”?.
¿Y si es así, porque?. El sonido digital del CD, es peor que el sonido analógico en ciertos aspectos de una importancia clave para conseguir en la escucha, lo que suele denominarse, naturalidad, calidez, ambiente, resolución en microdetalles, etc. Resumiendo, "musicalidad". Como puede apreciarse, son unos matices muy sujetos a interpretaciones subjetivas, por ello resulta lógico que más de un 90% de usuarios de todo el mundo no perciban la necesidad de cambiar el CD. Pero la mayoría de usuarios no tienen, al parecer, un nivel de exigencia tan elevado como el de muchos aficionados que desde siempre hemos buscado el "sonido absoluto", es decir reproducir la música con la máxima naturalidad y realismo. Aquí hay que poner en evidencia que no es el disco CD lo que esta "mal", si no el "idioma" (formato) en que se "escriben" los datos en el mismo, por lo que bastaría mejorar el "idioma" para aumentar las prestaciones del CD. Si no se ha hecho esto antes (salvo excepciones como el HDCD, XRCD y DTS-CD) es entre otras razones, porque se hubiera roto la "intocable" compatibilidad universal, aceptada por la industria y por el mercado en su día. Los problemas del digital: la cuantificación
Estas
deficiencias del audio digital se han venido llamando error de Muestreo,
que tiene que ver con la respuesta en frecuencia y por tanto con los armónicos
y el timbre de los sonidos. Error de Cuantificación,
relacionado con la resolución y causante de
distorsión. Además del "jitter”
que se refiere a la sincronización de todo el “tinglado”. Empecemos
por el error de cuantificación. En un sistema digital el valor absoluto
de la distorsión es constante con el nivel de la señal, lo que significa
que el porcentaje de la misma es inversamente
proporcional al tamaño (amplitud) de la señal, mientras que en un
sistema analógico el valor absoluto de la distorsión no es constante con
la amplitud, de una forma, que el porcentaje es prácticamente constante
con el tamaño de la señal. Este
es el principal “talón de Aquiles” de cualquier sistema digital.
Debido a esto es por lo que suele afirmarse que ningún sistema de audio
digital sonará jamás mejor que su equivalente
analógico, y por ello que la realidad. De ahí que muchos partidarios del
sonido analógico, cuestionen que el digital sea el camino idóneo para
llegar al sonido absoluto. La
cuestión es similar a lo que ocurre con las imágenes digitalizadas. Si
hacemos zoom sobre ellas, llegaremos muy pronto a percibir el pixelado y
se pierden progresivamente los detalles más pequeños. Mientras que en
imagen analógica, al tener mayor resolución el grano (equivalente a
pixel) se apreciará más tarde al hacer el mismo zoom; pero además, a
medida que aumentamos los pequeños detalles, se conservan casi
inalterados y reconocibles a pesar de cierto emborronamiento debido al
grano. He
aquí otro ejemplo: Imaginemos un cuentakilómetros de coche con sus
lugares reservados para los diferentes dígitos, las unidades, las
decenas, las centenas, los millares etc. Con las unidades en kilómetros,
no tendríamos ni idea de las distancias recorridas de menos de un kilómetro,
por ejemplo de metro en metro, y estos por tanto se pierden
irremisiblemente. Y aquí podemos darnos cuenta de la magnitud del error,
que en audio equivale a la distorsión. Un valor de +/-500 metros, es el
error que tiene un cuentakilómetros con unidades en kilómetros. Al igual
que en digital, este error es constante, o sea es idéntico entre
cualquier valor consecutivo, ya sea entre 0 y 1 Km que entre 99.998 y
99.999 Km por ejemplo. Lo que nos da para una cifra de 5.000 Km, solo el
0,01%, pero para un valor de 5 Km el porcentaje es del ¡10%!. Mientras en
analógico el porcentaje de distorsión sería casi el mismo en ambos
casos. Por tanto cuando la señal es muy pequeña y ocupa unos pocos bits
de los 16, tendremos unos porcentajes de distorsión muy elevados, lo que
provoca, a diferencia del analógico,
que la señal en cuestión sea irreconocible. Para disminuir esta distorsión,
hay que saber que un bit más de resolución, equivale a reducirla a la
mitad. Por tanto trasladando el ejemplo anterior al audio, si aumentamos
la resolución en 4 bits, el valor de error del 10% para 5 (Km) sería 16
veces menor (10:16=0,625%). Lo que significa que aunque no se pueda
eliminar la distorsión, esta se puede mantener a niveles más “analógicos”
aumentando la resolución lo suficiente para que al hacer “zoom” (en
sonido hacer zoom es aumentar el volumen de escucha), pudieran escucharse
de forma reconocible los detalles más pequeños. Lo que nos lleva a
considerar cual es la cuantificación mínima ideal para que esto ocurra,
teniendo en cuenta los límites de percepción humana en cuanto al margen
dinámico. La
principal dificultad para establecer la cuantificación idónea estriba en
que para determinarla intervienen parámetros que no pueden ponderarse a
priori como por ejemplo: criterios del técnico de sonido, márgenes dinámicos
de los instrumentos, y por otro lado, nivel de escucha (“zoom”)
elegido por el usuario, sensibilidad de los altavoces, potencia del
amplificador, y muy importante, ruido ambiente en el lugar de escucha,
entre otros. Sin embargo se han llegado a establecer unos valores mas o
menos aceptados en la industria, de unos 90 a 110 dB de margen dinámico
para el programa y unos 120 dB o más de relación S/R para los sistemas.
Que traducido al audio digital significa 20 bits de resolución como mínimo
frente a los 16 del CD (20 bits nos dan un total de 1.048.575 valores
diferentes, frente a los escasos 65.535 de los 16 bits). Con estos 20 bits
se podría hacer “zoom” conservando reconocibles la mayoría de
microinformaciones. Ya que estarían en el limite de percepción humana.
Lo que situaría a los sistemas digitales, globalmente por encima de
cualquier medio analógico existente a nivel domestico e igualaría,
posiblemente, a los profesionales. Hay
que advertir que las tasas de distorsión tan favorables, que se dan del
CD, en los catálogos y especificaciones de los fabricantes, solo, lo son
en condiciones óptimas de la señal (o sea para señales de nivel alto o
medio). Ya que, para señales débiles y pequeñas variaciones, esta
distorsión es muy desfavorable; pero tengo que reconocer, que tal vez, no
en una magnitud como la que da a entender mi ejemplo. Sobre todo por que
dicha distorsión, en señales tan suaves, no es probablemente tan
apreciable como da a entender su número; lo que no impide que el CD
pierda puntos al compararlo con el analógico. Aún hay más: la forma de las
ondas Pero
el CD también tiene dificultades debidas a una escasa frecuencia de
muestreo. La reconstrucción de la forma de una onda, en la codificación digital del CD, es algo parecido a querer definir gráficamente una circunferencia con solo tres puntos unidos por rectas, el resultado obvio es un triangulo no una circunferencia. Para aproximarse a dicha circunferencia hace falta una cantidad mínima de puntos que podría ser de 8 (octógono), para una reproducción minimamente aceptable.
Naturalmente
esto afecta más a las frecuencias altas, que son las que dan carácter e
identidad a los distintos sonidos e instrumentos. También nos damos
cuenta de la diferencia con el analógico, donde el tiempo no está en
trozos sino que es continuo, y a pesar de una banda pasante limitada en
frecuencia no lo está en el tiempo, de forma que todos los armónicos
altos se reproducen de manera natural. No obstante lo que quiero resaltar
aquí es la enorme diferencia entre esta aproximación ideal y lo que
tenemos realmente en la codificación del formato CD, es decir un
“triangulo”, en vez de la figura “octogonal”. Este gran error en
la forma de onda es mucho más crucial, en la escucha, de lo que se creía.
Como se ha puesto de manifiesto en la experimentación y sobre todo la
comparación con los nuevos formatos de alta definición. Además
de lo explicado hasta ahora, no hay que olvidar un problema que es común
a todos los sistemas de transmisión digital, y que se llama
"jitter", que es una desincronización del flujo de datos
digitales (imaginemos un desfile donde algunos soldados pierden el paso),
esto se soluciona resincronizando la señal por ejemplo utilizando un
buffer (memoria temporal) y relojes de cuarzo ultraprecisos. Es decir los
datos entran en el buffer a un ritmo desajustado y salen a otro mas
preciso. En este tema los fabricantes, han llegado actualmente a
soluciones bastante satisfactorias. Los efectos que causa el “mal”La
acción combinada de estos defectos incluyendo
también el jitter, produce lo que se a dado en llamar, casi de forma
despectiva, “sonido digital”, con los atributos de: frío,
sin alma, metálico, agresivo, áspero, etc. Me
atrevería ha decir, aun a costa de ser subjetivo, que el error de cuantificación
causa la desaparición de los detalles más sutiles de la música (los de
más débil amplitud, y por tanto afectados por la distorsión), que
proporcionan esa sensación de ambiente y alma en la interpretación. Por
otro lado el error de muestreo es el culpable de cierta uniformidad “metálica” de los
timbres altos y posiblemente también de la falta de calidez de las
frecuencias bajas. Y por último los aspectos relacionados con la aspereza
y agresividad tienen, siempre según mi opinión personal, su origen en el
jitter y la acción conjunta de los otros dos. Con esta visión, ya tenemos una idea de cuales son las imperfecciones, ahora habrá que matizar que a pesar de todo hay que reconocer, que una resolución de 16 bits es un buen punto de partida. Recordemos que al principio el estándar propuesto por Philips solo contemplaba una resolución de 14 bits, y que fue la experiencia acumulada en los estudios de grabación con los nuevos sistemas digitales, donde se vio la necesidad de ampliar la resolución a 16. Al grabar, solo en raras ocasiones, usaremos la resolución total de 16 bits ya que durante la mayor parte del tiempo, estaremos usando un promedio de solo 10 bits, o menos. Entenderemos esto, si hemos hecho alguna vez grabaciones en platina de casetes con control manual y nos hemos fijado que las lucecitas o aguja del vúmetro, se mantiene la mayor parte del tiempo en la zona media o baja, y que la zona roja no debe sobrepasarse pues equivale pasando el ejemplo al digital, al rebosamiento de los 16 bits, que produce una distorsión (recorte) de transitorios altos muy perniciosa. En general, esta, se previene por el técnico de grabación, aplicando una cierta compresión de la dinámica de las señales altas, y/o grabando a niveles moderadamente bajos, lo que provoca que huyendo de esta distorsión de alto nivel, caigamos inevitablemente en la de bajo nivel, al aproximar más las señales y cambios pequeños de las mismas al dominio de los bits menos significativos. Son estas distorsiones, las que aconsejaron aumentar la resolución de 14 a16 bits. Y hoy día, no ya a 18 bits, ni siquiera a 20, si no a 24 bits, porque de esta manera se tiene el margen suficiente tanto en alto como en bajo nivel, para grabar las señales con una resolución media elevada y responder con holgura y por tanto con naturalidad a los transitorios de alta energía. Los "remiendos" Ahora
vamos ha ver lo que se ha hecho para intentar poner remedio a todo esto,
sin tener que cambiar el formato CD. Primero
nos fijaremos en el error de muestreo. Una solución básica para paliar
los efectos perniciosos del citado error es, interpolar,
que consiste en que durante la reproducción, el filtro digital realiza cálculos
para intercalar entre dos muestras reales, varias ficticias, de un valor
similar, forzando con ello un sobremuestreo que ayuda a
"redondear" el contorno que gráficamente tendrían las señales
(recordando el ejemplo anterior del triangulo y del octógono, sería lo
mismo que añadir mas puntos promediando dos consecutivos). Una elaboración
mejor de lo anterior, es la interpolación adaptativa, que utiliza un
algoritmo que analiza porciones de la señal y de acuerdo con el contenido
frecuencial de esta, genera unos valores de interpolación que
corresponden, de esta forma, a armónicos relacionados con la señal
grabada (que no la real). Las diferentes posibilidades de hacer esto, dan
lugar a las distintas soluciones de cada fabricante, desde los filtros
digitales convencionales a los de carácter adaptativo, siendo este último
el caso de fabricantes como Krell, Wadia, el Legato Link de Pioneer y
otros. Y
ahora la resolución. En este caso para disimular, que no resolver, el
error de cuantificación, se recurre a un aumento de la resolución matemática
de las muestras, para su tratamiento y conversión, (con objeto de evitar
los errores de redondeo en el calculo y que no es lo mismo que la resolución
real) haciendo hincapié en la máxima precisión. Se tiende a preservar
hasta el extremo la integridad de los bits menos significativos (LSB: Low
Significant Bit), es decir de los que definen las pequeñas variaciones de
la señal y las señales más débiles. Pese a las distintas soluciones de
cada fabricante (Denon con su ALPHA o Yamaha con su Pro-BIT y otros), un
recurso común es el "dither". Esto consiste en añadir al flujo de muestras
digitales, un ruido digital de bajo nivel de la misma amplitud que el
intervalo entre dos bits consecutivos; para conseguir forzar la no
aleatoriedad del bit menos significativo, ya que estos bits tienen
tendencia a variar de forma aleatoria (ruido microfónico, inexactitudes
en los cálculos digitales, redondeo, etc.)
y por tanto sin relación con la señal original. Otro de los métodos
utilizados, es como si hiciéramos una ampliación de las variaciones de
los 2 o 3 bits menos significativos y los sumáramos a continuación a la
muestra real, consiguiendo así enfatizar las más pequeñas variaciones
de la señal. De este modo se logra un aparente (subjetivo) aumento de la
resolución, con tan solo una ligera perdida de dinámica. La alternativa real y definitivaCon
las sucesivas elaboraciones de estas estrategias para disimular los
errores del muestreo, la cuantificación y el jitter, se han conseguido
mejoras sorprendentes en la apreciación subjetiva de la calidad del
Compact Disc. Aunque a ello también a contribuido la continua mejora de
los sistemas de grabación digital profesionales y en particular los que
en la actualidad utilizan frecuencias de muestreo ampliadas y resoluciones
de 24 bits, o sistemas como el DSD, lo que ha permitido almacenar en el
Compact Disc, de forma muy optimizada (minimizando así los efectos de la
distorsión digital), la información grabada con estos nuevos medios
profesionales. Pero también es evidente, a la vista de lo explicado, que
se ha hecho todo lo que cabría hacer y por tanto solo se puede mejorar,
(siempre que queramos llegar al sonido absoluto), ampliando las
especificaciones, lo que significa evidentemente cambiar de formato. Con
todo esto, queda claro que un sistema capaz de superar estas deficiencias
debería disponer de un margen dinámico de 120
dB o más y una banda pasante de 80.000
hertzios o más. Es esperanzador que los nuevos formatos en liza para
sustituir al CD cumplen sobradamente estas especificaciones. Falta por ver
cual de los dos sistemas (SACD y DVD-A) consigue implantarse. Al respecto
es interesante señalar una ligera ventaja del SACD en cuanto a la
naturalidad de su sonido, referenciada por algunos expertos
internacionales. Tal vez debido a dos factores decisivos en ese aspecto,
que denotan la presunta superioridad del DSD (Direct Stream Digital,
sistema de codificación del SACD) frente al PCM; primero disponer de unas
caracteristicas de distorsión más favorables con relación a la amplitud
de la señal, junto a una mayor habilidad para seguir la forma de onda
original, o sea mayor resolución temporal (ver la figura de más abajo).
Y segundo, la garantía de pureza que supone la ausencia de procesos
intermedios en la digitalización y posterior reproducción, como los
filtros de decimación y otros, que sí precisa el PCM. Aunque se trata de
diferencias mínimas, ya que por contra, el DVD-A compensa el tema de la
distorsión con una mayor resolución de amplitud (de 24 bits, mientras
que la del SACD equivale a 20 bits). En cualquier caso las políticas de
marketing de ambos formatos son diferentes aunque complementarias. Por un
lado el SACD apela, gracias a la ligera ventaja que mencionaba antes, a
los usuarios más audiofilos y tradicionales (los que prefieren separar el
Audio puro del Home-Cinema) y el DVD-A se decanta por una vertiente más
“populista” que busca el todo en uno. Afortunadamente ya ha aparecido
algún lector en nuestro
mercado, compatible con ambos formatos.
Además,
tanto con el DVD-A como con el SACD (aquí se puede incluir también el
DTS-Audio) se puede superar por fin y de forma satisfactoria, otro aspecto
del audio tradicional que desde que se creó se sabía que solo era un
"remiendo", me refiero al estéreo de dos canales. Ello es
posible gracias a los sistemas de codificación sin pérdidas como el
MLP-Meridian Losless Packaging del DVD-Audio y al Direct Stream
Transfer-DST de Sony y Philips para el Super Audio CD. Ya que estos nuevos
sistemas abren las puertas al verdadero sonido TOTAL,
tridimensional y multicanal. Mención al DTS El
DTS es un sistema de codificación con una versatilidad asombrosa pues
nació con dicha premisa. La “escalabilidad” desde la compresión sin
perdidas del DTS-CD o del
DTS-DVD-Audio (comparable a los Meridian Lossless Packaging y el Direct
Stream Transfer, del DVD-A y el SACD multicanal) hasta la posibilidad de
equipararse incluso al MP3 pasando por el DTS que conocemos en los
DVD-Video con todas sus variantes. Esta característica lo hace el sistema
ideal para la codificación de video clips y conciertos en DVD, al poder
proporcionar una calidad en este menester superior a la del CD aunque
inferior a los formatos de alta definición como el Super Audio CD y el
DVD-Audio. Ya que para llenar de buena música multicanal un DVD-Video de
conciertos o álbum de vídeo clips, se tiene que comprimir más de lo que
pueden el MLP y el DST. Según pruebas realizadas este sistema, en 6
canales a 20 bits y 96 Khz. comprimidos con algunas perdidas, es casi
indistinguible de un PCM con la misma resolución, sin comprimir. El DTS
ofrece esta posibilidad mucho
mejor que el Dolby Digital que funciona con una “escalabilidad” menor
y en realidad solo puede llegar, en el mejor de los casos, a aproximarse
al sonido del CD, de forma algo superior a lo que ha conseguido el ATRAC
de última generación del Minidisc. Imaginemos, por ejemplo, unir música
multicanal de la más alta calidad con impresionantes imágenes de los músicos
(vídeo clips, conciertos, festivales, recitales, etc. (por supuesto en
DTS). El DVD da para mucho, sobre todo si se utilizan sistemas de
codificación inteligentes y sin pérdidas (o con las mínimas) como el
DTS-CD/DVD, el MLP del DVD-A, el Direct Stream Transfer del SACD y
similares, y no despilfarradores y/o ineficientes como el PCM lineal, el
Dolby Digital del Home Cinema, el ATRAC del Minidisc, el Mp3 en Internet,
etc. ConclusiónEn
resumen y volviendo a las preguntas del principio de este artículo,
podemos responder afirmativamente a la primera y también responder de las
demás, diciendo que el aumento previsible de la calidad en las
grabaciones de los nuevos formatos, nos dará las respuestas definitivas.
Pues resulta obvio que el límite a la calidad esta, cada vez más, en las
grabaciones. Y que la calidad que proporcionan estos nuevos formatos, me
permite afirmar que superan de
forma absoluta cualquier sistema doméstico de reproducción sonora
existente o que haya existido, incluyendo (ahora sí) al vinilo. Cualquier
consulta o comentario de lo tratado en este artículo preguntar en el
foro. Agradecido por el interés prestado, un saludo a todos. Fernando
Moraleda Samsó |
|||||