Cómo utilizar inteligentemente la energía disponible en audio y RF en equipos de comunicaciones
(2014-04-26 - Ultima actualización  2014-05-05)

Por Miguel R. Ghezzi - LU6ETJ

En la literatura profesional y académica (y la mayoría de la seria escrita para aficionados) leeremos que la gama de frecuencias de audio que es capaz de transportar mejor la inteligencia se sitúa alrededor de los 300 a 2700 Hz pero... ¿cómo se arribó a este valor? ¿cuáles son las ventajas y desventajas de ampliarlos hacia arriba o hacia abajo? ¿hay realmente información útil fuera de este rango?

Conviene tener presente que apenas unas décadas atrás las comunicaciones telefónicas y radiotelefónicas eran el equivalente a la Internet de hoy: columna vertebral de los negocios. la guerra y la cultura del siglo XX. Se invirtió muchísimo dinero, esfuerzo, investigación científica y técnica para extraer toda la eficacia posible de esos sistemas de comunicaciones. Para conseguirla se realizaron exhaustivas experiencias, mediciones y comprobaciones para conocer acabadamente las variables involucradas incluyendo desde luego las introducidas por nuestro aparato fisio-sico-neurológico de percepción y producción de sonidos.

Quizás un día el lector se tiente a trasmitir o recibir fonía con amplios anchos de banda de audio; en tal caso, mejor que optar entre variadas opiniones -la mayoría de las veces subjetivas y acientíficas- que se escuchan a menudo en el éter, le será contar con algunos datos y experiencias que le den cierta posibilidad de formarse un juicio educado para decidir sus acciones.

Por ejemplo: ¿sabía el lector que las notas más altas que en fundamental puede producir una soprano rondan los 1300 Hz y las de un tenor los 525 Hz (Do de pecho o sobreagudo)? (aunque los sobretonos responsables del timbre puedan alcanzar frecuencias más altas).
Pruebas intensivas en laboratorio y campo permitieron descubrir que no es necesario trasmitir todas las frecuencias presentes en la música y la voz.

Un estudio realizado1 da cuenta de resultados interesantes: Los sujetos de prueba fueron radioescuchas de broadcasting promedio; ellos marcaron sus preferencias cuando se les pidió juzgar material de programa empleando bandas de audio, angosta (120 a 4000 Hz), media (60 a 6000 Hz) y ancha (30 a 10000 Hz). El material no era únicamente vocal como nuestras trasmisiones radiotelefónicas sino general, incluyendo música. Las conclusiones fueron:

  1. Los oyentes prefirieron el rango angosto a medio más que el ancho.
  2. La mayoría continuó prefiriendo ese rango aún cuando fueron informados que la condición que preferían era de relativamente baja fidelidad y que la de rango amplio era de alta fidelidad.

Aunque el tono particular de las vocales varía de un individuo a otro normalmente alcanza por el lado inferior los 85 Hz para una voz de varón profunda hasta unos 300 Hz  por el lado superior para una voz chillona femenina (algunos cantantes llegan a producir sonidos de baja frecuencia del orden de los 60 Hz), esto es importante porque las notas principales y con más energía media de la voz son justamente las vocales y produciría la impresión -para lo que veremos en el siguiente punto del trabajo- que esas frecuencias bajas son necesarias; sin embargo no lo son pues su contenido armónico permite producir la impresiòn de presencia de ellas pues nuestro sistema perceptivo reconstruye la fundamental a partir de esas armónicas aunque estén ausentes (el mismo fenómeno que nos permite percibir sonidos de baja frecuencia que los parlantes pequeños comunes no reproducen con energía suficiente).

Las semivocales y consonantes están por debajo de 3 kHz mientras que las sibilantes, fricativas y explosivas se sitúan por encima de los 2 kHz, esto nos indica que la totalidad de lo sonidos en fundamental producidos por nuestro sistema vocal y que no suenan como chasquidos o sibilantes está por debajo de 3 kHz, eso es fácil de advertir con las salpicaduras laterales de emisiones que trasmiten o inclusive realzan esas altas frecuencias pues con cualquier receptor suficientemente selectivo puede observarse claramente que básicamente se escuchan como chasquidos similares al sonido producido por un falso contacto y hay poco o nada de las las armónicas que supuestamente determinarían la "calidad" del timbre vocal. Esto significa que los esfuerzos para ampliar la respuesta de audio por encima de esa frecuencia se traducirán fundamentalmente como ruidos en las frecuencias adyacentes.
Esto puede verificarse fácilmente con un receptor con una respuesta de su filtro suficientemente empinada como para sintonizarlo de manera que deje pasar únicamente frecuencias que estén situadas por encima de 3 o 4 kHz de la portadora (presente o ausente) de la estación que trasmite "hi fi", o dicho de otro modo: sintonizar por ejemplo con un equipo de BLU en BLI correctamente (zero beat) una señal y luego correrlo hacia arriba exactamente la cantidad de kHz a partir de la cual queremos verificar el contenido de altas frecuencias de la señal.

Pruebas de articulación e inteligibilidad2

Las pruebas de articulación son más exigentes que las de inteligibilidad. Para hacerlas se generan sonidos vocales que no conllevan inteligencia pero que deben reconocerse en el receptor mientras que las de inteligibilidad miden la perfección de la recepción de sonidos que trasmiten ideas. Aunque estos test dependen de la intensidad del sonido, se verifica que estas variables no dependen demasiado de la intensidad, tolerándose amplias variaciones en ella (del orden de los 60 dB respecto del nivel de referencia del estudio) sin afectar significativamente la articulación.

La relación entre la articulación y las gama de frecuencias trasmitidas es mucho más estrecha. Para comprobarlo se emplearon filtros pasabajos y pasaaltos de manera de limitar los rangos trasmitidos y establecer su capacidad para producir una buena articulación. Como resultado puede verse en la gráfica que si solo se permite el paso de las frecuencias que están por encima de 1000 Hz la articulación es de alrededor del 86% (bastante buena) mientras que la energía necesaria para producirla es solamente un 17% del total, esto significa que aún con poca energía esa zona es capaz de producir una articulación aceptable, por el contrario si solo se deja paso a frecuencias debajo de los 1000 Hz se empleará el 83% de la energía disponible, pero la articulación será de solamente 42; con esto se ve que las altas frecuencias contribuyen más a la inteligibilidad demandando poca energía mientras que las bajas lo hacen notablemente menos demandando la mayoría de la energía disponible.


Estas pruebas llevaron a que en telefonía comercial se empleara una banda de aproximadamente 250 a 2750 Hz que es la típica de nuestros buenos equipos de comunicaciones en fonía (modernamente estos límites se ampliaron en la telefonìa corriente hasta un rango de unos 200 a 3500 Hz para proveer algo más de inteligibilidad y un sonido vocal natural).

Las normas actuales para broadcasting en amplitud modulada en ondas medias permiten un ancho de banda máximo del orden de 18 a 20 kHz totales (incluyendo ambas bandas laterales), limitando la respuesta de audio a no más de 9 a 10 kHz. Debe notarse que ese ancho de banda se emplea para proveer buena fidelidad a una programación con contenido musical. La buena práctica de radioaficionados de fonía aconseja lo que en nomenclatura moderna se indica como 8K00A3E, es decir que el ancho de banda en RF total de la emisión sea 8 kHz, incluyendo ambas bandas laterales, debiendo reducirse a 6 kHz o menos cuando la banda se encuentra muy ocupada. Para emisiones de broadcasting de onda corta, la recomendación  ITU-R BS 640-3 para las emisoras de broadcasting en BLU previstas a partir de 2015 establece un ancho de banda de audio máximo de 4,5 kHz, que en modo A3E (amplitud modulada) implicaría un ancho de banda máximo ocupado por ambas bandas laterales, de 9 kHz.
 
Habilitar nuestro emisor para la trasmisión de frecuencias bajas de audio o peor aún, aumentar su amplitud relativa artificialmente demandará del trasmisor la mayoría de la potencia de modulaciòn que no se traducirá en significativa mejora en la naturalidad o fidelidad (menos aún en alcance o inteligibilidad)) y a menudo dará lugar a inconvenientes cos vibraciones provenientes de automóviles, motocicletas, zumbidos, etc.
Esta potencia innecesaria en bajas frecuencias se restará de la disponible para trasmitir frecuencias más útiles porque sumadas vectorialmente a ellas se determinan los picos de tensión capaces de sobremodular la estación. Una prueba ad hoc para estimar aproximadamente la eficacia de un trasmisor de comunicaciones de AM (A3E) en tal sentido consiste en sintonizar la estación con un receptor de BLU (su menor ancho de banda no importa pues estaremos analizando el espectro de audio de baja frecuencia) y desplazar un poco la sintonía para comparar a oído el nivel de audio detectado con el del tono heterodino, si es comparable y más o menos comprensible debido a su intensidad la trasmisión es bastante eficiente, si en cambio es difícil de oír puede deberse a dos cosas: insuficiente nivel de modulación general (< 100%) o insuficiente energía en las frecuencias más útiles para la trasmisión de inteligencia.  

A veces a las respuestas de los trasmisores obtenidas mediante refuerzos de graves y agudos se la pretende asociar con un sonido de "calidad", pero el término calidad implica un juicio valor por lo que conviene preguntarse cuál es el valor de emitir sonidos cosméticos que no trasmiten inteligencia y tampoco dan lugar a fidelidad o naturalidad de la modulación o que, por el contrario, frecuentemente hacen la trasmisión ininteligible en presencia de estáticos e interferencias, aún con señales consideradas convencionalmente "fuertes" (además de perturbar el espectro que están usando o podrían usar aficionados en frecuencias adyacentes).

Una forma visual de evaluar en este aspecto las emisiones es emplear algún receptor SDR remoto en la Web (disponibles vía www.websdr.com) o bien uno propio con un programa capaz de mostrar el espectro, preferiblemente en el modo cascada; con estas poderosas herramientas podrá verificar fácilmente lo apuntado al tiempo que resultará más evidente la distribución de energía en el espectro de audio y su efecto en la inteligibilidad en las estaciones visualizadas.
Estos receptores suelen tener capacidad para variar el ancho de su banda pasante y así puede verificarse la conveniencia o no de emitir ciertas frecuencias sintonizando estaciones con anchos de banda excesivos; también observar los efectos innecesariamente perturbadores de las frecuencias por encima de las que otorgan naturalidad a vocales y consonantes. Puede observarse el efecto en la inteligibilidad de la existencia de energía suficiente o insuficiente en frecuencias superiores a aproximadamente 800 Hz (pero inferiores a los 2 o 3 kHz) y verificar que la noción de "agudos" propia de la reproducción musical no se aplica adecuadamente a la telefonía por lo que los controles de tono comunes diseñados para uso en equipos musicales casi no actúan sobre las frecuencias "agudas" vocales.
Estos receptores ayudan también a evaluar los efectos en el espectro debidos a distorsión en amplificadores lineales de BLU sobrecargados ya sea por desajuste casual o intencional del control automático de nivel (ALC) o sobreexcitación de un amplificador lineal externo de alta potencia (con algunos hay que tomar ciertos recaudos en la interpretación del sonido debidos a un fenómeno conocido como aliasing que puede producirse en su respuesta de audio). Una clave importante de la clara superioridad en cuanto alcance e inteligibilidad de los equipos de BLU estándar respecto de los construidos artesanalmente con ciertos criterios de "alta fidelidad" la da la simple comparación de la distribución de energía visible en la cascada en unos y otros.

Prácticamente todos los prejuicios acerca de la exagerada inferioridad de los trasmisores de AM  de doble banda lateral con portadora completa (la AM común) respecto de los de BLU con portadora suprimida derivan de una ineficaz respuesta de audio de los primeros.

Ruido

De lo anterior se deduce que para trasmitir voz no solamente no es necesario gran ancho de banda sino que cuando pensamos en una trasmisión con "calidad broadcasting" no debemos perder de vista que las emisoras de broadcasting de AM emiten música por lo que emplear anchos de banda en trasmisión o recepción mayores que los imprescindibles para voz (que contiene un menor rango de frecuencias que la música) no produce casi beneficio a la inteligibilidad y agrega poco a la naturalidad vocal.
En la discusión precedente no se mencionó la relación señal-ruido pues fueron estudios para determinar cuáles son las frecuencias donde la energía de audio es más útil para trasmitir el material de programa de una manera eficaz, sin embargo con equipos de comunicaciones aparece de dramáticamente el problema del ruido pues raramente comunicamos con relaciones señal-ruido equivalentes a las del área de servicio de una emisora de onda media.

La emisión de señales de AM con exceso de ancho de banda presume que del lado del receptor se emplea uno equivalente (de lo contrario no tendría sentido promoverlo o utilizarlo), pero mientras el nivel de ruido recibido en el receptor es estadísticamente uniforme a lo largo de su banda pasante no sucede lo mismo con la energía vocal útil que es muy pequeña en las frecuencias altas, así, al aumentar el ancho de banda de recepción abrimos una gran ventana que para dejar pasar pequeñísimas cantidades de energía de audio de poca o ninguna utilidad se facilita el ingreso de gran cantidad de energía de ruido constante.
En estas condiciones, para soslayar el significativo deterioro en la relación señal ruido será necesario un importante aumento en la potencia de portadora del emisor si es de telefonía en AM con portadora completa (A3E) o el equivalente en bandas laterales para conseguir silenciar el receptor lo suficiente.
Los realces artificiales en la curva de respuesta del modulador, no solamente promueven un desperdicio potencia innecesario, sino que presumen ¡que el oyente no cuenta con controles de tono para elegir su respuesta preferidos..! controles comunes que darían lugar el mismo resultado estètico si fueran deseados por el interlocutor.

Con programas de procesamiento de audio disponibles gratuitamente (por ejemplo DSP Filter de Makoto Mori -JE3HHT) se pueden ensayar filtros de audio que permitirán reproducir algunas de las experiencias citadas en la referencia 1; por ejemplo, puede programar un filtro pasaaltos y oír qué se oye en la banda de frecuencias situada por encima de los 2 o 3 kHz en una trasmisión de fonía de exagerado ancho de banda... (si lo hace, en la pantalla "Filter Designs-User-x" tilde la opción "NONE" en el cuadro "Oversampling" para que el programa admita frecuencias mayores que 3 kHz). Otro programa más simple de utilizar es VA3AGM DSP filter de Mircea Popa.

"Dudosos consejos..."

Quizás haya notado recorriendo la Web que quienes en diferentes latitudes impulsan grandes anchos de banda suelen emplear estaciones con potencias más o menos elevadas, ello es natural pues sin recurrir a ellas la relación señal-ruido en el receptor de gran ancho de banda que acompaña a esa práctica es pobre. Lógicamente quien la disponga promoverá más fácilmente las "virtudes" de esas respuestas de audio que a veces hacen lucir voces aterciopeladas y profundas (aunque más a menudo modulaciones empastadas y carentes de energía en las zonas del espectro que ofrecen claridad y nitidez), si no nos percatamos de esto y lo intentamos con un modesto equipo pronto descubriremos que mientras el potente equipo puede lucir su "presencia" en el éter a nosotros nos escucharán razonablemente bien únicamente nuestros vecinos radialmente muy próximos...

Referencias en el texto:

1. Chinn, H. A. - Pinsenberg, P. Tonal-Range and sound intensity Preferences of Broadcast Listeners. Proceedings del IRE, Setiembre 1945, Vol 33, N° 9.

2. Castner T. G. - Carter, C. W. Development in the application of Articulation Testing. Bell Systems Technical Journal, Julio 1933 Vol. 12.

Literatura consultada:

Albert, A. L. Electrical Communications. 3rd Ed. (1954). John Willey & Sons Inc. (principal)

Pender H. - McIlwain, K. Electrical engineers Handbook, 3rd Ed Rewritten => "Effects on articulation of removing portions of speech frequency range". Wiley Engineering Systems .

Baranek, Leo L.. Acustica. Ed. H.A.S.A. 1961.

Terman Frederick E. Electronic and Radio Engineering. 4th Ed. McGraw-Hill Book Co. Inc.