EXPLORACIÓN CLÍNICA DE LA VOZ

A lo largo de la última década, la preocupación por los problemas de la voz ha pasado de considerarse una atención médica extraordinaria, dirigida a unos cuantos profesionales de la voz o cantantes de elite, a formar parte del concepto de salud en su sentido más amplio, al alcance de todos (Papsin, 1996). Atrás quedó el tiempo en que la patología de la voz se consideraba una consecuencia inevitable de una grave enfermedad de base, que era la importante, o de su consideración como un problema otorrinolaringológico de carácter menor al que un individuo debía, en la mayor parte de los casos, acostumbrarse. Los trastornos de la voz cobran su máxima importancia cuando el propio individuo los concibe como la alteración de un parámetro vital que le causa sufrimiento o incapacidad de adaptarse al medio (social o laboral).

Hasta hace relativamente poco tiempo, la valoración objetiva y exacta de la voz era inexistente. Históricamente, la voz ha sido medida de una forma subjetiva; el juicio era hecho íntegramente por la percepción de expertos mediante la llamada valoración psicoacústica de la voz. Este tipo de análisis, a pesar de su frecuente uso aún hoy, presenta el inconveniente de la subjetividad con la que el oyente juzga la voz, llevando a discrepancias intra e interjuicios (LaBlance, Steckol y Cooper, 1996).

Actualmente, la aparición de nuevas posibilidades técnicas en el análisis anatómico-funcional de las cuerdas vocales (la laringoestroboscopia, el análisis acústico-vocal y, sobre todo, el análisis espectrográfico) permiten al profesional contar con herramientas muy útiles para ayudar a su “oído clínico” a precisar mejor sus juicios diagnósticos y a sistematizar más adecuadamente la rehabilitación.

La integración de los diferentes niveles de análisis y profesionales en el proceso de evaluación de la voz resulta de enorme interés e importancia de cara a conseguir una mayor finura y precisión en el diagnóstico. De esta manera se logra la objetivación de la alteración fonatoria (aislar las variables más determinantes que se pueden considerar a la hora de anticipar los efectos de una disfonía funcional), con el fin de poder analizar los resultados post-tratamiento, realizar comparaciones inter-institucionales o entre diferentes servicios clínicos y solucionar conflictos médicos-legales, cada vez más frecuentes.

Para la elaboración de un protocolo básico de exploración clínica de la voz la Sociedad Europea de Laringología nos dicta unas sugerencias:

  •  la función vocal es multidimensional.
  • para la presentación-publicación de resultados de tratamiento de trastornos de la voz es necesario unas exploraciones básicas o mínimas en el objeto de poder realizar comparaciones y posibles meta-análisis.
  • aunque continuamente están apareciendo nuevos procedimientos diagnósticos, un set básico de exploraciones se tiene que realizar en todos los casos.
  • este protocolo básico debe ser utilizado para el estudio de las disfonías más comunes, pero existe un pequeño grupo de patologías específicas que requerirá su propio protocolo como la disfonía espasmódica o las voces de sustitución (no generada por las cuerdas vocales).

El protocolo que nosotros aconsejamos de Exploración Clínica de la Voz  contiene estas exploraciones o estudios (ver Anexo al final del capítulo):

  1. Valoración subjetiva por el propio paciente
  2. Exploración perceptual de la voz
  3. Exploración videolaringoestroboscópica
  4. Exploración aerodinámica
  5. Análisis acústico
  6. Análisis espectrográfico

Veamos en que consiste cada uno de ellos.

1.- Valoración subjetiva del propio paciente:

Esta evaluación de la voz, aunque subjetiva por definición, tiene una gran importancia en la práctica clínica, ya que es el paciente quien tiene que vivir con su voz.

La calidad de vida de los pacientes es un importante factor que se debe cuantificar en  muchas áreas de la medicina, por lo que se está prestando atención a desarrollar herramientas válidas (cuestionarios) para medir el impacto de la enfermedad que el paciente percibe. Este tipo de cuestionarios se está extendiendo a todos los ámbitos de la medicina en respuesta a la importancia de valorar todos los aspectos emocionales o de calidad de vida del paciente, dentro de una perspectiva holística de la persona.

El índice de incapacidad vocal o Voice Handicap Index (VHI) es un cuestionario desarrollado por Jacobson y cols. (1997) con el fin de cuantificar el impacto percibido por un sujeto afectado por un trastorno vocal en los ámbitos de la propia función vocal, en la capacidad física relacionada con ella y en las emociones que provoca la disfonía. En realidad existen distintos cuestionarios para estudiar la calidad de vida de los pacientes disfónicos, tales como el Voice Performarce Questionnaire, el Voice-Related Qquality of Life, el Voice Participation Profile y la Voice Symptom Scale, pero se ha concluido que  el VHI es el cuestionario más versátil y fácil de completar por el paciente y el que contiene la información más relevante acerca de la calidad de vida relacionada con la voz.

El VHI contiene 30 ítems organizados en tres grupos de 10, denominados subescala física, subescala emocional y subescala funcional. Cada pregunta el paciente la responde con una puntuación de 0 a 4, siendo 0= nunca, 1= casi nunca, 2= algunas veces, 3= casi siempre y 4= siempre; siendo, por la tanto, el valor máximo del VHI 120 puntos. Se puede usar también una versión corta al demostrarse que con 10 ítems seleccionados de los 30 originales se tenía la misma potencia y fiabilidad.

El VHI ha sido adaptado a la lengua de muchos países como instrumento válido para la valoración del menoscabo vocal. En España el VHI ha sido traducido por la Comisión de Foniatría de la Sociedad Española de Otorrinolaringología (SEORL) y posteriormente validado.

La versión en español del VHI-30 sería la siguiente:

Parte I-F (funcional)

F1. La gente me oye con dificultad debido a mi voz

F2. La gente no me entiende en sitios ruidosos.

F3. Mi familia no me oye si la llamo desde el otro lado de la casa.

F4. Uso el teléfono menos de lo que desearía.

F5. Tiendo a evitar las tertulias debido a mi voz.

F6. Hablo menos con mis amigos, vecinos y familiares.

F7. La gente me pide que repita lo que les digo.

F8. Mis problemas con la voz alteran mi vida personal y social.

F9. Me siento desplazado de las conversaciones por mi voz.

F10. Mi problema con la voz afecta al rendimiento laboral.

– Parte II-P (física)

P1. Noto perder aire cuando hablo.

P2. Mi voz suena distinto a lo largo del día.

P3. La gente me pregunta: ¿qué te pasa con la voz?

P4. Mi voz suena quebrada y seca.

P5. Siento que necesito tensar la garganta para producir la voz.

P6. La calidad de mi voz es impredecible.

P7. Trato de cambiar mi voz para que suene diferente.

P8. Me esfuerzo mucho para hablar.

P9. Mi voz empeora por la tarde.

P10. Mi voz se altera en mitad de una frase.

Parte III-E (emocional)

E1. Estoy tenso en las conversaciones por mi voz.

E2. La gente parece irritada por mi voz.

E3. Creo que la gente no comprende mi problema con la voz.

E4. Mi voz me molesta

E5. Progreso menos debido a mi voz.

E6. Mi voz me hace sentir cierta minusvalía.

E7. Me siento contrariado cuando me piden que repita lo dicho.

E8. Me siento avergonzado cuando me piden que repita lo dicho.

E9. Mi voz me hace sentir incompetente.

E10. Estoy avergonzado de mi problema.

 

El VHI abreviado (VHI-10) sería este:

F1. La gente me oye con dificultad debido a mi voz.

F2. La gente no me entiende en sitios ruidosos.

F8. Mis problemas con la voz alteran mi vida personal y social.

F9. Me siento desplazado de las conversaciones por mi voz

F10. Mi problema con la voz afecta al rendimiento laboral.

P5. Siento que necesito tensar la garganta para producir la voz.

P6. La calidad de mi voz es impredecible.

E4. Mi voz me molesta.

E6. Mi voz me hace sentir cierta minusvalía

P3. La gente me pregunta: ¿qué te pasa con la voz?

Es de destacar que existen trabajos en los que no se ha encontrado relación del VHI con los parámetros analizados habitualmente en el estudio de la disfonía, de lo que se deduce que las sensaciones de un paciente acerca  de su problema vocal no puedes ser evaluadas mediante medidas  objetivas. Este hecho se observa de forma frecuente en las consulta de voz en pacientes que no valoran un tratamiento ya realizado como particularmente efectivo a pesar de que pueda presentar unos excelentes resultados posterapeúticos en las medidas objetivas.

Aunque nosotros preferimos el VHI como instrumento para la valoración objetiva de propio paciente, la Sociedad Europea de Laringología propone una evaluación mínima subjetiva mediante una doble escala visual analógica de 100mm: por un lado la impresión de la calidad de la voz en sentido estricto (escala Vo) y por otro lado, la repercusión que el problema vocal tiene en su entorno social y profesional (escala Dis). Un resultado de = indicaría una voz normal y uno de 100, de alteración extrema de la función vocal.

2.- Exploración perceptual de la voz:

La Valoración Perceptual de la voz, también llamada Psicoacústica consiste en la apreciación subjetiva  de las características de la voz del sujeto en función de la experiencia previa y de los conocimientos del examinador. Comienza desde el mismo momento en que el paciente entra en el consultorio y el clínico inicia la entrevista.

Es difícil decir si una voz es normal y, más difícil todavía, indicar cómo debería ser una voz en una persona determinada para considerarla normal.

Diríamos entonces que existe una alteración de la voz cuando ésta difiere de las voces de otras personas del mismo sexo y similar edad y grupo cultural en el timbre, tono, volumen y flexibilidad en la dicción. Por tanto, a modo de conclusión, podríamos decir que el concepto de voz normal, en sentido estricto, no existe.

Desde el punto de vista clínico-práctico las características perceptuales de una voz disfónica se pueden describir utilizando diversos sistemas de análisis: el perfil vocal de Wilson, el Perfil Vocal de Buffalo, la Escala por rangos de Boone; pero, sin duda, el más extendido de todos en nuestro país (y el que hemos utilizado en nuestro protocolo) es el sistema GRABS (propuesto por Hirano en 1981), acrónimo inglés de las palabras:

–     G, grade (grado)

–         R, rough (también en inglés hoarse, ronca, áspera)

–         A, astenic (asténica, fatigada, cansada)

–         B, breathy (aérea, espirante, soplada)

–         S, strain (también en inglés harsh, tensa, constreñida)

Cada uno de los apartados se valora en una escala de 4 puntos, donde 0 sería normal, 1 ligero, 2 moderado y 3 severo o extremo. Los parámetros B y R son los más fiables en la clínica diaria y se relacionan con lesiones orgánicas; los factores A y S son menos fiables y se relacionan con trastornos funcionales. Debido a esto existe una escala simplificada, muy usada en los países germano-hablantes, que se conoce como RBH ( RauhigKeit por ronca o áspera, Behauchtheit por aérea y Heiserkeit por disfonía).

3.- Exploración videolaringoestroboscópica:

Actualmente se considera la principal herramienta clínica para diagnosticar el origen de los trastornos de la voz. La estroboscopia es un método de exploración que produce una ilusión óptica por la que un objeto que se mueve con rapidez y periódicamente aparece inmóvil o moviéndose lentamente.

Aunque es un método conocido desde hace muchos años, el creciente interés por la patología vocal y los avances de la técnica han hecho que sea considerado el procedimiento más útil de los que disponemos para el diagnóstico de los trastornos de la voz, al permitirnos observar con gran precisión y detalle las alteraciones de la ondulación de la mucosa y la situación del borde libre de la cuerda vocal. Los principios fisiológicos en los que se basa la obtención de imágenes estroboscópicas son las características perceptivas del sistema óptico. El sistema visual humano presenta una limitación temporal  ya que retiene una imagen en su retina durante 0.2 segundos, lo que se denomina persistencia de la visión e impide ver más de cinco imágenes por segundo. Las imágenes secuenciales que se producen a intervalos menores de 0.2 segundos persisten en la retina y se fusionan con las imágenes sucesivas para producir la ilusión óptica de movimiento aparente. Este fenómeno se denomina Ley de Talbot, que también explica el hecho de que veamos un movimiento continuo cuando se nos presentan una serie de imágenes fijas que cambian rápidamente como son los dibujos animados. Para la observación a ojo desnudo de un objeto en movimiento demasiado rápido (como puede ser la vibración de las cuerdas vocales durante la fonación, entre 100 y 1000 vibraciones por segundo) precisa de una iluminación intermitente en muy cortos destellos de luz.

Se pueden sincronizar los destellos de luz con la frecuencia a la que están vibrando las cuerdas vocales de forma que aparezca iluminado siempre que pase por el mismo lugar, logrando así el efecto de inmovilidad o “imagen congelada”. Si conseguimos que el destello ilumine el objeto en una posición un poco más adelantada (desincronizadas las frecuencias) estaremos observando un movimiento ficticio en “cámara lenta”.

FIGURA1 EXPLORACION DE LA VOZ
figura 1

 

Por su facilidad de uso nosotros preferimos realizar la estroboscopia con telelaringoscopio de 70º, aunque esto puede variar en función de las preferencias del examinador, no obstante sería aconsejable si se van a realizar comparaciones pre/postratamiento usar el miso tipo de endoscopio (rígido o flexible, si rígido: el mismo ángulo) (ver figura 1)

La utilización de los unos determinados parámetros estroboscópicos esta basado en la fiabilidad (reproductividad inter e intraobservador), en la no redundancia y en la sensibilidad clínica (relación con conceptos fisiológicos).

Los parámetros estroboscópicos básicos son:

o       Cierre glótico

El cierre glótico se clasifica en completo o incompleto. Es interesante describir los casos de cierre glótico incompleto dado que hay formas características de determinadas patologías ( ver figura 2):

cierre glotico
figura 2

1.      Ojal posterior (asociada habitualmente a un uso muscular inadecuado, pero que también se observa a menor escala en mujeres adultas sin trastornos de la voz).

2.      Ojal anterior (generalmente causada por un defecto estructural).

3.      Ojal anterior y posterior (en “reloj de arena”, asociada habitualmente a nódulos vocales bilaterales).

4.      Ojal irregular (asociada a bordes irregulares, cicatrices o lesiones de las cuerdas vocales).

5.      Ojal fusiforme, en doble paréntesis (asociado a procesos neurológicos, psicógenos, de uso muscular inadecuado o de envejecimiento).

6.      Ojal longitudinal o cierre incompleto en toda la longitud de los bordes libres de las cuerdas vocales (asociadas a afonía por conversión psicógena o parálisis).

o       Regularidad o periodicidad

Es el grado en que los ciclos vibratorios sucesivos se asemejan entre sí. Se valora mediante la luz estroboscópica sincronizada con el ciclo vocal (“imagen congelada”) de forma que si es periódica se verá una imagen estática y si es aperiódica o irregular la imagen parece que “salta”. Toda patología que altere el tono muscular y las propiedades mecánicas de la cuerda vocal así como la presión subglótica puede modificar la periodicidad del aparato vocal.

 

o       Onda mucosa

onda mucosaLa onda mucosa se refiere a le serie de ondulaciones de la cubierta de las cuerdas que se observan durante la fonación. Depende de una viscosidad tisular diferente entre el revestimiento mucoso y el músculo vocal (ver figura 3). Puede observarse en forma de una luz horizontal o una línea que se desplaza de la superficie medial a la lateral de las mismas y de abajo hacia arriba. Se observa mejor durante una fonación intensa y se juzga independientemente en cada cuerda vocal. Puede estar ausente, disminuida, normal o aumentada. La onda mucosa estará aumentada cuanto mayor sea la presión subglótica (fonación intensa) y cuando la cuerda vocal esté fláccida (edema de Reinke). Por el contrario, estará disminuida cuando la mucosa de la cuerda vocal esté más o menos rígida (voz en falsete, cicatriz en la cuerda, pólipos y nódulos fibrosos, leucoplasia, carcinoma in situ). Cuando está ausente puede deberse a una cicatriz extrema por cirugía previa o por un carcinoma invasor.

o       Simetría

Permite observar hasta qué punto el desplazamiento y aproximación de las cuerdas vocales para encontrase en la línea media de la glotis es tan coordinada y perfecta que forman imágenes en espejo. Las cuerdas vocales son simétricas cuando tienen idéntico comportamiento tanto en el movimiento de apertura y de cierre (simetría de fase) como en el de extensión latero-medial (simetría de amplitud). En general se puede decir que cualquier lesión vocal que limite la capacidad vibratoria producirá una onda asimétrica, por ejemplo cicatriz vocal, quiste epidérmico  o leucoplasia.

4.- Exploración Aerodinámica:

aducción de las cuerdas vocales
figura 4

En la fonación interviene un flujo aéreo generado por los pulmones en espiración; flujo, que tropieza en el nivel glótico con una resistencia vinculada a la aducción de las cuerdas vocales (ver figura 4). Como resultado de la interacción de esta columna aérea con la resistencia que le oponen las cuerdas vocales (función esfinteriana), éstas entran en vibración resultando una serie de pulsos de presión que afectan a las moléculas de aire existentes en el aparato vocal haciendo que oscilen (ver figura 5). Así una laringe que no cierre con la suficiente firmeza sus cuerdas vocales dejará un ojal glótico por donde

figura 5
figura 5

se pierde una gran cantidad de aire, dando lugar a un acortamiento de la fonación que el sujeto es capaz de realizar en cada inspiración.

La valoración aerodinámica, también llamada valoración de la eficacia fonorespiratoria, no pretende ser más que la valoración objetiva de estos conceptos de flujos aéreos y presiones de la columna aérea. En un protocolo básico de exploración clínica  de la voz bastaría con la medición de los siguientes parámetros que hemos seleccionado, tal y como proponemos en nuestro protocolo “Teatinos”.

4.1. Tiempo Máximo de Fonación (TMF):

Es la medida indirecta más sencilla para objetivar el volumen de aire empleado durante la fonación. Nos proporciona información sobre la integridad glótica, el apoyo respiratorio o ambas cosas. Se define como el mayor tiempo que un sujeto es capaz de mantener una vocal, generalmente la /a/ o la /e/, tras una inspiración profunda a un volumen y una frecuencia (tono) cómodas. Se obtiene de la siguiente forma: se coloca el sujeto de pie con el tronco bien erguido y se le indica que emita el sonido vocal tras realizar una inspiración profunda; el tono debe ser el habitual en su fonación ni muy agudo ni muy grave, evitando cualquier gesto laríngeo propio de la hiperfonación; asimismo, el sonido debe producirse a un volumen que aproximadamente se oiga a unos 2 metros en un entorno silencioso (lo que viene a representar unos 45-55 dB.). Se mide la duración de dicho sonido vocal antes de que decaiga su tono y volumen con un cronómetro. Es conveniente realizar 3 mediciones con un intervalo de 2-3 minutos entre ellas y se considera óptima la de mayor duración. Los valores normales varían en función de la edad y el sexo como se muestra en la tabla 1.

 

 

 

SEXO MASCULINO

EDAD MEDIA (segundos) DESVIACIÓN TÍPICA    (segundos)
< 4 años 8,9 2,1
Entre 4 y 12 años 17,1 4,1
Adultos 25,9 7,4
> de 65 años 14,7 6,2

 

SEXO FEMENINO

EDAD

MEDIA (segundos) DESVIACIÓN ESTANDAR (segundos)
< 4 años 7,5 1,8
Entre 5 y 12 años 14,9 3,8
Adultas 21,3 5,6
> de 65 años 13,5 5,7

Unos valores por debajo de 10 segundos se deben considerar patológicos. Un valor bajo del TMF (Tiempo Máximo de Fonación) puede deberse a dos circunstancias: una patología respiratoria con volúmenes pulmonares bajos o bien una patología laríngea en la que exista pérdida de la eficacia glótica porque una lesión impida el cierre de las cuerdas vocales (masa, fijación).

4.2.-Índice s/z o fonorespiratorio:

Consiste en la relación entre TMF para la consonante /s/ (Tiempo de Soplo) y el TMF para la vocal /a/ ó /e/.

Indice s/z: TMF “s” / TMF “a”

Donde TMF ”s” corresponde al numerador de la relación y TMF “a” al denominador. Tiene como finalidad relacionar las funciones pulmonar y laríngea.

Los individuos normales deben ser capaces de mantener la vocalización /a/ (TMF “a”) durante un periodo de tiempo igual o ligeramente menor al mantenido durante la espiración controlada sin vocalización /s/ (TMF “s”), es decir el numerador de la relación es igual o ligeramente mayor que el denominador por lo que el cociente debe de ser la unidad o ligeramente mayor. Si existe una patología respiratoria y la laringe es normal habrá una reducción tanto en el tiempo del aire espirado sin fonación /s/ (TMF “s”) como el de fonación /a/ (TMF “a”), por lo que el cociente seguirá sin variar. Sin embargo, si existe una patología laríngea con incompetencia glótica y apoyo respiratorio normal habrá una disminución para mantener la fonación de la vocal (TMF “a”) sin afectación del aire espirado sin fonación /s/ (TMF “s”), por lo que el cociente será mayor dado que el denominador ha disminuido.

El límite de la normalidad se encuentra en 1,5-1,4. Valores mayores de 1,5 se relacionan con defectos de cierre por incompetencia glótica o por lesiones del borde libre que impiden el cierre. Este cociente aporta una información muy valiosa de una forma rápida y simple, precisando sólo de un cronómetro.

 

4.3.-Capacidad Vital (CV):

Es un parámetro respiratorio que consiste en la cantidad de aire que una persona puede expulsar del tórax por espiración forzada tras una inspiración forzada. Se calcula mediante un espirómetro y nos informa del estado del órgano del fuelle fonatorio.

 

4.4.- Cociente de Fonación:

Es la medida básica del control respiratorio y de la eficacia del cierre glótico. Resulta de la relación entre la capacidad Vital (CV) y el TMF:

CF: CV / TMF

 

Los valores normales son de 155 +/- 45 ml/seg.; valores más altos indican escape de aire y uso ineficaz de la glotis.

5.- Análisis acústico:

El estudio de la señal acústica proporciona información sobre la calidad de la voz mediante el estudio de los principales parámetros acústicos que componen la voz. El desarrollo informático ha incidido y ha sido motor de cambios en muchos campos, pero sobre todo ha posibilitado la rápida difusión de los equipos de análisis acústico y de las estaciones de exploración vocal conjunta, en donde se suman la imagen y el análisis acústico, siendo ésta la forma más actual de abordar el diagnóstico y el seguimiento de los tratamientos de la patología de la voz.

Un diagnóstico vocal preciso, en estos momentos, no se puede hacer exclusivamente con un análisis acústico, que no puede descubrir el origen de una alteración vocal. El análisis acústico tiene su máxima relevancia en la cuantificación de la disfonía; es decir: en la determinación inicial del grado de disfonía y en su evolución. A pesar de los esfuerzos que actualmente se están haciendo para que el análisis vocal sirva para hacer el diagnóstico, aún no se ha conseguido, pero puede que no esté lejos el día en que con un fragmento grabado de la voz del enfermo podamos diagnosticar las patologías con un razonable grado de fiabilidad.

El procedimiento a seguir para la realización de un análisis acústico requiere distintas fases: en primer lugar, la señal acústica será captada por un micrófono, después deberá ser digitalizada por un convertidor analógico/digital para que, finalmente, sea analizada y procesada por un programa de análisis acústico.

Las ventajas del análisis acústico son:

–         Identifica los componentes vocales responsables de la disfonía, aumentando la precisión del diagnóstico.

–         Cuantifica los componentes vocales responsables de la disfonía, para así poder establecer una estadificación de la disfonía.  En este sentido, se le ha querido dar al análisis acústico una significación semejante a la que la audiometría tiene en la patología del oído.

–         Valora la evolución de la disfonía tras los tratamientos aplicados (tanto a corto como a largo plazo). Esta valoración permitirá realizar cambios en el tratamiento.

–         Es sencillo en la utilización de los equipos, poniendo al alcance de todos, los recursos necesarios para hacer análisis acústicos vocales. A esto hay que añadir la universalización del ordenador personal, que facilita enormemente el cálculo de los parámetros que hace unos años había que “medirlos a mano”.

Los inconvenientes del análisis acústico son:

–         La emisión vocal por parte del paciente puede no tener siempre las mismas características, con lo que cabrían diferencias incluso entre dos exploraciones consecutivas; esto crea una incertidumbre que resta credibilidad a la prueba. Esta es la principal diferencia con la audiometría en donde el paciente tiene que reconocer una señal, no emitirla.

–         Inutilidad del análisis acústico vocal si no se hace en el contexto de un abordaje clínico global. La propia facilidad del análisis acústico puede llegar a crear confusión al no matizar e interpretar los hallazgos.

–         Falta de unos estándares de normalidad para cada una de las pruebas, con lo que la normalidad se obtiene muchas veces para cada uno de los equipos. Esta falta de unidades precisas (en ocasiones dadas en porcentajes) lo diferencia también de la audiometría en donde el decibel es una unidad normalizada en todos los audiómetros.

Básicamente un análisis acústico de la voz debe incluir el estudio de estos parámetros:

5.1.- Frecuencia fundamental (Fo):

La frecuencia es el correlativo físico del fenómeno perceptivo del tono o altura del sonido.  Representa el número de veces que las cuerdas vocales se abren y se cierran por segundo, y se mide en hertz (Hz) o ciclos por segundo.

Existen cambios que se desarrollan en la Fo a lo largo de la vida del individuo. Los niños y las niñas tienen una frecuencia parecida (240 Hz.) hasta la pubertad en donde los varones tienen un descenso hasta unos 110 Hz. (se les pone la voz más grave), mientras que las mujeres se mantienen en unos 210 Hz. Hacia la tercera edad la frecuencia de los hombres aumenta (140 Hz.) y la de las mujeres disminuye (190 Hz.), volviéndose a coincidir el tono hacia el final de la vida.

La patología no tiene demasiada importancia en las variaciones de la Fo. Tal vez sólo en el edema de Reinke tiene significación. Ello es debido a que el edema aumenta significativamente la masa y la frecuencia disminuye con lo que la voz se hace más grave.

5.2.- Intensidad:

La intensidad es al volumen lo que la frecuencia al tono. La intensidad es el producto de la amplitud de vibración de las cuerdas vocales y de la presión subglótica y se expresa en decibelios (dB).

Los valores típicos para hablantes  durante una conversación normal son los siguientes: varía entre 75 y 80 dB, con una desviación estándar de 4.5 dB.

5.3.- Jitter:

El jitter es la perturbación involuntaria de la frecuencia,  es la variación de la frecuencia fundamental (o recíprocamente del periodo) entre cada ciclo vocal y el siguiente. En cierta forma, lo que medimos es la estabilidad de la fonación. Se expresa en porcentajes (%).

Dentro de la normalidad la frecuencia entre ciclo y ciclo no es exactamente igual. Pero esa variación entre ciclos tiene un grado de tolerancia: todos entendemos que una voz patológica tendrá una variación de la frecuencia entre ciclos mucho más alta. No obstante, pese a la alta sensibilidad que tiene el Jitter para hacerse patológico en las voces disfónicas, esta medida no sirve para determinar la causa de la disfonía ya que el Jitter puede alterarse por diferentes causas:

–         Neurológicas: por falta de control del sistema nervioso sobre los músculos vocales.

–         Aerodinámicas: cuando existe un defecto de cierre glótico que pueda provocar  escape de aire que haga vibrar irregularmente a las cuerdas.

–         Mecánicas: cuando hay asimetrías en la masa de las cuerdas o cuando hay cambios en las propiedades biomecánicas de las mismas.

5.4.- Shimmer:

La perturbación de la amplitud de la señal vocal, medida en ciclos consecutivos, recibe el nombre de Shimmer. El Shimmer tiene la misma importancia que la perturbación de la frecuencia para determinar el grado de disfonía de una voz, aunque al igual que ésta no se ha podido vincular el Shimmer a una patología determinada. Por investigaciones preliminares parece que el Shimmer es inversamente proporcional, pero no de forma lineal, con la intensidad vocal media: a mayor intensidad menor Shimmer.

Los valores se dan en porcentajes (%).

5.5.- Ruido glótico:

El ruido glótico o espectral se calcula fundamentalmente mediante el parámetro Relación Armónico/Ruido (A/R, en inglés H/N). Al analizar el ruido espectral, medimos aisladamente la cantidad de ruido o la cantidad de armónicos, sin relacionarlos. Si nosotros consideramos que incluso las voces normales tienen un cierto componente de ruido, podemos relacionar la energía empleada en la formación de los armónicos con la energía empleada (o pérdida) en forma de ruido. La relación A/R es el cociente entre la amplitud media de la onda y la amplitud media del ruido considerado aisladamente. El valor se expresa en dBs, y la cifra normal es de 12 dBs; cuando la voz es disfónica las cifras son menores (aumenta el denominador).

También se puede el ruido espectral como Energía del Ruido Normalizado (ERN, en inglés NNE).

6.- Análisis espectrográfico:

Normalmente forma parte del análisis acústico pero con una intención exclusivamente didáctica preferimos tratarlo de forma separada.

El análisis objetivo del timbre vocal se lleva a cabo mediante la Espectrografía de la voz. Es una potente herramienta de análisis vocal y que su misión consiste en realizar una completa disección física de una onda acústica en sus componentes básicos. En realidad, lo que hace la espectrografía es desandar el camino que la fuente vocal y el filtro han compuesto hasta formar la voz. La espectrografía vuelve hacia atrás y es capaz de detectar la frecuencia fundamental del ciclo vocal, los armónicos de la onda compleja resultante (múltiplos de la Fo) y las zonas de filtro o refuerzo del tracto (los formantes), y todo ello tanto en el dominio temporal como en el dominio de frecuencia. Así mismo, la espectrografía es capaz de detectar la energía no vocal, el ruido que aparece entre los armónicos y que lo único que consigue es desencadenar la disfonía. El potencial del espectrograma es que refleja tres características a la vez: las frecuencias de la voz (Fo y armónicos: lo que es el espectro), el tiempo en que acontece el fenómeno vocal y la intensidad de cada una de las frecuencias armónicas (amplitud del espectro); la intensidad viene reflejada por una escala de grises. Al introducir la representación por el color, o escala de grises plasmamos tres características (3 dimensiones) en una superficie de papel (2 dimensiones): en el eje de abscisas (horizontal) se representa el tiempo, en el eje de ordenadas (vertical) se representan las frecuencias, y la intensidad de grises de las líneas horizontales (armónicos) nos da su intensidad (amplitud del espectro).

 

Otra característica importante del espectrograma es que se puede obtener tras el paso por un filtro de banda estrecha o por un filtro de banda ancha. El espectrograma resultante del paso por un filtro de banda estrecha nos va a mostrar muy bien las frecuencias, pero mal los pulsos glóticos y deficientemente los formantes (mejor resolución del dominio de la frecuencia). El espectrograma resultante del paso por un filtro de banda ancha nos mostrará muy bien los pulsos glóticos, y los formantes (como bandas oscuras horizontales de concentración de energía), pero mal las frecuencias (mejor resolución del dominio temporal). Ambas representaciones son complementarias (ver figura 6 y 7).

Figura 6 (E. banda estrecha)
Figura 6 (E. banda estrecha)
Figura 7 (E. banda ancha)
Figura 7 (E. banda ancha)

 

Ventajas de la Espectrografía respecto al Análisis Acústico.

 

En los últimos años, de la mano del desarrollo de la informática, han salido al mercado diferentes programas de análisis de la voz. Estos paquetes por lo común integran herramientas para poder realizar el análisis acústico de la voz y la espectrografía.

El análisis acústico, como sabemos, presenta una serie de inconvenientes:

  • No es posible comparar los resultados obtenidos entre distintos programas debido a que los algoritmos de cálculo que emplean suelen ser diferentes.
  • Los resultados que se expresan numéricamente son difíciles de interpretar si no se comparan con una base de datos de voces normales y patológicas que incluye el programa y que suelen pertenecer a sujetos que hablan otro idioma.
  • No existe fiabilidad en el análisis de voces extremadamente aperiódicas. Las medidas de perturbaciones menores del 5% suelen ser fiables, sin embargo, las superiores al 7% deben ser cuestionadas, por lo que se precisa de un control visual de la definición periódica de la señal (oscilograma).

Por el contrario, la espectrografía carece de estos problemas porque:

  • Crea un gráfico en el que se representan los armónicos y formantes en el espectro y en el que el ruido añadido por la patología vocal se observará de forma nítida, sin que tengamos que ayudarnos de bases de datos para su interpretación.
  • Es absolutamente comparable entre los distintos programas disponibles. Creemos de mucha mayor utilidad para la evaluación de los resultados terapéuticos el empleo del espectrograma de banda estrecha que la clasificación de la voz que hace el programa basándose en su base de datos de voces normales y patológicas.
  • Es útil para el estudio de las voces sin periodicidad o creadas por patrones caóticos de vibración de las cuerdas vocales. Por muy patológica que sea la voz siempre se dispondrá de un gráfico en el que veremos representado el ruido, los armónicos, los subarmónicos y los segmentos vacíos de señal.
  • Puede ser el único método para estudiar y objetivar las voces con importantes alteraciones de la estabilidad de la intensidad y del tono a largo plazo, o lo que es lo mismo, el temblor vocal ya que el análisis acústico de las perturbaciones a corto plazo (Jitter, Shimmer) no documenta los fenómenos que caracteriza a estas alteraciones.

Anexo A

PROTOCOLO DE EXPLORACIÓN CLÍNICA DE LA VOZ

DATOS PERSONALES Nº HC:

 

APELLIDOS:                                                                        EDAD:         SEXO:

NOMBRE:

Dirección:

Teléfono:                                                         Profesión:

Fecha de examen:

1.-VALORACIÓN SUBJETIVA POR EL PROPIO PACIENTE:

 

Puntuación de VHI:

2.-EXPLORACIÓN PERCEPTUAL:(0=normal;1=ligero;2=moderado;3=severo)

  • G:
  • R:
  • A:
  • B:
  • S:

3.-EXPLORACIÓN AERODINÁMICA:

 

¨      Tiempo Máximo de fonación (TMF) ___________

¨   Índice fono-respiratorio     /s/   (normal 1.4-1.5)

/a/

¨      Capacidad Vital (CV)

¨      Cociente de Fonación:  CV / TMF =_____________(normal 155+/-45)

 

4.- EXPLORACIÓN VIDEOLARINGOESROBOSCÓPICA:

4.1.- Cierre glótico:

– Completo

– Incompleto:

– Ojal Posterior                   – Ojal Anteroposterior        – Ojal Fusiforme

– Ojal Anterior                    – Ojal Irregular                   – Ojal Longitudinal

4.2.- Regularidad o periodicidad:       SI              NO

4.3.-Onda mucosa

Normal Aumentada Disminuida Ausente
C.V. Drcha
C. V. Izada

4.4.- Simetría

C. V. Derecha SI NO
C. V. Izquierda SI NO

 

 

5.-ANÁLISIS DE LOS PARÁMETROS ACÚSTICOS:

ü      Frecuencia fundamental (fo) (Hz)

ü      Intensidad /dB)

ü      Jitter (%)

ü      Shimmer (%)

ü      Ruido glótico (dB)

 

6.-ANÁLISIS ESPECTROGRÁFICO:

Armónicos, formantes, ruido, subarmónicos

 

Observaciones: ____________________________________________________________________________________________________________________________________________

 

 

BIBLIOGRAFÍA

 

–         Blake-Simpson C. y Fleming D. (2000). Anamnesis médica y vocal en la valoración de disfonía. En Rosen CA y Murry T (eds): Trastornos de la voz y fonocirugía (parte I). Clínicas Otorrinolaringológicas de Norteamérica. Volumen 5/2000. (pps.667-676). México: McGraw-Hill Interamericana.

–         Casado JC y Adriá, JA. (2002) La evaluación clínica de la voz. Fundamentos médicos y logopédicos. Málaga: aljibe.

–         Casado JC. (2000). Evaluación morfo-funcional y análisis acústico vocal. Estudio en sujetos normales y en diferentes patologías orgánicas y funcionales de la voz. Tesis doctoral publicada. Universidad de Córdoba.

–         Dejonckere PH. (2000) Valoración perceptual y de laboratorio de la disfonía. En Rosen CA y Murry T (eds): Trastornos de la voz y fonocirugía (parte II). Clínicas Otorrinolaringológicas de Norteamérica. Volumen 5/2000. ( pps. 677-698). México: McGraw-Hill Interamericana.

–         Dejonckere PH, Bradley P., Clemente P., Cornut G., Crevier-Buchman L., Friedrich G., Van de Heyning P., Remacle M y Woisard V. (2001). A basic protocol fon functional assessment of voice pathology, especially for investigating the efficacy of (phonosugical) treatments and evaluating new assessment techniques. Guideline elaborated by the Committee on Phoniatrics of the European Laryngological Society (ELS). Eur Arch Otorhinolaryngol. 258,77-82.

–         Heuer RJ., Hawkshaw M., Sataloff RT. (2005). The clinical Voice Laboratory. En Sataloff RT (ed). Proffessional Voice. The Science and Art of Clinical Care (pp 355-394). San Diego- Oxford: Plural Publishing.

–         Jackson-Menaldi  MC. (2002). Evaluación de la laringe en la consulta clínica. En Jackson-Menaldi MC. La voz patológica (pps. 3-28). Madrid: Panamericana.

–         Morrison M., Rammage L. (1996). Valoración de un paciente con un trastorno de voz. En: Tratamiento de los trastornos de la voz (pps. 1-54).Barcelona: Masson.

–         Nuñez-Batalla F., Corte-Santos P., Señaris-González B. y cols. (2007). Adaptación y validación  del índice de incapacidad vocal (VHI-30) y su versión abreviada (VHI-10) al español. Acta Otorrinolaringol Esp. 58, 386-392.

–         Casado-Morente JC y Pérez-Izquierdo A (2009) Trastornos de la Voz: del diagnóstico al tratamiento. Málaga: Editorial Algibe.