Francisco José Cantero Serena (1999): “Análisis Melódico del Habla: principios teóricos y procedimiento”

June 23, 2017 | Autor: F. Cantero Serena | Categoría: Speech Prosody, Phonetics, Intonation, Acoustic Phonetics, Prosody, Experimental Phonetics
Share Embed


Descripción

Francisco José Cantero Serena (1999): “Análisis Melódico del Habla: principios teóricos y procedimiento”, en Actas del I Congreso de Fonética Experimental. Tarragona: Universitat Rovira i Virgili. (pp. 127-133)

ANÁLISIS MELÓDICO DEL HABLA: PRINCIPIOS TEÓRICOS Y PROCEDIMIENTO Francisco José Cantero Serena Universitat de Barcelona.

1. INTRODUCCIÓN

Hasta hace poco, el análisis de la entonación ha permanecido al margen de los procedimientos de análisis instrumental, fuera de la fonética experimental, y la mayoría de los métodos empleados (análisis de configuraciones, de niveles, métrico, nuclear, etc.) son altamente subjetivos y manejan datos y sistemas de representación no empíricos.

A partir de enfoques teóricos como el de la escuela holandesa (el enfoque IPO, presentado en t’Hart, Collier & Cohen, 1990) se ha ido desarrollando toda una línea de análisis de la entonación desde una nueva perspectiva instrumental y perceptiva que garantiza la objetividad de la descripción. El método de estos autores consiste extraer la F0 de la señal acústica y reducir la curva tonal resultante a sus movimientos tonales esenciales, lo que llaman estilización de la curva; dicha estilización, validada perceptivamente, permite establecer los patrones básicos de la entonación. Este método, o adecuaciones del mismo, ha sido empleado por distintos autores con el mismo objetivo de implementar sistemas de síntesis con diferentes arquitecturas. En nuestro país, Garrido (1996) constituye una adaptación del método (en el que la estilización se realiza automáticamente) y una aplicación original a la conversión texto-voz en español.

Sin embargo, en tales métodos de análisis de la entonación, que por primera vez afrontan el fenómeno desde una perspectiva científica y objetiva, persisten algunas de las rémoras tradicionales en su estudio:

1

a. Continúa sin segmentarse la curva entonativa, concebida como una unidad en la que todos los valores de F0 son significativos porque constituyen “movimientos tonales”: es decir, no hay nada parecido a “segmentos”.

b. La curva se toma como una unidad, independientemente de los fenómenos acentual y rítmico,de manera que sólo pueden concebirse límites externos a la propia melodía: en el caso de Garrido (1991, 1996), por ejemplo, el corpus de curvas estilizadas se obtiene de la lectura de una serie de frases preparadas ad hoc.

c. Por tanto, la entonación sigue describiéndose en función de unidades propias de otros niveles de análisis (la frase, la cláusula, la oración, el párrafo, etc.).

d. En definitiva, se trata de análisis fonéticos en los que no importa ni el rendimiento fonológico de los patrones entonativos establecidos, ni su posible significación, ni, por supuesto, la interacción de la melodía con los demás fenómenos tonales del habla (el acento y el ritmo).

En Cantero (1995 y en prensa) hemos propuesto un sistema de análisis de la entonación que pretende afrontar tales problemas teóricos y darles respuesta en un marco estructural1. En concreto, nuestro sistema de análisis permite:

a. Segmentar la entonación, esto es, entender la curva entonativa como una sucesión de segmentos tonales cuyo valor de F0 es relevante, despreciando los valores irrelevantes. b. Analizar la entonación independientemente de cualquier otro nivel de análisis lingüístico, y en concreto de los niveles léxico-gramatical, semántico y pragmático. Esto nos permite, además, analizar la entonación del habla espontánea, puesto que no hay que depender en ningún sentido de unidades externas a la propia melodía.

c. Analizar conjuntamente todos los fenómenos tonales del habla: el acento, el ritmo y la entonación, como fenómenos incluidos en la melodía del habla.

1

De algunos de los conceptos generados en Cantero (1995), y en concreto del sistema de análisis melódico propuesto, se ha hecho eco Martínez Celdrán (1996 y 1998), en sendos manuales de introducción a la fonética y de análisis acústico.

2

d. Realizar un análisis aplicable en diversas actividades, más allá de la propia descripción teórica y la síntesis de voz: aplicable en fonética contrastiva, adquisición de la entonación, análisis del discurso, didáctica de la pronunciación, fonética clínica, etc.

En este trabajo nos proponemos explicar, concretamente, el sistema de análisis melódico que empleamos. Para ello será imprescindible, en primer lugar, hacer una breve referencia a los principios teóricos que permiten este tipo de análisis, para luego explicar los puntos esenciales del procedimiento.

2. PRINCIPIOS TEÓRICOS

2.1. DEFINICIÓN DE “ANÁLISIS MELÓDICO DEL HABLA”

Consiste en extraer únicamente los datos relevantes de la entonación del enunciado, de modo que pueda establecerse el patrón estandarizado de la curva entonativa, específicamente, personalizando los modelos propios del informante. Esta personalización permite aplicar el análisis en actividades didácticas y/o terapéuticas (comparando, por ejemplo, la producción del informante con modelos previos y/o con producciones anteriores del mismo informante), pero también establecer los modelos tipo de la lengua, elaborando patrones medios de diversos informantes, preferiblemente en habla espontánea. En definitiva, el análisis melódico es la manera de hacer un análisis acústico de la entonación.

2.2. F0 , MELODÍA Y ENTONACIÓN

La F0 es el parámetro físico en el que se basa la percepción del tono, y por tanto informa a distintos fenómenos lingüísticos, como el acento o la entonación. La sucesión de valores de F0 en un discurso constituye una melodía, en la que, por tanto, deben estar incluidos los rasgos tonales que conforman tanto el acento como la entonación. Así, la melodía no equivale directamente a la entonación: la entonación es un fenómeno lingüístico; la melodía, un fenómeno físico (una relación paralela a la que mantienen el fonema y el sonido: el fonema es una unidad funcional, abstracta, y el sonido es una realidad física). Podríamos decir que la entonación es la interpretación lingüística de la melodía. Es decir, 3

el análisis melódico es un análisis fonético, frente al análisis de la entonación, que debería ser un análisis fonológico.

2.3. JERARQUÍA FÓNICA

A menudo se dice que el discurso hablado está constituido por una serie de sonidos que forman una especie de “cadena fónica”. Esta idea supone que cada sonido es un “eslabón” de la “cadena”, es decir, que todos los sonidos tienen la misma importancia funcional, que el discurso está formado por una serie indistinta de sonidos, uno tras otro. Naturalmente, todas las aplicaciones técnicas que parten de esta idea se han encontrado con numerosos problemas: la corrección fonética, por ejemplo, presta igual atención a vocales y a consonantes, de modo que podemos pasar mucho tiempo intentando corregir una consonante que, a la postre, ocupa en el discurso un lugar completamente marginal; hace unos años, la síntesis de voz también partía de una concepción de “cadena fónica”, con el resultado de que, en efecto, los sonidos se encadenaban y lo que sonaba no era un discurso oral, sino una retahila sin sentido, desorganizada.

Los sonidos del habla, evidentemente, están mucho más organizados y no constituyen una mera sucesión indistinta, sino que se encuentran perfectamente jerarquizados, según la función que cumplen en la estructuración fónica del discurso (v. Cantero, 1998). Porque la principal función que cumplen los fenómenos tonales es la integración de los sonidos del habla y, por tanto, la cohesión fónica del discurso oral; es decir, la estructuración misma de su forma material (lo que Quilis, 1981, llama “función integradora, delimitadora” y Cantero, 1995, “función prelingüística”).

Así, el núcleo de la fonación y el núcleo del discurso siempre es una vocal, el único sonido que siempre es portador de F0 , cuya F0 es controlada conscientemente por el hablante, y alrededor del cual se organizan los demás sonidos del habla (glides y consonantes). La vocal (tónica o átona) es el núcleo de la sílaba; la vocal tónica (acento paradigmático o acento de palabra) es el núcleo del grupo rítmico (o palabra fónica); y la vocal tónica con inflexión tonal (acento sintagmático o acento de frase) es el núcleo del grupo fónico. Justamente, el contorno entonativo ocurre en el grupo fónico, cuyo núcleo, el acento sintagmático (o acento de frase) es también el núcleo del contorno: la inflexión final (v. Cantero 1995 y en prensa). De este modo, los fenómenos tonales del habla, el acento y la 4

entonación, funcionan solidariamente en lo que hemos llamado su función prelingüística, la integración de los sonidos del discurso y su estructuración en bloques fónicos que permiten y facilitan su comprensión al oyente (y cuyo mecanismo desconoce, por ejemplo, un extranjero que está aprendiendo el idioma, razón por la cual, aunque conozca todas las palabras que ha oído y pueda identificar, uno por uno, todos los sonidos, es incapaz de comprender el discurso en su conjunto, de entender lo que oye).

2.4. SEGMENTO TONAL

Puesto que el sonido más importante del discurso siempre es la vocal, núcleo de cada unidad fónica (sílaba, grupo rítmico, grupo fónico), es evidente que el valor de F0 de la vocal ha de ser más relevante que el de cualquier otro sonido, glide o consonante sonora. Más aún en el caso de las vocales tónicas, las únicas que conservan su identidad tímbrica (frente a las vocales átonas, que a menudo se neutralizan). Así, en el análisis melódico de un enunciado nos interesan los valores vocálicos, exclusivamente, cada uno de los cuales constituye un segmento tonal de la melodía. Sólo en los casos en los que la duración de la vocal es significativamente mayor (no una sino dos moras de duración), podemos suponer que la vocal constituye no uno sino dos segmentos tonales: en tales casos, la vocal contiene un inflexión tonal, que definimos, precisamente, como la sucesión de dos (o más) segmentos tonales en una vocal. Segmento tonal, por tanto, es cada valor de F0 relevante en la melodía.

3. PROCEDIMIENTO El primer paso para realizar un análisis melódico de un enunciado es la extracción (fiable) de la F0 del enunciado, para lo que podemos emplear cualquiera de los instrumentos de análisis acústico disponibles en el mercado (v. Figura 1).

El siguiente paso es la determinación de los valores de F0 vocálicos. Estos serán los valores relevantes de la melodía. Para ello identificamos las vocales en la curva (con ayuda, por ejemplo, del oscilograma, o del sonograma), y anotamos su valor medio (en los casos en los que el valor vocálico es estable, lo cual suele ocurrir a menudo). También podemos optar por tomar el valor central de la vocal, o la moda (el valor más repetido). Hay que notar que los valores ofrecidos por un instrumento de análisis no equivalen a ninguna

5

unidad ni lingüística ni fonatoria: son frames, ventanas de muestreo, y dependen únicamente de la frecuencia de muestreo con que se digitalizó la grabación. Así, si en una vocal se obtienen tres, seis o diez valores, ello sólo tiene que ver con la digitalización de la señal, y nosotros tenemos que “resumir” todos esos valores en uno representativo. Otro caso muy común es el de las inflexiones tonales: en ellas, la vocal contiene valores frecuenciales muy distantes, que constituyen de por sí una pequeña curva. En estos casos, el procedimiento es tomar los dos momentos de estabilidad frecuencial de la vocal: el punto de partida de la inflexión, y el punto de llegada, obviando todo el recorrido (que sería una típica variación micromelódica, irrelevante a todos los efectos).

La sucesión de valores vocálicos constituye la curva melódica esencial (v. Figura 2), de la que se han eliminado todos los valores irrelevantes (consonantes sonoras, glides, etc.), es decir, todos los valores coarticulatorios y las variaciones micromelódicas (normalmente, la F0 de una consonante sonora equivale a la de la vocal núcleo de la sílaba, pero con alguna variación provocada por las diferencias de presión propias de la producción consonántica).

6

De esta curva también se han abstraído los valores temporales, porque cada valor corresponde a un segmento tonal (normalmente, a una sílaba), independientemente de la velocidad de emisión.

El patrón melódico obtenido así, sin embargo, aún debe procesarse para eliminar todos los condicionantes fisiológicos externos a la propia estructura melódica. Los valores esenciales son aún valores absolutos, en Hz. Las distancias tonales, por tanto, varían mucho en función de si la voz es masculina, femenina o infantil. Se trata, por tanto, de establecer las relaciones tonales entre los segmentos sucesivos que componen la melodía, haciendo abstracción de los valores frecuenciales absolutos.

La estandarización de la curva puede realizarse midiendo las distancias tonales en semitonos, o, preferiblemente, relativizando cada valor frecuencial (en Hz) con respecto al valor anterior (en porcentaje: un semitono equivale a un 6 % de desnivel tonal). Así, entre dos valores sucesivos de 100 Hz y 150 Hz, la distancia tonal en términos absolutos es de 50 Hz. También entre 200 Hz y 250 Hz la distancia es de 50 Hz. Sin embargo, la melodía en ambos casos es muy distinta: en el primer caso, los 50 Hz de distancia absoluta equivalen a un 50 % de ascenso tonal; en el segundo caso, los 50 Hz equivalen a un ascenso de un 25 %, exactamente la mitad.

La relativización de cada valor tonal con respecto al valor anterior permite, por tanto, construir la melodía tal cual es, independientemente de las características del hablante. Este es el formato idóneo de los patrones melódicos (v. Figura 3): incluso puede analizarse la melodía del diálogo, donde la entonación de cada hablante está condicionada por los valores de la entonación de su interlocutor (v. Cantero 1995 y en prensa).

7

4. REFERENCIAS BIBLIOGRÁFICAS Cantero, F.J. (1995): Estructura de los modelos entonativos. Interpretación fonológica del acento y la entonación del castellano. Univ. de Barcelona. ( Microfichas: P.U.B, 1997). Cantero, F.J. (1998): “Conceptos clave en lengua oral”, en Mendoza, A. (coord.): Conceptos clave en didáctica de la lengua y la literatura. Barcelona: Horsori. Cantero, F.J. (en prensa): Teoría y análisis de la entonación. Garrido, J.M. (1991): Modelización de patrones melódicos del español para la síntesis y el reconocimiento del habla. Universitat Autònoma de Barcelona/Dep. Filologia Espanyola. Garrido, J.M.(1996):Modelling Spanish Intonation for Text-to-Speech Applications.U.A.B. Martínez Celdrán, E. (1996): El sonido en la comunicación humana. Barcelona: Octaedro. Martínez Celdrán, E. (1998): Análisis espectrográfico de los sonidos del habla. Ariel. Quilis, A. (1981): Fonética acústica de la lengua española. Madrid: Gredos. t' Hart, J.; R. Collier & A. Cohen (1990): A perceptual study of intonation. An experimental-phonetic approach to speech melody. Cambridge: C.U.P.

8

Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.