Uso de corpus en la formalización de cláusulas interrogativas

September 17, 2017 | Autor: Iria del Río Gayo | Categoría: Syntax, Corpus Linguistics, Spanish Linguistics, Questions
Share Embed


Descripción

USO DE CORPUS EN LA FORMALIZACIÓN DE CLÁUSULAS INTERROGATIVAS Iria del Río Gayo Universidad de Santiago de Compostela [email protected] 1. Introducción En este artículo se presenta un trabajo de investigación 1 que ha tenido como objetivo la formalización, basada en datos extraídos de la Base de Datos Sintácticos del Español Actual (en adelante BDS), de un tipo de cláusula (Rojo (1978); Rojo y Jiménez Juliá (1989) interrogativa: las interrogativas directas parciales con un objeto.

Dicha

formalización supone la construcción de un módulo clausal que se integra en la gramática AVALON. Como veremos, esta integración supone una serie de condiciones previas para la construcción del módulo, entre ellas, el formalismo en el que se escriben sus reglas: AGFL. La estructura del artículo es la que sigue: presentaremos en primer lugar el tipo de cláusula objeto de investigación, el formalismo AGFL y el corpus utilizado, la BDS. A continuación nos ocuparemos de la gramática-marco de nuestro módulo, AVALON. En lo que constituye la parte central del artículo, trataremos en profundidad el proceso de elaboración del propio módulo. Finalmente, hablaremos sucintamente de las direcciones de trabajo futuras.

2. Interrogativas directas parciales con un objeto

En nuestro trabajo se combina la lingüística teórica con la lingüística computacional. La parte teórica se centra, como veremos, en el estudio de la morfosintaxis de un tipo concreto de estructura lingüística: las cláusulas interrogativas directas parciales con un objeto. Un ejemplo de este tipo de cláusula (extraído de BDS) sería el siguiente: 1 El trabajo está todavía en curso, y ha sido posible gracias a la ayuda asociada a la beca de formación de personal investigador (FPI), con referencia BES-2008-005336, financiada por el Ministerio de Ciencia e Innovación. Dicha beca fue concedida en el marco del proyecto 'Recursos lingüísticos para búsqueda de respuestas en español', dirigido por el doctor D. Guillermo Rojo Sánchez y financiado por el Ministerio de Ciencia e Innovación (HUM2007-66607-CO4-01/FILO, 2007-2010).

[…] ¿Quién va a hacerte muy feliz? [Hacer, Hombre: 39, 22] 2

En la lingüística española las interrogativas se han dividido tradicionalmente en dos grandes grupos: directas (ejemplo 1) e indirectas (ejemplo 2). Según la RAE, las primeras «constituyen enunciados interrogativos», RAE (2009: 3152), mientras que las segundas «son una variedad de las oraciones subordinadas sustantivas», RAE (2009: 3152).

1. […] ¿has encontrado algo? [Encontrar, Laberinto: 93, 30] 2. […] nunca supe si las balas le alcanzaron o no. [Alcanzar, Sur: 67, 14]

Dentro de las interrogativas directas, se distinguen a su vez dos grandes grupos: totales (ejemplo 3) y parciales (ejemplo 4). Las primeras presentan una disyunción, es decir, dos o más alternativas entre las que el oyente debe elegir (las prototípicas se responden con sí o no); las segundas, sin embargo, se caracterizan porque presentan siempre una partícula interrogativa (qué) o constituyente interrogado (qué hombre) que supone la incógnita que debe ser resuelta con la respuesta.

3. ¿Ha descubierto usted una estrella nueva? [Descubrir, Laberinto: 237, 1] 4. […] ¿por qué ponen huevos las gallinas? [Poner, Laberinto: 257, 33]

Finalmente, las directas parciales se dividen en dos tipos según el número de partículas interrogativas o constituyentes interrogados que presenten: las simples o con un objeto (ejemplo 5) presentan solo uno, y las múltiples o complejas (ejemplo 6) presentan varios que tienen diferentes funciones sintácticas en la cláusula.

5. ¿Cuándo se la llevaron? [Llevar, Diego: 66, 25] 6. ¿Cómo te ha sonado qué? [Sonar, Ochenta: 33, 23] Nuestro tipo de interrogativa posee, según los trabajos que se han ocupado de su 2 La referencia final permite localizar el ejemplo en la BDS, al indicar: verbo ('hacer'), obra (Hombre), página (39) y línea (22). Este será el formato que utilizaremos para todos los ejemplos extraídos de la base de datos.

estudio 3, una serie de características morfosintácticas que la singularizan no solo dentro del grupo de las oraciones interrogativas, sino entre los restantes tipos de oraciones del español. Entre estas características, destacan: el orden prototípico de parte de sus constituyentes; la presencia de una partícula o constituyente interrogativo encabezando la estructura; la especialización funcional de las partículas interrogativas. Como veremos, estas características deben ser tenidas en cuenta y analizadas para la formalización, tanto a través de lo que nos dice la teoría como los datos de uso real extraídos de la BDS. 3. El formalismo AGFL 4

La parte de lingüística computacional de nuestro trabajo consiste en la formalización del tipo de interrogativa que acabamos de presentar. Como sabemos, la formalización de estructuras lingüísticas supone la traducción a un lenguaje formal del funcionamiento de esas estructuras lingüísticas con distintos fines prácticos, entre otros, obtener gramáticas que puedan ser manejadas por ordenadores (las denominadas gramáticas formales) e integradas en herramientas tales como analizadores sintácticos. En nuestro caso, el formalismo que hemos utilizado es aquel en el que está escrito AVALON, AGFL. AGFL 5 (Affix Grammars over Finite Lattices) es un formalismo para la descripción de gramáticas libres de contexto asociado a un generador de analizadores. El formalismo pertenece a la familia de las gramáticas de dos niveles: un primer nivel libre de contexto es extendido en un segundo nivel mediante atributos (affixes) que expresan concordancia entre constituyentes sintácticos. Además de las ventajas que esto supone, AGFL aporta una serie de características y funcionalidades (posibilidad de establecer prioridades en el análisis mediante la adición de penalties a las reglas sintácticas de la gramática; introducción de datos estadísticos referentes a la frecuencia del léxico en los lexicones; estructuración de la gramática en distintos módulos 3 La bibliografía que se centra en la descripción de la sintaxis de nuestras interrogativas, o en aspectos más concretos de su estructura, no es muy abundante. Existe una amplísima bibliografía (sobre todo para el inglés) sobre el concepto de pregunta, la relación pregunta-respuesta, etc., pero no sobre la estructura sintáctica que define las cláusulas interrogativas. 4 http://www.agfl.cs.ru.nl/ 5 El formalismo ha sido y continúa siendo desarrollado en el Computer Science Department de la Radboud University of Nijmegen por el profesor C.H.A. Koster y su equipo.

relacionados entre sí mediante un fichero de raíz; posibilidad de la salida del 'parser' como análisis de constituyentes o de dependencias; etc.) que lo convierten en una potente e intuitiva herramienta para la construcción de gramáticas formales.

4. La BDS La BDS 6 es una base de datos con información sintáctica. Elaborada a partir de textos extraídos de la parte contemporánea del Archivo de textos hispánicos de la Universidad de Santiago (ARTHUS), la BDS es el resultado del análisis manual, partiendo de principios constitutivos y funcionales, del contexto sintáctico de aproximadamente 160.000 formas verbales (el verbo y su estructura argumental es, por tanto, el factor en torno al que se articula el corpus). Este análisis comporta información, por un lado, sobre la cláusula en general: su tipo (independiente, coordinada, completiva con que...), su función, su modalidad (declarativa, imperativa, interrogativa...), polaridad, etc; por otro, sobre el verbo: voz, forma flexiva, red argumental (argumentos con los que prototípicamente se asocia), etc; y, finalmente, información sobre todos los argumentos que aparecen en la cláusula: número total de argumentos (computan tanto los plenos como los interrogados y los clitizados), orden en el que se disponen (solo se tienen en cuenta los plenos), tipo de argumento (pleno, clitizado, interrogado...), rasgos semánticos de la unidad (animación), rasgos morfológicos (número, determinación), etc. Se suma a todo esto la posibilidad de acceder al fragmento de texto del que forma parte la cláusula analizada. Toda esta información tan detallada que contiene el corpus, junto a su codificación, permiten realizar consultas lingüísticas muy específicas: sobre un verbo, sobre un tipo de cláusula, sobre un argumento concreto, sobre un esquema, etc., o, lo que es más interesante, sobre varios de estos aspectos combinados. Estas características son las que convierten la BDS en un corpus adecuado para el tipo de información que este trabajo se plantea obtener (recordemos: datos muy concretos sobre la estructura morfosintáctica de un tipo determinado de cláusula del español).

6 Una versión de la base de datos más restringida que la utilizada para el presente trabajo puede consultarse en: http://www.bds.usc.es/

5. La gramática AVALON

Como ya se ha adelantado, el módulo de las interrogativas se integra en la gramática formal AVALON, Álvarez et al. (1998). En consecuencia, y como veremos, gran parte de las características de este vienen determinadas por la estructura de la gramática-marco. AVALON se plantea como una gramática formal de propósito general, orientada al análisis de corpus y a la elaboración de bases de datos lingüísticos. Como gramática formal con una clara orientación lingüística, y frente a gramáticas formales orientadas a tareas más concretas (traductores, sistemas de búsqueda de respuestas, etc.) AVALON presenta un nivel de descripción de las estructuras lingüísticas muy detallado. La gramática formal comparte con la BDS tanto el enfoque lingüístico, de corte funcional, como una serie de características de diseño: funciones clausales contempladas; estructuración de la cláusula a partir del concepto de esquema verbal; esquemas verbales tenidos en cuenta; etc. En cuanto a su macro-estructura, AVALON describe dos grandes tipos de unidades: la frase y la cláusula. Ambos tipos de unidades se tratan a niveles distintos: una serie de módulos se encargan de lo que ocurre a nivel de la frase y otros, los módulos clausales (relacionados, obviamente, con los primeros) dan cuenta de lo que ocurre al nivel de la cláusula. Los módulos clausales (donde se sitúa, como veremos, el nuestro) describen los distintos tipos de cláusulas del español mediante reglas escritas en AGFL que consisten, fundamentalmente, en la combinación de una serie de funciones argumentales y un verbo. Esto significa que, por ejemplo, en el módulo de las interrogativas que describimos en este artículo, estructuras como las siguientes serían equivalentes:

a. ¿Cuándo fue Claudia a Lisboa? b. ¿Cuándo fue tu novia de toda la vida a Lisboa?

En

ambos

casos

tendríamos

la

misma

estructura

a

nivel

clausal:

Interrogativo(funcionando como adjunto) + Sujeto (en cursiva) + Adjunto. Las características internas de esos sujetos no conciernen a las reglas del módulo de las interogativas, sino que se resuelven al nivel de la frase 7.

Como hemos dicho, las reglas a nivel clausal se componen de funciones argumentales y verbo. Las funciones argumentales que contempla AVALON son las siguientes: sujeto (S), complemento directo (DO), complemento

indirecto

(IO),

complemento predicativo (PR), complemento

preposicional (PC) y complemento

agente (A) 8. Cada una de estas funciones puede

aparecer

de

formal

plena,

interrogada o clitizada y a cada una de estas posibilidades le corresponde un no terminal distinto en la gramática. Por ejemplo, en el caso del S:

no terminal para la forma plena func SUBJECT ( ARGUMENT_POSITION, CONST_CATEGORY, PERSON, GENDER, NUMBER) 9

no terminal para la forma interrogada func Interrogative SUBJECT ( CONST_CATEGORY, GENDER, NUMBER )

El verbo constituye a su vez la unidad en torno a la cual se organizan las funciones argumentales que componen las reglas. Se encarga de su descripción el no terminal PREDICATE, que incluye información sobre la voz (activa, media, pasiva, pasiva refleja, etc.), y la red argumental del verbo (se contemplan once posibilidades: S, SDO, SIO, SPC, SPR, SDOIO, SDOPC, SDOPR, SIOPC, SIOPR, SDOIOPC 10), así como sobre otras muchas características tales como el número y la persona.

Dentro de cada uno de los módulos clausales, las distintas reglas escritas en

7 En este artículo no nos ocuparemos, por tanto, de lo que concierne a los módulos de AVALON que funcionan al nivel de la frase. 8 A partir de ahora nos valdremos de estas abreviaturas para referirnos a las funciones sintácticas. 9 No entraremos aquí, pues nos extenderíamos en exceso, en la descripción de los no terminales de AVALON. Solo nos interesa indicar que las distintas formas bajo las que puede aparecer un argumento se corresponden con distintos no terminales de la gramática. 10 La combinación de la información sobre voz y red argumental de cada verbo se denomina en nuestro trabajo, esquema verbal. A modo de ejemplo: SDO/act.

AGFL se ordenan siguiendo un mismo parámetro, el número de argumentos: de más a menos argumentos, siendo el máximo cuatro y el mínimo cero (verbo solo o verbo más clíticos funcionales de OD, OI y/o PR). Este parámetro básico en el diseño de la gramática responde a la voluntad de priorizar un tipo de análisis en el 'parser': aquel donde se identifica el mayor número de argumentos que sea posible (teniendo en cuenta la valencia del verbo).

Mostramos a continuación un ejemplo de una regla del módulo de las interrogativas con dos argumentos (DO interrogado y PC), junto con una cláusula de la BDS con la que se corresponde:

func

Interrogative

DIRECT

OBJECT

(

CONST_CATEGORY,

ANIMATION,

GENDER1, NUMBER1 ),

func

PREDICATE

(sdopc,

act,

PERSON,

NUMBER,

NON_IMPERATIVE,

LEMMA),

func PREPOSITIONAL COMPLEMENT (CONST_CATEGORY, PREPTYPE, MVPERSON );

¿qué opinas de la libertad de la juventud de hoy? (Opinar, Madrid: 187, 15)

Una vez presentada de modo general la gramática AVALON, creemos oportuno enumerar aquellas características de la gramática que determinan, a priori, la estructura de nuestro módulo. Estas características serían:

1. A nivel de la estructura del módulo: - funcionamiento a nivel de la cláusula (no se describe la frase) - disposición de las alternativas (las reglas) por número de argumentos: de más a menos, siendo el máximo cuatro y el mínimo cero.

2. A nivel de la estructura de las reglas: unidades contempladas y características

de esas unidades: - funciones argumentales consideradas (S, DO, IO, PR, PC y A) y verbo.

6. Elaboración del módulo

La construcción del módulo de las interrogativas conlleva, como ya se ha adelantado, por una parte un estudio de corte teórico sobre la morfosintaxis del tipo de cláusula que nos interesa y por otra la propia formalización, es decir, la escritura en AGFL de reglas que describan el funcionamiento de esta cláusula. El estudio morfosintáctico posibilita la escritura de las reglas porque nos permite establecer la estructura de la cláusula interrogativa. Por estructura nos referimos a la combinación en un determinado orden de las unidades contempladas por AVALON: argumentos (los que ya conocemos) y verbo (con un determinado esquema, cf. supra n.10). Para determinar esa estructura se plantean dos fuentes de información: la teoría sintáctica sobre las cláusulas interrogativas directas parciales con un objeto y los datos que nos ofrece la BDS. Es decir: teoría y uso real. La combinación de ambas fuentes de información persigue lograr la máxima cobertura lingüística posible en nuestra descripción de la sintaxis de las interrogativas, si bien es cierto que no existe un equilibrio en el peso de ambas fuentes de información, pues la teoría nos ofrece un punto de partida general, pero son los datos de corpus los que finalmente tienen la última palabra: confirman o refutan la teoría y nos aportan frecuencias de uso, elemento clave, como veremos. Ese deseo de alcanzar la mayor cobertura lingüística posible determina otra de las características de nuestro módulo: la estructuración de las reglas en AGFL en dos bloques: las reglas documentadas en la BDS y las reglas calculadas teóricamente. Las primeras, como su nombre indica, se extraen directamente de la BDS, por lo que, como veremos, permiten su ordenación por frecuencia de uso (de más a menos frecuentes, con lo que se pretende dar prioridad a las reglas que describen las estructuras más presentes en la BDS).

Las segundas son el resultado del cálculo teórico de todas las posibles

combinaciones de los parámetros que entran en juego para la escritura de nuestras reglas, como ya sabemos: argumentos posibles (plenos, interrogados y clitizados) y verbo (con un determinado esquema) en un determinado orden. Como es lógico, las reglas teóricas incluyen las reglas documentadas, por lo que estas últimas son eliminadas de este segundo bloque. Para las reglas teóricas no disponemos de datos de frecuencia (puesto que son reglas inventadas), por lo que su disposición responde, siempre que es posible, a parámetros extraídos del análisis de los datos que nos ofrece la BDS. El grupo de reglas documentadas va en primer lugar, ordenado por frecuencia de uso; le sigue el grupo de reglas teóricas.

6.1. Información teórica sobre la estructura de las interrogativas

Como

hemos

visto,

para

la

formalización

nos

interesa

estudiar,

fundamentalmente, las posibles combinaciones de los constituyentes tenidos en cuenta en AVALON (argumentos contemplados más verbo con un determinado esquema). Ya hemos adelantado que la teoría nos ofrece información sobre el orden de constituyentes 11 en las cláusulas interrogativas. Respecto a este parámetro, las interrogativas parciales se comportan de un modo particular: al contrario de lo que ocurre con la mayoría de las cláusulas del español, que se caracterizan por su orden libre, las interrogativas parciales se definen, en general, por presentar un orden de constituyentes relativamente rígido. Ese orden sería el siguiente: Constituyente Interrogativo + Verbo + Argumentos (en orden relativamente libre) 12

No vamos a entrar aquí, pues lo que nos interesa ahora mismo es la formalización, en los porqués de esta estructura rígida; apuntaremos tan sólo que está relacionada con la prominencia semántica dentro de la cláusula del constituyente interrogado, que es su foco, Escandell (1999: 3934). Además de este orden prototípico, la teoría contempla otro, menos común:

11 La teoría nos ofrece información sobre muchos otros aspectos, pero nos limitamos al orden por ser la parte clave para la formalización. 12 Los argumentos posverbales no son obligatorios: lo fundamental son el constituyente interrogativo y el verbo: ¿Quién vino?

Constituyente Interrogativo (en función circunstancial) + Argumento+ Verbo + Argumentos (en orden relativamente libre)

Esta estructra solo se da, en principio, cuando el constituyente interrogado funciona como adjunto (por qué, cuándo, dónde, etc), Torrego (1984), Goodall (2004). 6.2. Información de corpus sobre las interrogativas 13

Como ya hemos adelantado, la información que nos ofrece la BDS sobre las interrogativas es clave en la construcción de nuestro módulo, a distintos niveles: por un lado, ofrece información sobre su morfosintaxis (orden de los constituyentes; interrogativos más frecuentes; esquemas verbales más frecuentes; etc.); por otro, la utilización de parte de esa información lingüística permite la elaboración y ordenación de las reglas teóricas; finalmente, permite la construcción de las reglas documentadas, con sus frecuencias de uso.

6.2.1. El orden de las interrogativas según la BDS Los datos de la BDS 14 confirman la teoría: existe un orden prototípico en las interrogativas directas parciales con un objeto. Ese orden se da en el 97,5% de los casos documentados en la base de datos. Cabría esperar que, según la teoría, el escasísimo 2% restante se correspondiese al otro orden posible, recordemos:

Constituyente Interrogado (funcionando como adjunto) + Argumento+ Verbo + Argumentos (en orden relativamente libre)

Pues bien, esto es así solo en parte, ya que la BDS nos ofrece un nuevo tipo de 13 Debido a que nos interesa centrarnos en el proceso de construcción de los distintos bloques de alternativas (teóricas y documentadas), no nos ocuparemos aquí del proceso de extracción de datos de la BDS. 14 Por supuesto la BDS nos ofrece mucha más información, además del orden, sobre nuestras interrogativas, pero al igual que hemos hecho cuando tratábamos la información teórica, nos detendremos ahora tan solo en el análisis de este aspecto por ser este un elemento clave en la formalización.

orden, más frecuente incluso que el previsto por la teoría:

Argumento + Constituyente Interrogado + Verbo + Argumentos (en orden relativamente libre)

En nuestro trabajo (y por razones que no cabe explicar ahora), hemos denominado a este tipo de estructura anteposición tipo A, y a la anunciada por la teoría, anteposición tipo B. La anteposición tipo A es, como adelantábamos, más frecuente (dentro de su rareza) que la tipo B: un 1,8% frente a un 0,75%. 15

6.3. Escritura de las reglas documentadas

El trabajo con los datos de la BDS no solo ha aportado información sobre las características de las interrogativas sino que también ha permitido la elaboración directa de las reglas documentadas. No describiremos aquí en profundidad el proceso de extracción de datos que desembocó en la escritura de las reglas, simplemente apuntaremos que el resultado final consistió en lo que hemos denominado configuraciones con un determinado orden: combinaciones de argumentos (plenos, clitizados o interrogados) correspondientes a un determinado esquema verbal, en un determinado orden. Un ejemplo de una de esas configuraciones con un determinado orden sería el siguiente:

Interrogativo (funcionando como adjunto) + clítico de IO + Verbo (en voz activa) + Sujeto + Complemento Directo

patrón que se correspondería con el siguiente ejemplo (extraído de BDS):

¿cómo va a enseñarle Andrea lo que ni siquiera barrunta? [Enseñar, Sonrisa: 331, 25]

Sobre cada una de las configuraciones tenemos además datos de frecuencia de 15 Ambos tipos de estructura poseen una serie de rasgos definidos, más allá del orden de los constituyentes, pero profundizar en estos aspectos nos conduciría más allá de los límites de este artículo.

uso; la anterior, por ejemplo, aparece cuatro veces en la BDS. Cada una de estas configuraciones se corresponde con una regla documentada del módulo de las interrogativas, que se estructura, como ya hemos adelantado, por esos datos de frecuencia de uso, de más a menos frecuente (para dar así prioridad en el análisis del 'parser' a las estructuras más comunes en BDS).

6.4. Información sintáctica para la elaboración y ordenación de las reglas teóricas

Para la elaboración de las reglas teóricas, el dato fundamental a tener en cuenta es el orden de los constituyentes (vid. supra). Debido a que no poseemos datos de frecuencia que nos permitan establecer prioridades entre las reglas teóricas, determinadas características de nuestras interrogativas extraídas del análisis de los datos que nos aporta la BDS se utilizan para establecer criterios de ordenación. Se tienen en cuenta los datos de frecuencia relativos a cada una de esas características, de modo que se intenta dar prioridad a aquello que, según los datos de la BDS, es más común. Las características que se tienen en cuenta son: voz verbal; función del interrogativo (argumento/adjunto); esquema verbal; presencia/ausencia de clíticos. Se establecen así los siguientes criterios de ordenación:

1. Número de argumentos: criterio que establece la estructura de AVALON.

2. Voz: las alternativas en voz activa y media tienen prioridad sobre las alternativas en voz pasiva. Esto es así porque en la BDS no hay casos de nuestras interrogativas en pasiva.

3. Tipo de Interrogativo: los interrogativos en función argumental tienen preferencia sobre los interrogativos en función de adjunto. En la BDS los casos con interrogativos en función argumental suponen el 63% del total (esta mayor frecuencia se da para cada número de argumentos) mientras que los casos con interrogativos en función de adjunto suponen el 37%. 4. Esquema verbal: se tienen en cuenta las frecuencias de los esquemas verbales

contemplados por AVALON. Por ejemplo, los tres esquemas más comunes son: SDO/act (36%), SPC/act (13%) y S/act (10%). El resto de los esquemas está por debajo del 10%.

5. Presencia/Ausencia de clíticos: las alternativas sin clíticos tienen prioridad sobre las alternativas con clíticos. En la BDS los casos con clíticos suponen tan solo el 21% del total.

La jerarquía anterior establece los siguientes bloques en las reglas teóricas:

1. Todos los casos en voz activa, sin clíticos, ordenados por esquema: primero con interrogativos argumentales; después con interrogativos circunstanciales.

2. Lo mismo que en el apartado 1., pero con clíticos.

3. Todos los casos en pasiva, ordenados como en 1. y 2. (primero sin clíticos, luego con clíticos).

6.5. Reglas teóricas vs. reglas documentadas

Llegados a este punto, una vez explicado, de modo muy general, el proceso llevado a cabo para la elaboración del módulo de las interrogativas y las características más importantes de este, consideramos interesante establecer una comparación entre los dos bloques de reglas 16. En primer lugar, si tenemos en cuenta el total de posibilidades teóricas y calculamos qué proporción de ese total corresponde a las reglas documentadas en la BDS, resulta que tan solo un 20,68% de ese total está documentado. Reflexionemos un instante sobre lo que esto supone: de todas las combinaciones lingüísticamente posibles para nuestras interrogativas (teniendo siempre en cuenta los parámetros de AVALON), solo se documentan en la BDS (y con frecuencias muy dispares) en torno a un 20%; el

16 Queremos aclarar que estos datos no son todavía definitivos: no se tienen en cuenta aquí las alternativas teóricas en voz pasiva, que se encuentran todavía en fase de elaboración. Se comparan, por tanto, solo las alternativas teóricas en voz activa/media con las alternativas documentadas (donde, recordemos, no hay casos de pasiva).

restante 80%, simplemente, no está documentado. Si atendemos a estos datos por número de argumentos (recordemos que las reglas del módulo se estructuran, en primer lugar, teniendo en cuenta este parámetro), obtenemos los siguientes resultados:

Nº ARGUMENTOS

Alternativas posibles

Alternativas documentadas

teóricamente CUATRO

92

0

TRES

197

5 (2.53%)*

DOS

161

34 (21,11%)

UNO

76

55 (72,36%)

CERO

25

20 (80%)

*% calculado sobre el total de reglas teóricas para cada nº. de argumentos, en este caso, 197

Como vemos claramente en la tabla, el uso real se acerca a lo lingüísticamente posible a partir de dos argumentos. Este dato viene a reforzar una conclusión que se extrae también del mero análisis de las estructuras documentadas en la BDS: para nuestras interrogativas, es extremadamente extraño encontrar documentados casos con tres (imposible cuatro) argumentos plenos; lo más común es que el número máximo de argumentos sea dos, siendo las posibilidades más comunes uno o cero.

7. Futuras direcciones de trabajo: Integración en un sistema de Búsqueda de Respuestas (BR)

La elaboración del módulo de las interrogativas que hemos presentado, sucintamente, en este trabajo, nos ha permitido alcanzar un doble objetivo: por un lado, elaborar una herramienta práctica (el propio módulo), por otro, establecer un método de trabajo para construir los distintos módulos clausales de la gramática AVALON.

Partiendo de este hecho, de cara al futuro nos planteamos la construcción de distintos módulos clausales para los distintos tipos de interrogativas de modo que, en un plazo de tiempo no muy extenso, consigamos una gramática formal que describa de modo exhaustivo y completo la interrogación en español. A su vez, esos módulos, mediante la adaptación que sea oportuna en cada caso, están pensados para su utilización en aplicaciones lingüísticas concretas. A largo plazo, nuestro objetivo es la integración, llevando a cabo las modificaciones que sean necesarias, de nuestros módulos de las interrogativas en un sistema de búsqueda de respuestas. En concreto, los módulos se ocuparían de la primera operación que se realiza en la mayoría de estos sistemas: el análisis de la estructura de la pregunta y el planteamiento de la estructura de la posible respuesta. BIBLIOGRAFÍA CITADA ÁLVAREZ LEBREDO, Conchita et al., 1998. «AVALON, una gramática formal basada en corpus», Procesamiento del lenguaje natural, 23-132. CONTRERAS, Helen, 1999. «Relaciones entre las construcciones interrogativas, exclamativas y relativas», en Gramática descriptiva de la lengua española. Madrid: Espasa Calpe, 2. ESCANDELL VIDAL, María Victoria, 1988. La interrogación en español: semántica y pragmática. Madrid: Editorial de la Universidad Complutense. ESCANDELL VIDAL, María Victoria, 1999. «Los enunciados interrogativos. Aspectos semánticos y pragmáticos”, en Gramática descriptiva de la lengua española. Madrid: Espasa Calpe, 3. GOODALL, Grant, 2004. «On the Syntax and Processing of Wh-Questions in Spanish», en Proceedings of the 23rd West Coast Conference on Formal Linguistics. California: Davis. 101-114. KOSTER, Cornelius, 1991. «Affix grammars for natural languages», en Attribute Grammars, Applications and Systems, Lecture Notes In Computer Science. Heidelberg: Springer-Verlag, 545. 469484. ROJO, Guillermo, 1978. Cláusulas y oraciones. Santiago de Compostela: Universidad de Santiago de Compostela. ROJO, Guillermo y Tomás JIMÉNEZ JULIÁ, 1989. Fundamentos del análisis sintáctico funcional. Santiago de Compostela: Lalia 2, Universidad de Santiago de Compostela. ROJO, Guillermo, 1993. «La base de datos sintácticos del español actual», Español Actual, 59-15. TORREGO, Esther, 1984. «On Inversion in Spanish and ome of its Effects», Linguistic Inquiry 15- 103.

Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.