Historia de la lengua, lingüística de corpus y cambio lingüístico. En torno a la irrupción de las Nuevas Tecnologías en la investigación histórica del español

July 27, 2017 | Autor: S. Vicente Llavata | Categoría: Diachronic Linguistics (Or Historical Linguistics), Languages and Linguistics, Historical Linguistics, Dialectology, New Communication Technologies, Linguistics, Historical Phraseology, Corpora Linguistics, Linguistics, Historical Phraseology, Corpora Linguistics

Share Embed

Laporkan tautan ini

Descripción

ANALECTA MALACITANA REVISTA DE LA SECCIÓN DE FILOLOGÍA DE LA FACULTAD DE FILOSOFÍA Y LETRAS

UNIVERSIDAD DE MÁLAGA XXXVI, 1-2 (2013)

UNIVERSIDAD DE MÁLAGA

ÍNDICE

ARTÍCULOS R AQUEL VELÁZQUEZ VELÁZQUEZ, La reescritura de los textos bíblicos en la novela española del siglo XX ......................................................................... MARCOS RUIZ SÁNCHEZ, Versiones latinas del cuento del tesoro del ciego ......... JOSÉ MANUEL PEDROSA, Los zapatos rotos del Lazarillo de Tormes ................... FERNANDO DURÁN LÓPEZ, Una autobiografía de 1745, o la rueda de la fortuna de Joaquín de la Ripa ............................................................................................... AMELINA CORREA R AMOS, Mater et magistra: Reconstrucción de la trayectoria profesional de Vicenta Lorca, con la aportación de algunos documentos inéditos ......................................................................................................... FRANCISCO GONZÁLEZ GARCÍA, Amado Monstruo de Javier Tomeo: Un análisis del componente teratológico de la obra ...................................................... MARY GRIFFITH BOURN, Identity and tragedy in Roth’s The Human Stain .......

7 45 71 101

135 161 197

NOTAS ROBERTO CUADROS MUÑOZ, Más datos sobre el paradigma demostrativo en documentación diplomática del Siglo de Oro: Una aproximación desde el corpus CODEA ........................................................................................................... LIVIA CRISTINA GARCÍA AGUIAR, Variación en documentos municipales malagueños del siglo XVIII ......................................................................................... REBECA SANMARTÍN BASTIDA, Santa Teresa y la herencia de las visionarias del medievo: De las monjas de Helfta a María de Santo Domingo .............. ANUCHKA RAMOS RUIZ, Apuntes sobre el periodismo de Cortázar ................... AGNIESZKA MATYJASZCZYK GRENDA, El cuento literario en Polonia: Origen y evolución del género hasta el siglo XIX ...............................................................

223 261 275 289 297

BIBLIOTECA The Middle English version of The Book of Nativities in London, Wellcome Library, MS Wellcome 411, ff. 9v-18v (edited by Javier Calle-Martín and Jesús Romero-Barranco) ........................................................................................

307

COMENTARIO BIBLIOGRÁFICO JOSÉ POLO, Notas de carácter metodológico, bibliográﬁco, ortotipográﬁco y de técnica del trabajo cientíﬁco alrededor de dos importantes obras «lingüístico-discursivas» en el entorno de Coseriu .............................................................. SANTIAGO VICENTE LLAVATA, Historia de la lengua, lingüística de corpus y cambio lingüístico. En torno a la irrupción de las Nuevas Técnologías en la investigación histórica del español .................................................................................. [3]

349

393

RECENSIONES [págs. 425-478] MANFRED FURHMANN, La teoría poética de la Antigüedad. Aristóteles-Horacio- ‘Longino’ (Antonio de Murcia Conesa) ESTEBAN T. MONTORO DEL ARCO (ed.), Neología y creatividad lingüística (Marta Torres Martínez) JAVIER DE SANTIAGO GUERVÓS, Estrategias para el análisis sintáctico (Antonio Daniel Fuentes González) SARA ROBLES ÁVILA Y JESÚS SÁNCHEZ LOBATO (coords.), Teoría y práctica de la enseñanza-aprendizaje del español para ﬁnes especíﬁcos (Higinio Pareja Martín) DOMNITA DUMITRESCU Y GERARDO PIÑA-ROSALES (eds.), El español en los Estados Unidos: E Pluribus Unum? Enfoques multidisciplinarios (Francisco M. Carriscondo Esquivel) JULIO VALDEÓN BARUQUE, Cristianos, judíos y musulmanes (Enric Mallorquí-Ruscalleda y Alisa J. Tigchelaar) PEDRO DE VALENCIA, Epistolario (Mª José Ormazábal Seviné) HÉCTOR BRIOSO SANTOS Y ALEXANDRA CHERECHES (coords.), «Callando pasan los ligeros años...»: El Lope de Vega joven y el teatro antes de 1609 (Ismael López Martín) JUAN VARO ZAFRA, Estudios sobre la prosa de Diego Hurtado de Mendoza (José Ignacio Fernández Dougnac) ÁNGEL DE SAAVEDRA, DUQUE DE RIVAS, Poesías completas (Cecilia Riva) Mª PILAR CELMA VALERO Y Mª JOSÉ RODRÍGUEZ SÁNCHEZ DE LEÓN (eds.), Miguel Delibes. Nuevas lecturas críticas de su obra (Miguel Amores Fuster) JULIO CÉSAR JIMÉNEZ, Las categorías de Kant no funcionan en la noche (Juan Carlos Abril) FERNANDO MILLÁN, Escritores radicales. Obras In-completas (Raúl Díaz Rosales) RAOUL SCHROTT Y ARTHUR JACOBS, Gehirn und Gedicht, Wie wir unsere Wirklichkeiten Konstruieren (Vicente Gil Carrió) PEDRO AULLÓN DE HARO, Estética de la lectura: una teoría general (Marina García Mérida) JESÚS G. MAESTRO, Genealogía de la Literatura. De los orígenes de la Literatura, construcción histórica y categorial, y destrucción posmoderna, de los materiales literarios (Jesús Maire Bobes) TERRY EAGLETON, Dulce violencia. La idea de lo trágico (José Luis Calvo Landau) MARÍA GIOIA TAVONI, Circumnavigare il testo. Gli indici in età moderna (Mercedes López Suárez) GERMÁN SANTANA HENRÍQUEZ (ed.), Literatura y cine (Luis Unceta Gómez) Mª ROSARIO MARTÍ MARCO, Wilhelm von Humboldt y la creación del sistema universitario moderno (Mª Teresa del Olmo) RESÚMENES PARA REPERTORIOS BIBLIOGRÁFICOS [págs. 479-489] NORMAS DE EDICIÓN [págs. 491-497]

R EFERENCIAS DE CALIDAD E ÍNDICES DE IMPACTO [pág. 499] R EVISTAS DE INTERCAMBIO [www.anmal.uma.es]

[4]

HISTORIA DE LA LENGUA, LINGÜÍSTICA DE CORPUS Y CAMBIO LINGÜÍSTICO

en torno a la irrupción de las Nuevas Tecnologías en la investigación histórica del español1 SANTIAGO VICENTE LLAVATA Universitat de València

ANDRÉS ENRIQUE-ARIAS (ed.), Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus, Iberoamericana / Vervuert (Col. Lingüística Iberoamericana), Madrid / Fráncfort, 2009, 416 págs.

Preliminares De un tiempo a esta parte, el mundo de la Tecnología ha incidido poderosamente en los varios ámbitos que conforman la sociedad contemporánea. Se trata, sin duda, de un signo de nuestro tiempo. Simpliﬁcando conscientemente esta compleja realidad2 existen, al menos, tres rasgos que caracterizan a las

1 Este comentario bibliográfico se inscribe en el proyecto de investigación HISPROCAST : Historia de la pronunciación de la lengua castellana: de la Edad Media a nuestros días, dirigido y coordinado por la Dra. Mª Teresa Echenique Elizondo y subvencionado por el Ministerio de Ciencia e Innovación (FFI2009-09639, subprograma FILO). 2 Para una descripción de las características principales de las Nuevas Tecnologías, véase J. Cabero Almenara, Nuevas Tecnologías aplicadas a la Educación, McGraw-Hill, Madrid, 2007.

[393]

AnMal, XXXVI, 1-2 , 2013, págs. 393-421

394

AnMal, XXXVI, 1-2, 2013

SANTIAGO VICENTE LLAVATA

Nuevas Tecnologías y que nos interesa destacar para nuestro propósito: su inmaterialidad, su instantaneidad y su capacidad de digitalización. Por lo que respecta al primero, la información, en sus múltiples códigos (visuales, auditivos, etc.) y formas, constituye la materia prima. Por su parte, lo instantáneo viene determinado por la velocidad a la que se accede a bases de datos, a contactos entre personas, instituciones, etc. Finalmente, la digitalización supone transformar la concepción de la escritura de formato tradicional (papel) en un formato innovador (dígitos)3. Pocos ámbitos han permanecido ajenos a este nuevo signo y, dentro de las varias esferas del conocimiento, el ámbito de las Humanidades no ha constituido una excepción4. Si la implantación de los «Studia Humanitatis» y la llegada de la imprenta supuso una auténtica revolución antropológica y cultural a las puertas del Renacimiento hispánico5, también la irrupción de las Nuevas Tecnologías en nuestros días supone todo un reto a la hora de describirlas, valorarlas y, sobre todo, integrarlas con los procedimientos «tecnológicos» existentes. No es, en absoluto, una tarea fácil, pues surgen, de modo inevitable, puntos de vista divergentes a la hora de interpretar esas nuevas realidades. Esas valoraciones presentan, en ﬁn, unos extremos muy bien deﬁnidos: desde el entusiasmo ciego que abraza apasionadamente esas nuevas herramientas tecnológicas, hasta la cerrazón absoluta, escéptica ante cualquier atisbo de innovación.

3 M. Seco, O. Andrés y G. Ramos, Diccionario del español actual, Aguilar Lexicografía, Madrid, 1999, s. v. Digital 2 , en su acepción tercera, define esta voz en estos términos: «que opera mediante el uso de señales discretas para representar datos en números o letras». 4 Dentro del vasto ámbito de las Humanidades, requiere especial relevancia el ámbito de la Educación, por su importancia fundamental en todo tiempo. De entre los innumerables recursos tecnológicos a nuestra disposición en Internet, nos gustaría destacar la página web de Antoni Ballester, de la Universitat de les Illes Balears, dedicada a la difusión del Aprendizaje Significativo: . 5 R. Lapesa, Historia de la lengua española, Gredos, Madrid, 81981, pág. 267, evoca este nuevo signo en el Cuatrocientos en estos bellos términos: «La antigüedad no es para los hombres del siglo XV simple materia de conocimiento, sino idea superior que admiran ciegamente y pretenden resucitar, mientras desdeñan la Edad Media en que viven todavía y que se les antoja bárbara en compraración con el mundo clásico. Alfonso V concierta una paz a cambio de un manuscrito de Tito Livio». Por su parte, Á. Gómez Moreno, «Del Duecentro al Quattrocento: Italia en España, España en Italia», Ínsula. Revista de letras y ciencias humanas, 757-758, 2010, pág. 10, incide también en ese cambio de paradigma que ya se atisbaba: «Más importa el hecho de que, al final del siglo XV, en España hubiesen triunfado los ideales lingüísticos del Humanismo, con la enseñanza universitaria del griego, la búsqueda de un latín próximo a los clásicos y la exaltación del castellano por su mayor parecido con la lengua del Lacio. También los géneros humanísticos (epístolas, discursos y diálogos, o la historiografía y la biografía) encontraron el terreno abonado en nuestra tierra. La rápida aclimatación de las ideas y los patrones de la Italia de los humanistas es el lógico resultado de dos fenómenos: en primer lugar, los vínculos preferentes que la unían con la Corona de Aragón; en segundo, las estancias cada vez más frecuentes y prolongadas de españoles (vale decir, castellanos, aragoneses y portugueses) en tierra italiana, que sumaban por lo común los motivos profesionales a la pasión erudita».

HISTORIA DE LA LENGUA

AnMal, XXXVI, 1-2, 2013

395

Y, como siempre, en el medio6, una inﬁnita y tupida gama de grises, en la que, muy probablemente, resida la respuesta a tan oscuro enigma... Precisamente, en el ámbito de estudio conocido secularmente con la denominación de Filología, hace ya tiempo que asisitimos a la difusión y consolidación de numerosos avances tecnológicos en disciplinas como la Crítica Textual, Lexicografía o la Didáctica de lenguas extranjeras, entre otras muchas. En el caso de la primera, la aparición de los primeros ordenadores y de sus instrumentos auxiliares de computación supuso la creación del sistema de concordancias como medio eﬁcaz para ensayar diferentes análisis de tipo cuantitativo y estadístico. En segundo lugar, la aparición de nuevos formatos como el CD-Rom —y, sobre todo, el DVD-Rom— comportó en su día una concepción innovadora en el proceso de elaboración y de recepción de los diccionarios, con sus consiguientes opciones de interactividad desde el punto de vista del receptor. En cuanto a la Didáctica de lenguas extranjeras, en los últimos años se ha asistido a una abrumadora producción de materiales multimedia de diverso tipo (CD-Rom, wikis, chats, etc.), con el único objetivo de potenciar el aprendizaje autónomo, así como de hacer más atractivo el proceso de enseñanza y de aprendizaje. Desde un tiempo relativamente reciente, otra disciplina en la que se ha hecho notar la irrupción de las Nuevas Tecnologías7 constituye el ámbito de la Lingüística histórica. Particularmente interesante se muestra esta esfera del saber humanístico en el concierto de los restantes ámbitos de estudio, pues en ella existe una materialidad innegable, base primera de todo estudio ﬁlológico: los textos del pasado. En esa irrupción de diferentes herramientas tecnologías en el citado ámbito, destaca por encima de todas ellas el diseño de corpus diacrónicos digitales, consultables desde un servidor web. En los últimos tiempos se viene reclamando, pues, la atención y estudio sobre la edición electrónica del patrimonio documental existente, con el ﬁn último de conformar corpus diacrónicos digitales para poder estudiar, a partir de su uso sistemático y coherente, cada una de las manifestaciones lingüísticas que atesora una lengua o modalidad lingüística determinadas. Ahora bien, es muy importante señalar que la Historia de la lengua siempre ha trabajado con grandes bancos de datos (corpus lingüísticos individuales y colectivos), entendidos como una exigencia

El eterno In medio virtus aristotélico (Ética a Nicómaco). A este respecto, una de las aplicaciones tecnológicas que está cobrando más impulso consiste en la creación, mancomunada o no, de blogs sobre diferentes aspectos relacionados con la Historia de la lengua, como el blog de Lola Pons Rodríguez (Universidad de Sevilla), titulado Nosolodeyod; el blog mantenido por Mª José García Folgado (Universitat de València), Esteban Tomás Montoro del Arco (Universidad de Granada), Ricardo Gómez (Universidad del País Vasco / Euskal Herriko Unibertsitatea), Marta Torres Martínez (Universidad de Jaén) y Mara Fuertes Gutiérrez (Leeds Metropolitan University) titulado Intrahistoriografía o el dedicado a la morfología y a la historia de la lengua titulado Morflog, administrado por Elena Azofra (Universidad Nacional de Educación a Distancia). 6

7

396

AnMal, XXXVI, 1-2, 2013

SANTIAGO VICENTE LLAVATA

metodológica indispensable a la hora de estudiar la evolución de un fenómeno lingüístico8, y no como un ﬁn en sí mismos9. El volumen que pretendemos describir y valorar en este comentario bibliográﬁco constituye, pues, ejemplo paradigmático de cuanto aquí se aﬁrma. El libro constituye el resultado editorial del Coloquio internacional sobre corpus diacrónicos en lenguas iberorromances, celebrado en la Universitat de les Illes Balears durante los días 25, 26 y 27 de octubre de 200710. Ese resultado se distribuye, tal como se detalla en la Introducción, entre una selección de ponencias y de comunicaciones presentadas y debatidas en el citado coloquio. El volumen pretende dar cuenta, pues, del estado de las investigaciones actuales en torno al diseño y al uso de corpus diacrónicos digitales en el ámbito de las lenguas iberorromances. De entrada hay que señalar la oportunidad y conveniencia de un volumen dedicado monográﬁcamente a esta realidad cientíﬁca materializada en bancos de datos, orientados a sistematizar y ordenar la minuciosa tarea del estudio diacrónico de una gran diversidad de fenómenos lingüísticos. A nuestro modo de ver, el principal beneﬁcio que aporta este volumen al ámbito de estudio de la lingüística histórica es el de conformarse como un espacio de reﬂexión metodológica acerca de cómo abordar la investigación histórica de las lenguas iberorromances11. A este acierto esencial, 8 En toda investigación histórica, la creación de una base de datos constituye, pues, una fase previa a cualquier teorización. Por poner algún ejemplo modélico de cuanto afirmamos, véanse a este respecto, los estudios de morfosintaxis histórica de Rafael Lapesa (R. Lapesa, Estudios de morfosintaxis histórica del español, ed. de R. Cano Aguilar y Mª T. Echenique Elizondo, Gredos, Madrid, 2000 [1962]), articulados en torno a un gran banco de datos, orientado a teorizar sobre los diferentes usos lingüísticos en el ámbito de la Historia de la lengua. 9 Así lo afirma Mª T. Echenique Elizondo, «Notas de sintaxis histórica en el marco del corpus de diacronía fraseológica del español (DIAFRAES)», en E. Stark, R. Schmidt-Riese y E. Stoll (eds.), Romanische Syntax in Wandel, Gunter Narr Verlag, Tubinga, 2008, pág. 387: «[...] Para Lapesa, la Lingüística de Corpus era una exigencia previa a la teorización, si bien no un fin en sí mismo». 10 Para la redacción de este comentario bibliográfico, nos han sido de gran ayuda las reseñas publicadas hasta el momento sobre esta misma publicación: C. Buenafuentes de la Mata, «Reseña de Andrés Enrique-Arias (ed.) (2009): Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus», Revista de Historia de la Lengua Española, 5, 2010, págs. 188-195. F. J. Pueyo Mena, «Reseña de Andrés Enrique-Arias, ed. (2009): Diacronía de las lenguas iberorrománicas», Infoling, [20 / 11 / 2010]. L. C. García Aguiar, «Reseña de Andrés Enrique-Arias, ed. (2009): Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus», Analecta Malacitana, XXXIV, 1, 2011, págs. 263-268. 11 Algunas muestras del gran interés que suscita la Lingüística de corpus en la investigación histórica del español se concreta en algunas iniciativas científicas recientes, dedicadas a reflexionar también sobre el uso de corpus diacrónicos en el quehacer investigador. Así, la mesa redonda celebrada en el marco del VIII Congreso Internacional de Historia de la Lengua Española (Santiago de Compostela, 2009), la creación de una publicación electrónica, Scriptum Digital. Revista de corpus diacrónicos y edición digital en lenguas iberorrománicas, dirigida por Joan Torruella (UAB) y por Andrés Enrique-Arias (UIB) o las dos ediciones, celebradas respectivamente en Madrid y en Neuchâtel, de las jornadas tituladas Tradición e innovación. Nuevas perspectivas en torno a la edición de textos, son una buena

AnMal, XXXVI, 1-2, 2013

HISTORIA DE LA LENGUA

397

habría que añadir también que el volumen cumple sobradamente con uno de sus objetivos prioritarios, a saber: la capacidad de aglutinar en un mismo volumen el conjunto de áreas iberorromances que desarrollan actualmente corpus digitales para el estudio de dicha modalidad lingüística. El volumen presenta, a nuestro entender, una estructura fuertemente cohesionada y, al mismo tiempo, hábilmente diversiﬁcada en razón de las múltiples dimensiones que planean en torno al diseño y explotación de corpus diacrónicos digitales. El libro se estructura, pues, en seis secciones que intentan dar cuenta de las dimensiones a que hacíamos referencia. Como se podrá apreciar, hay secciones que se sitúan de una manera más próxima en el aspecto empírico (y organizativo) de la constitución de corpus, como es el caso de las secciones segunda y tercera, tituladas respectivamente «Diseño de corpus para ﬁnes especíﬁcos» y «Cuestiones de arquitectura informática». La sección primera, en cambio, aunque también presenta de manera directa aspectos relativos al diseño de corpus, como son la forma de presentación de los documentos o las formas de representar (y hacer visible) las dimensiones diatópicas, diastráticas y diafásicas de la lengua, contiene como particularidad el estudio previo de la materialidad histórica de los textos; tarea previa, por tanto, a su constitución como elementos básicos de un corpus determinado. Por su parte, las secciones cuarta y sexta, tituladas respectivamente «Corpus y variedades iberorromances» y «Aplicaciones del uso de corpus en la historia del español», presentan un claro nexo común: demostrar la idoneidad y la capacidad de respuesta de diferentes corpus con relación a la explicación de un fenómeno lingüístico. Finalmente, creemos que la sección quinta, titulada «La Biblia como corpus», por su especiﬁcidad y por su carácter monográﬁco, debe formar, en efecto, capítulo aparte en el conjunto, si bien la metodología utilizada no diﬁere en su aspecto fundamental con la de secciones anteriores, esto es: partir de un corpus —en este caso, el corpus de Biblia Medieval— y considerar su idoneidad con relación a determinados fenómenos lingüísticos en el marco de la investigación histórica del español. Una particularidad interesante de esta sección reside en explicitar de manera constante la relación estrecha entre el diseño de corpus diacrónicos digitales y los principios de las Tradiciones Discursivas; relación que abordaremos en algunas de las secciones que siguen. I La sección primera, titulada «Cuestiones ﬁlológicas», se compone de tres contribuciones que abordan la difícil tarea de homogeneizar las diferentes formas de presentar los textos que conforman cada uno de los corpus diseñados. En muestra de ello. La última de estas jornadas, celebrada en Neuchâtel, ha sido editada por P. Sánchez-Prieto Borja y Mª J. Torrens Álvarez (eds.), Nuevas perspectivas para la edición y estudio de documentos hispánicos antiguos, Peter Lang (Col. Fondo Hispánico de Lingüística y Filología, 12), Berna, 2012.

398

AnMal, XXXVI, 1-2, 2013

SANTIAGO VICENTE LLAVATA

el trabajo «El Corpus de Documentos Españoles Anteriores a 1700 (CODEA)», escrito por Pedro Sánchez-Prieto Borja, Florentino Paredes García, Rocío Martínez Sánchez, Ruth Miguel Franco, María Simón Parra e Irene Vicente Miguel, se presenta este novedoso corpus, conformado a partir de documentos del español anteriores a 170012. En esa declaración metodológica de intenciones, común a los proyectos de investigación que forman parte de la red internacional CHARTA, se hace hincapié en la necesidad de dar a conocer los documentos a partir de una triple forma de presentación: edición paleográﬁca, facsimilar y presentación crítica13. Otros principios metodológicos relevantes se basan en delimitar tanto el criterio textual (con una decidida prioridad por la representación de documentos administrativos), como el criterio geográﬁco, en el que se atiende prioritariamente al lugar de emisión frente al de conservación. Finalmente, dado que el proyecto se encuentra en una fase inicial, en el momento de redacción del presente capítulo todavía no era posible su consulta con vistas a realizar tentativas de análisis ﬁlológico y lingüístico. Con todo, este corpus ya se encuentra disponible para su consulta y explotación14. En su consulta se pueden apreciar las diferentes variables que entran en juego, como son el archivo de procedencia y provincia (lugar de emisión) y el ámbito de uso del texto (cancilleresco, eclesiástico, judicial, municipal y particular), con sus propias especiﬁcidades. Respecto a su presentación, se visualiza el documento mediante una transcripción paleográﬁca y una presentación crítica, dispuestas en columnas. En una línea metodológica común se sitúa el trabajo titulado «Los documentos americanos (o indianos) en la red CHARTA», redactado por Micaela Carrera de la Red y Miguel Gutiérrez Maté. En él se ﬁja la atención en el reto que supone adecuarse a la homogeneidad de los criterios de presentación de documentos en el marco de la red internacional CHARTA. Como tarea previa y genérica en el marco de este macrocorpus, se destaca la relación estrecha que se establece entre la edición ﬁlológica y los nuevos medios electrónicos de edición de textos. En un terreno más concreto, se reﬂexiona sobre la variación textual de los documentos, la cual condiciona poderosamente la «regularización gráﬁca o el mantenimiento de grafías especíﬁcas» (pág. 42), pues se parte 12 Véanse también los estudios siguientes: P. Sánchez-Prieto Borja, «Un corpus para el estudio integral de fuentes documentales (CODEA)», en E. Montero Cartelle y C. Manzano (eds.), Actas del VIII Congreso Internacional de Historia de la Lengua Española, Arco / Libros, Madrid, 2012, págs. 2479-2500, y P. Sánchez-Prieto Borja, «Desarrollo y explotación del Corpus de Documentos Españoles Anteriores a 1700 (CODEA)», Scriptum digital. Revista de corpus diacrónicos y edición digital en lenguas iberorrománicas, 1, 2012, págs. 5-35. 13 Esa propuesta de criterios de edición se puede ver en P. Sánchez-Prieto Borja, La edición de textos españoles medievales y clásicos. Criterios de presentación gráfica, Cilengua, San Millán de la Cogolla, 2011. 14 Así lo hemos comprobado con la consulta de un texto perteneciente al Archivo Municipal de Toledo. GITHE (Grupo de Investigación de Textos para la Historia del Español): Banco de datos (CODEA) [en línea]. Corpus de Documentos Españoles Anteriores a 1700: [fecha de consulta: 15 de febrero de 2013].

HISTORIA DE LA LENGUA

AnMal, XXXVI, 1-2, 2013

399

de la constatación de que los «documentos americanos nos ofrecen un sistema ortográﬁco extremadamente complejo» (pág. 42). En este sentido, los autores destacan dos factores de primera importancia a la hora de enfrentarse a la tarea compleja de aquello que se ha dado en llamar «regularización gráﬁca»: por un lado, descubrir la «concepción de la ortografía de la lengua española en los textos antiguos y el tratamiento gráﬁco dado hasta ahora a diferentes colecciones documentales hispanoamericanas». A este respecto, se realiza un repaso panorámico de las diferentes propuestas de edición de documentación americana, con especial referencia al trabajo culminado por Fontanella (1990). Como tareas pendientes en la toma de decisiones en relación con el proyecto CHARTA, los autores realzan la importancia de homogeneizar las cabeceras, pues se echa en falta «un estudio serio y sistemático» de las tipologías documentales americanas. Pero, aparte de estos aspectos de presentación formal de los documentos, más importancia merece, a nuestro entender, la aﬁrmación siguiente, que encierra una reﬂexión sobre los hábitos de pronunciación en el español de América desde un punto de vista histórico: Aparte de estos casos [...] hay otros más complejos donde la transcripción paleográﬁca deja ver que las grafías absolutamente confundidas no obedecen simplemente a errores ortográﬁcos del semialfabeto autor del documento, sino que encierran un estadio de la pronunciación de enorme confusión. La presentación crítica de textos no resulta fácil sin dejar de sentir que se puede traicionar la lengua hablada por aquel individuo y otros como él en la Cartagena convulsionada por la mezcla de razas y lenguas de ﬁnales del siglo XVII (pág. 50).

En deﬁnitiva, los autores destacan la especiﬁcidad que suponen las tradiciones escritas emanadas del continente americano, con sus consiguientes tendencias dinámicas de cambio fonético, presentes en los documentos en términos de conservadurismo e innovación. Sin alejarnos del área lingüística del español de América, en el artículo «Confección de un corpus para conocer el origen, la evolución y la consolidación del español en la Nueva España», escrito por Beatriz Arias Álvarez, se aborda la tarea compleja de conformar un corpus para el estudio del origen y evolución del español en la Nueva España. Para ello, se delimitan los parámetros representativos en el estudio pluridimensional del español. En primer lugar, la variación diatópica, con la inclusión de textos de las diferentes áreas del Virreinato, de zonas de la península con población emigrante hacia la Nueva España, así como algunas zonas de tránsito como Canarias, Cuba o Filipinas, asegura la representatividad en términos dialectales. En segundo lugar, la variación diastrática, en la que se propone la clasiﬁcación siguiente: «españoles, criollos, mestizos, indígenas, negros / mulatos y extranjeros» (pág. 72), da cabida a los diferentes usos sociolingüísticos que se concitan en este complejo escenario sociohistórico. En tercer lugar, la variación diafásica, conﬁgurada a

400

AnMal, XXXVI, 1-2, 2013

SANTIAGO VICENTE LLAVATA

partir de los registros formal, semiformal e informal, completa la dimensión sociolingüística. Finalmente, la variación diacrónica, con una aplicación cronológica en segmentos de veinticinco años, aseguran la presencia equilibrada de los diferentes tramos temporales. Por último, en lo que concierne a la forma de disposición textual, se adopta la triple forma de presentación, basada en una edición facsimilar, en una transcripción estrecha del documento y en una transcripción crítica. II Tal como se ha detallado en la introducción de este comentario, la sección segunda se dedica monográﬁcamente a diferentes proyectos de investigación orientados al diseño de corpus para ﬁnes especíﬁcos, como la elaboración de un nuevo diccionario histórico para el español, la redacción de una gramática histórica del catalán antiguo o la puesta en marcha de un corpus digital de judeoespañol. En el artículo titulado «Un corpus para un Nuevo diccionario histórico del español», José A. Pascual y Carlos Domínguez dan cuenta del Corpus del nuevo diccionario histórico (CNDH), que constituye la base de datos con la que elaborar el Nuevo diccionario histórico del español (NDHE)15. Según se expone en la introducción, tanto la concepción de este nuevo diccionario histórico como el diseño del CNDH se asienta en el fondo de tradición ﬁlológica y lexicográﬁca española, representado fundamentalmente por la obra etimológica de Joan Corominas y por el Diccionario histórico de la lengua española de la Real Academia Española. El diseño del CNDH atiende a una serie de características bien deﬁnidas, como son la selección de un léxico general de todas las épocas a partir de los textos más representativos (literarios, fundamentalmente, al menos en una primera etapa). Este primer principio se traduce en atender de manera prioritaria al conjunto de voces comunes, es decir, dejar de lado tanto las de mayor frecuencia como las de frecuencia baja. En cuanto a la decisión de representar el corpus mediante fragmentos de textos (corpus de referencia) o mediante textos completos (corpus textual), la razón principal por la que se ha decidio que el CNDH se construya a partir de textos completos reside en la evidencia de que, de otro modo, los textos pierden representatividad, entre otros argumentos aducidos. Por otra parte, se prevé una ampliación del corpus a partir de la información proporcionada por los lenguajes de especialidad y por los datos procedentes de la variación diatópica. También se ha preparado la reducción del CNDH con el ﬁn de estudiar voces con un elevado nivel de frecuencia (hacer, tener o dar). Otro punto 15 Recientemente (marzo de 2012), la comunidad científica tiene acceso al Corpus del nuevo diccionario histórico (CNDH). J. A. Pascual Rodríguez (dir.), Nuevo diccionario histórico del español [en línea]: [Madrid]: Real Academia Española / Fundación Instituto de Investigación Rafael Lapesa para el Nuevo diccionario histórico del español [fecha de la consulta: 2 de abril de 2012].

HISTORIA DE LA LENGUA

AnMal, XXXVI, 1-2, 2013

401

importante en el diseño del CNDH lo constituyen los criterios de normalización gráﬁca que se aplican16. La creación de corpus modulares presenta como ﬁnalidad compensar parcelas de léxico no representadas en el CNDH. Así, ámbitos tan vigentes en nuestra sociedad como el deporte o la moda tendrían visibilidad ya sea en forma de neologismos (prêt-à-porter), ya sea en forma de voces adaptadas con el paso del tiempo (córner). Finalmente, existen materiales bibliográﬁcos auxiliares que resultan decisivos a la hora de trazar la historia léxica de una voz, como es el ﬁchero de papel de la Real Academia Española o la varia y vasta información lexicográﬁca contenida en los Tesoros lexicográﬁcos publicados hasta el momento. Por lo que respecta al ámbito de la lengua catalana, en el artículo «Bases cientíﬁcas en la investigación a partir de corpus: el caso del Corpus Informatitzat del Català Antic», Joan Torruella describe las múltiples aplicaciones que presenta el Corpus Informatitzat del Català Antic (CICA)17 en el ámbito de los estudios sobre gramática histórica catalana. El objetivo último de esta base de datos reside en «aportar datos lingüísticos para la realización de una gramática histórica del catalán anterior al siglo XVII» (pág. 96). De acuerdo con los presupuestos teóricos del proyecto, se busca que el corpus presente carácter representativo, esto es, «que sea el reﬂejo de los diferentes estadios evolutivos de la lengua que quiere describir» (pág. 96). Asimismo, se presta atención prioritaria a los aspectos morfosintácticos, por cuanto en este nivel se concentra uno de los objetivos centrales del proyecto: la elaboración de una sintaxis histórica18. El CICA se conﬁgura a partir de tres ejes: en primer lugar, el eje temporal abarca desde textos del siglo XI hasta el XVII19, con períodos comprendidos en 25-50 años. El segundo eje se centra en la determinación de las diferentes tipologías de documentos y, por añadidura, de los registros, «ya que suele haber relación entre tipología y registro, a pesar de que puede haber diversos registros en una misma tipología y de que un registro se puede encontrar en más de una 16 Se ha elaborado a este respecto una propuesta para la edición de textos. Véase, a este respecto, la referencia bibliográfica de la nota 13. 17 J. Torruella (dir.), junto con M. Pérez Saldanya y J. Martines, Corpus Informatitzat del Català Antic (CICA) [en línea]: [Barcelona]: Universitat Autònoma de Barcelona [fecha de consulta: 15 de octubre de 2012]. 18 Afirma G. Clavería Nadal, «Corpus diacrónicos: nuevas perspectivas para el estudio de la historia de la lengua», en E. Montero Cartelle y C. Manzano (eds.), op. cit., pág. 2444: «La GCA [Gramàtica del Català Antic] se desarrolla como un proyecto en el que todos los investigadores participantes comparten su uso como herramienta básica. La idea surge por la necesidad de fundamentar las investigaciones en “datos reales y cuantificables”, de ahí la constitución de un corpus informatizado desde las primeras etapas de desarrollo de este proyecto». 19 En palabras de J. Torruella, «Bases científicas en la investigación a partir de corpus: el caso del Corpus Informatitzat del Català Antic», en A. Enrique-Arias (ed.), Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus, Iberoamericana / Vervuert (Col. Lingüística Iberoamericana), Madrid / Fráncfort, 2009, pág. 104: «Se trata, pues, de un Corpus diacrónico que va desde los orígenes de los textos escritos (siglo XI) hasta principios del siglo XVII».

402

AnMal, XXXVI, 1-2, 2013

SANTIAGO VICENTE LLAVATA

tipología» (pág. 105). Finalmente, el eje geográﬁco intenta dar cuenta de la variación interdialectal, partiendo del presupuesto de que la lengua medieval catalana presenta un carácter fuertemente unitario, aunque se practica la división avalada por la Dialectología catalana en dos grandes bloques dialectales. En deﬁnitiva, el CICA presenta como principal ﬁnalidad suministrar los datos contextuales necesarios para la elaboración de una gramática histórica catalana, pero, al mismo tiempo, ese gran proyecto de carácter histórico puede tener repercusiones de interés en el ámbito de la normativa lingüística del catalán actual, pues se sabe que el criterio histórico puede llegar a conformarse como un instrumento codiﬁcador altamente eﬁcaz y decisivo20. A nuestro modo de ver, uno de los aspectos más innovadores en la conformación de un corpus digital reside en su capacidad de integrar a la propia comunidad cientíﬁca en su diseño. Este aspecto es, precisamente, sobre el que descansa el corpus proyectado por Ana Stulic-Etchevers y Souﬁane Rouissi, descrito pormenorizadamente en su trabajo «Pensando un corpus en modo colaborativo: hacia el prototipo del corpus judeoespañol digital». En él dan a conocer una propuesta de corpus innovadora. Se trata de lo que denominan un corpus «dinámico» (pág. 130), esto es, un corpus elaborado sobre la base del trabajo colaborativo entre los diferentes investigadores del ámbito de estudio del judeoespañol y de otros campos de estudio ﬁlológico. Los autores, conscientes de la novedad de la propuesta en el ámbito de estudio de la Filología, han realizado una encuesta a diferentes investigadores de judeoespañol con el ﬁn de advertir sus necesidades metodológicas en lo que respecta a la explotación de los datos del corpus y con el ﬁn de valorar, de acuerdo con sus experiencias profesionales inmediatas, el uso de la modalidad del trabajo colaborativo. Por otra parte, los autores centran su atención en los problemas especíﬁcos a la hora de diseñar un corpus digital de judeoespañol. Entre algunos de los problemas más acuciantes, se encuentran la determinación y ﬁjación de las fuentes textuales, así como el conjunto de decisiones asociadas a la compleja tarea de ﬁjar las normas de transcripción. En cuanto a sus conclusiones, hay que destacar la valoración positiva de la comunidad investigadora en relación con un modo colaborativo en la organización del trabajo, aunque reconocen que la mayoría de los encuestados cree que faltan todavía muchos esfuerzos conjuntos para llegar a desarrollar este modo de trabajo. En deﬁnitiva, en la toma de decisiones a la hora de diseñar un proyecto de corpus diacrónico, la atención a la presencia de la variable de los tipos de discurso constituye un rasgo constante en cada una de las descripciones estudiadas. Así, denominaciones técnicas como «corpus modular» o «eje tipológico» (sin ser etiquetas equivalentes) se conforman como un poderoso instrumento a la hora de representar la variación discursiva en el conjunto. 20 Tal como defiende Mª T. Echenique Elizondo, «La Historia como recurso explicativo y apoyo codificador en la obra académica actual», Revista de Filología Española, XCI, 1, 2011, págs. 168-169, para el caso del español y, más concretamente, en relación con su componente fónico.

AnMal, XXXVI, 1-2, 2013

HISTORIA DE LA LENGUA

403

Desde nuestro punto de vista, su gestión y desarrollo en el diseño de cualquier corpus diacrónico está plenamente justiﬁcada, puesto que la representación de las diferentes tipologías discursivas constituye una información de primera importancia a la hora de profundizar en las varias tendencias de cambio lingüístico de un fenómeno lingüístico dado21. En otras palabras, el estudio profundo de varias tipologías discursivas en conexión nos puede mostrar que, con relativa frecuencia, las tendencias de cambio lingüístico se maniﬁestan de forma asimétrica y desigual. III Dentro de los intereses prioritarios de esta obra, la descripción minuciosa del funcionamiento y de las potencialidades de los corpus diacrónicos presenta una importancia capital. Los dos trabajos que se incluyen en esta sección, titulada «Cuestiones de arquitectura informática», se centran, pues, en la descripción sobre el diseño y funcionamiento de algunos de los corpus digitales más representativos. En ella se recogen dos contribuciones centradas en la consulta y optimización de los corpus digitales. En el artículo «Creating useful historical corpora: a comparison of CORDE, the Corpus del Español and the Corpus do português», Mark Davies compara las potencialidades de los bancos de datos Corpus del español y el Corpus do português, en comparación con el Corpus diacrónico del español (CORDE). En ese contraste de prestaciones entre los corpus mencionados, Mark Davies destaca un salto cualitativo en la incorporación de instrumentos relevantes para la investigación histórica, como la lematización sistemática o el etiquetado gramatical, que facilitan al investigador su tarea a la hora de ordenar e interpretar los datos obtenidos. En el análisis por niveles, Mark Davies demuestra de manera clara los beneﬁcios que supone disponer de un corpus lematizado y anotado gramaticalmente. De acuerdo con el criterio de Davies, el análisis sintáctico reﬂeja con mayor transparencia las potencialidades reales de estos dos instrumentos en relación con la investigación histórica en el ámbito de las lenguas iberorromances. Centrándose, pues, en el estudio de las construcciones causativas del tipo ﬁzo llamar, Davies demuestra que «CORDE it is not tagged for part of speech, so it does not know what a verb, or noun, or inﬁnitive is» (pág. 154). En el caso del Corpus del español, Davies explica la posibilidad de establecer una restricción, con el ﬁn de localizar las formas inﬁnitivas y prescindir de otras. El resultado se muestra en una tabla cronológica en la que se detalla una búsqueda 21 En esta misma línea, afirma G. Rojo, «El papel de los corpus en el estudio de la historia de la lengua», en E. Montero Cartelle y C. Manzano (eds.), op. cit., pág. 2475: «Lo realmente importante, pues, es que el corpus contenga textos de todas las épocas, tipos, estilos y países que estén implicados en la conformación de aquello que se quiere estudiar. Esto es, que esté equilibrado en el sentido más general de la expresión».

404

AnMal, XXXVI, 1-2, 2013

SANTIAGO VICENTE LLAVATA

de posibilidades morfosintácticas, como ﬁzo saber, fazer saber, hizo hazer, hazer saber, etc. Por todo ello, concluye que: [...] there is a huge difference beetwen a corpus architecture that is designed around searching for exact words and phrases (which is what CORDE doest quiet nicely) and one that can include linguistic annotation such as lemmatization and part of speech (pág. 154).

Por su parte, Kim Schulte estudia las posibilidades reales de los corpus sin marcación gramatical en el trabajo «Using non-annotated diachronic corpora: beneﬁts, methods and limitations». De acuerdo con el autor, en numerosas ocasiones los corpus anotados no pueden satisfacer las necesidades de las investigaciones basadas en áreas lingüísticas especíﬁcas, en las que es necesario disponer de «regionally speciﬁc corpora» (pág. 168). En este sentido, lo mismo cabría aﬁrmar en el caso de que una investigación se centre en un período histórico muy limitado en el tiempo. Partiendo, pues, de estas premisas, Kim Schulte deﬁende el uso de los corpus no anotados para el estudio de los cambios lingüísticos con una frecuencia baja. Ahora bien, el autor destaca una condición indispensable que debe tener esa tipología de corpus para cumplir con garantías su cometido: debe poseer una datación ﬁable de los textos. La segunda parte del estudio se dedica exclusivamente a mostrar, mediante algunos ejemplos prácticos, el procedimiento metodológico a la hora de usar los corpus no anotados, así como sus beneﬁcios y limitaciones. En cuanto a los beneﬁcios, el autor presenta la idoneidad de utilizar «extended regular expressions» mediante la aplicación informática Egrep, ya que «regular expressions make it possible to specify an exact search pattern» (pág. 170). En cuanto a las limitacions del uso de expresiones regulares, se destaca la falta de distinción morfológica, puesto que este tipo de herramienta está basado necesariamente en criterios formales. Otras limitaciones destacables residen en la imposibilidad de diferenciar signiﬁcados en una misma forma, así como en la complejidad a la hora de disipar la existencia de ambigüedades sintácticas, en las que la información semántica y pragmática juega un papel decisivo. IV En el mapa lingüístico peninsular, existen variedades hispánicas que, en razón de hechos sociohistóricos contrastados, no han tenido un desarrollo constante y continuado a lo largo de los siglos. Es el caso de variedades como el asturiano o el aranés, entre otras. El marco jurídico y social actual ha propiciado, pues, un cambio en esta dinámica sociohistórica, hasta el punto de constatar una visibilidad creciente en el mosaico lingüístico peninsular22. En el marco 22 Para una información detallada sobre las diferentes variedades lingüísticas que conforman la historia lingüística hispánica, véase el libro de Mª T. Echenique Elizondo y J. P.

HISTORIA DE LA LENGUA

AnMal, XXXVI, 1-2, 2013

405

de esta visibilidad aducida, se integran los proyectos de diseño de corpus digitales. Así, la sección cuarta, titulada «Corpus y variedades iberorromances», recoge cinco contribuciones referidas a la creación y al diseño de corpus digitales sobre diferentes espacios hispánicos. En el artículo titulado «Un corpus lingüístico asturiano: Eslema», Xulio Viejo Fernández, Arsenio Coto Pérez, María Cueto Fernándezs y Roberto Hinojal Díaz dan cuenta de la realidad lingüística que hoy conocemos como «llingua asturiana». Para ello, los autores recurren al concepto de «visibilidad» como cauce necesario a la hora de valorar la realidad lingüística referida: [...] pero, en otra clave, también favorece, y no es un asunto menor en nuestro caso, la visibilidad de la lengua a través de la materialidad de sus textos ante su propia comunidad de habla y, desde luego, ante el amplio y abierto colectivo de investigadores interesados tanto en el aspecto concreto del asturiano, como en sucesivos niveles, de la lingüística hispánica, románica o general (pág. 184).

De acuerdo con este planteamiento, una manera de hacer visible la lengua reside, pues, en disponer una ordenación acumulativa y extensa de textos asturianos, lo que le conﬁere una dimensión simbólica. Así, Eslema23 (en ast. ‘marca dibujada en una piedra, indicativa de la existencia de un tesoro escondido’) se constituye como un proyecto marco de corpus digital que incluye a su vez diferentes subcorpus: por una parte, el subcorpus de la lengua medieval asturleonesa (siglos XIII-XV), conformado en su totalidad a partir de textos notariales; por otra parte, el de la lengua literaria asturiana clásica (1639-1950) y, en tercer lugar, el subcorpus de la lengua asturiana actual, compuesto fundamentalmente a partir de textos literarios y periodísticos. En el caso de este último subcorpus, se ha tenido especial atención en dar representatividad a las diferentes variedades internas del asturiano, así como a marcarlo lingüísticamente con el ﬁn de propiciar análisis aplicados de sintaxis asturiana, como es el caso de la colocación de clíticos. Por otra parte, ese corpus de la lengua asturiana actual incluye también un subcorpus oral, conformado con muestras de los diferentes registros lingüísticos. Desde el Instituto da Lingua Galega (Universidade de Santiago de Compostela), Ricardo Pichel y Xavier Varela Barreiro presentan un subcorpus relativo al gallego medieval24. Así, en su trabajo «O corpus do galego medieval Tesouro Sánchez Méndez, Las lenguas de un Reino: historia lingüística hispánica, Gredos, Madrid, 2005. 23 Consúltese el corpus en esta página web X. Neira Álvarez y X. Viejo Fernández (coords.), Eslema [en línea]: . Universidad de Oviedo [fecha de la consulta: 15 de octubre de 2012]. 24 La consulta al corpus se realiza mediante usuario y contraseña y se encuentra alojado en la página web X. Varela Barreiro (dir.), Tesouro Medieval Informatizado da Lingua Galega [en línea]: [Santiago]: Instituto da Lingua Galega [fecha de la consulta: 15 de octubre de 2012].

406

AnMal, XXXVI, 1-2, 2013

SANTIAGO VICENTE LLAVATA

Medieval Informatizado da Lingua Galega (TMILG)», describen detalladamente la constitución y el desarrollo de este subcorpus digital, incluido en otro proyecto de mayor alcance, titulado Tesouro Medieval Galego-Portugués, que presenta como objetivo la digitalización de documentos emanados de las diferentes scripta de las zonas geográﬁcas occidentales de la península ibérica. De hecho, este macroproyecto se nutre de dos grandes corpus delimitados en torno a un criterio geográﬁco: el Xelmírez, que integra textos medievales localizados en Galicia, y el Dom Dinis, que está conformado con textos medievales emanados de tierras portuguesas. A su vez, ambos corpus están formados por distintos subcorpus, delimitados en función de un criterio glotológico. El Xelmírex está formado por el referido Tesouro Medieval Informatizado da Lingua Galega, el Tesouro Medieval Informatizado da Lingua Latina (Galicia) y el Tesouro Medieval Informatizado da Lingua Castelá (Galicia). Por su parte, el corpus Dom Dinis está conformado por los subcorpus Tesouro Medieval Informatizado da Lingua Portuguesa y Tesouro Medieval Informatizado da Lingua Latina (Portugal). Como bien indican sus autores, este conjunto ordenado de corpus permitirá afrontar con suﬁcientes garantías proyectos tan atractivos para la historia lingüística hispánica, como son la proyección lexicográﬁca de un Dicionario Histórico da Lingua Galega y de un Dicionario Medieval Galego-Portugués, la puesta en marcha de una Dialectoloxía Medieval Galego-Portuguesa y, en una fase más avanzada, la redacción de una Gramática Histórica da Língua Galega. En el ámbito de estudio de la Toponomástica, se pretende elaborar un Inventario Toponímico da Galicia Medieval y, ﬁnalmente, en el campo de la edición textual, se proyecta la «edición paleográﬁca de distintas obras medievais, tanto literarias como notariais» (pág. 198). Tal como se ha visto en la descripción de otros corpus diacrónicos digitales, también los responsables del TMILG dan cuenta de su estructura y características. En cuanto a la proyección temporal del corpus (eje cronológico), «o corpus do TMILG cobre un período amplísimo que vai do séc. VIII ao XVII». Por lo que respecta a la representación discursiva, el corpus presenta tres entornos discursivos: la prosa notarial, con un mayor peso documental, la prosa no notarial y la lírica. Por su parte, la prosa notarial, en razón de su multiplicidad de ámbitos, presenta una diversidad interna destacable. Se subdivide, pues, en los siguientes subproductos textuales: «documentos referentes á adquisición e xestión do patrimonio»; «Documentos relativos ao mundo mercantil e ás transaccións comerciais»; «Documentos administrativos»; «Documentos pertencentes ao ámbito familiar e doméstico» y «Escritos de tipo xeral, donde se integran “testemuños, procurazóns, poderes, avinzas, sentenzas, renunciamentos e quitazóns, albalás, outorgamentos, demandas, frontas, etc.”» (págs. 199-200). Incluso a esa diversidad textual cabría sumarle dos entornos discursivos verdaderamente representativos de las scriptae medievales: la documentación emanada de las instituciones reales y la que procede del poder eclesiástico y, especialmente, la documentación emanada de las instituciones monásticas. El segundo grupo en densidad textual lo conforma la prosa no notarial, en la que se integra la

HISTORIA DE LA LENGUA

AnMal, XXXVI, 1-2, 2013

407

prosa literaria, la prosa histórica, religiosa, técnica y jurídica. En tercer lugar, el entorno discursivo de la lírica engloba las manifestaciones de la lírica trovadoresca y de la «lírica da decadencia» o «escola galego-castelá»25. Por lo que respecta al proceso de etiquetado de los textos, se informa de que se está aplicando un sistema actualizado de etiquetado en el que se complementan dos cabeceras: «la cabecera general, con bloques de información sobre la versión electrónica del texto o su descripción bibliográﬁca» (pág. 207), y «la cabecera individual, con información detallada sobre localización, datación, autoría, tipología documental, participantes, lengua y aspectos editoriales, codicológicos y paleográﬁcos» (págs. 208-209). Finalmente, los autores dan cuenta de las fases de desarrollo del proyecto: por un lado, se quiere avanzar en la marcación de elementos toponomásticos (topónimos, antropónimos, títulos de obras, nombres de días y de meses, denominaciones de instituciones, etc.) y, por otro, se pretende generalizar al conjunto del corpus la lematización y el etiquetado gramatical, basado fundamentalmente en parámetros morfológicos. En la tarea por englobar cada una de las manifestaciones romances, Aitor García Moreno («El proyecto de “Edición del ﬁchero manuscrito de léxico judeoespañol de Cynthia Crews”») da a conocer un proyecto de investigación basado en la digitalización del ﬁchero manuscrito lexicográﬁco de la investigadora británica Cynthia Crews. De acuerdo con el autor, dos son los objetivos principales que se pretende conseguir con este proyecto: por una parte, «la puesta al día y eventual revisión, a lo largo del proceso de informatización y edición, de los contenidos del ﬁchero, en ocasiones obsoletos a la luz de lo publicado con posterioridad por la propia Cynthia Crews» y, por otra parte, «la edición en formato digital (soporte cederrón o similar) de un Lexicon que no solo recoja la información del ﬁchero de manera uniforme y organizada, sino que además permita llevar a cabo búsquedas y referencias cruzadas, en la línea de dotar de una serie de fuentes para posteriores investigaciones sobre el judeoespañol, más allá de la consulta in situ del ﬁchero» (pág. 217). Por lo que respecta a la puesta en marcha de la base de datos, Aitor García Moreno detalla su diseño a partir de las siguientes fuentes de información: «lema (con la grafía original utilizada por C. Crews), categoría y género, traducción, explicación, variantes y etimología» (pág. 222-223). Como indica el autor, el curso del trabajo se sitúa en una primera fase, en la que se ha completado la descripción del ﬁchero, se ha constituido la base de datos y se han digitalizado ya unas 2000 ﬁchas. Tal como señala el autor, la edición digitalizada de este ﬁchero constituirá una espléndida base para la elaboración de un Tesoro lexicográﬁco judeoespañol, tan necesario a juzgar por la presencia testimonial 25 Para una visión panorámica sobre el léxico utilizado en esta tradición literaria, véase el estudio de G. Pérez Barcala (ed. lit.), A. Fernández Guiadanes (ed. lit.), M. Á. Pousada Cruz (ed. lit.) y M. Brea (coord.), Estudos sobre léxico dos trobadores, Universidade de Santiago de Compostela / Servizo de Publicacións e Intercambio científico, Santiago de Compostela, 2008. Puede consultarse una reseña del mismo en S. Vicente Llavata, «Reseña de Estudos sobre léxico dos trobadores», Revista de historia de la lengua española, 5, 2010, págs. 201-210.

408

AnMal, XXXVI, 1-2, 2013

SANTIAGO VICENTE LLAVATA

del judeoespañol en algunos de los proyectos lexicográﬁcos y en corpus como el CORDE. Junto con el interés por representar en forma de corpus las diferentes modalidades lingüísticas desde un punto de vista geográﬁco, se encuentra la necesidad por aunar el eje cronológico y el geográﬁco, además del eje tipológico, en un mismo diseño de corpus. Es este el caso del proyecto descrito por Miguel Calderón Campos y María Teresa García Godoy en «El Corpus diacrónico del español del Reino de Granada (CORDEREGRA)». En él se describe el proceso de toma de decisiones en la conformación de este corpus digital sobre el español hablado en el Reino de Granada. Así, ese conjunto de decisiones se concretan en la delimitación de las diferentes coordenadas en el marco del análisis lingüístico, como son el criterio cronológico (1492-1833), el criterio geográﬁco (para la modalidad oriental, las provincias de Granada y Almería; para la occidental, la provincia de Málaga) y el criterio textual (declaraciones de testigos, correspondencia oﬁcial, cartas privadas, memoriales, testamentos, cartas de dote y arras o inventarios de bienes, entre otros muchos). A continuación, los autores describen una serie de fenómenos lingüísticos a partir del uso sistemático del CORDEREGRA, como son los rasgos de yeísmo, la pérdida de la -d- intervocálica o la reconstrucción del sistema de tratamiento, con el ﬁn de demostrar la idoneidad y oportunidad de este interesante corpus documental. De acuerdo con las tesis descritas por los autores, el uso de CORDEREGRA posibilitará el estudio de aspectos históricos tan trascendentales para la historia lingüística hispánica, como «el proceso de castellanización del Reino de Granada o el de diferenciación dialectal entre las dos Andalucías lingüísticas». Asimismo, permitirá completar «vacíos de información en la historia del español, difícilmente superables sin corpus sistemáticos sobre una región determinada» (pág. 247). Finalmente, en su calidad de «corpus regional», los autores destacan la idoneidad de esta tipología de corpus «de pequeño dominio» (pág. 247), pues suponen un complemento, en diferentes sentidos, del corpus académico CORDE, en razón de su diversidad discursiva y de su potencial intrínseco para los estudios de la variación lingüística desde el punto de vista histórico. En estrecha relación con el proyecto anterior, en el sentido de compartir una realidad lingüística semejante desde la perpectiva de la Dialectología histórica, Mercedes Abad Merino explora las posibilidades de conformar un corpus sociolingüístico centrado en los siglos XVI y XVII. En su artículo «Uso de corpus documental en sociolingüística histórica y retos para su elaboración en el sureste peninsular (siglos XV-XVII)», detalla claramente cuáles son las fases del proyecto: en primer lugar, el objetivo prioritario se basa en describir en toda su complejidad la conﬁguración histórica del español hablado en el antiguo Reino de Murcia durante el segmento temporal señalado. Para ello, parte de un corpus documental conformado principalmente por los textos conservados en los depósitos municipales del antiguo Reino de Murcia. En esa agrupación de textos se encuentran libros de correspondencia, libros de clavería, libros de la cámara y el pósito del trigo, libros de fábrica de las iglesias y

AnMal, XXXVI, 1-2, 2013

HISTORIA DE LA LENGUA

409

documentos judiciales. Por otra parte, en una valoración global sobre el uso de corpus diacrónicos para el estudio de la sociolingüística histórica, Mercedes Abad propone incluir todo tipo de información referida a la situación externa al texto mismo, pues solo de este modo esos corpus de que disponemos en la actualidad podrían aprovecharse para tal ﬁn. Dada la complejidad sociohistórica de los siglos XVI y XVII, en la que sobresale de manera signiﬁcativa la situación de contacto étnico, religioso y lingüístico26, la historia social se concibe como un instrumento teórico indispensable a la hora de interpretar los usos lingüísticos: [...] Los estudios más recientes sobre el comportamiento lingüístico de estas minorías, especialmente la morisca, muestran que se trata de una comunidad demasiado heterogénea internamente, como grupo social, y con características completamente diferentes según el área geográﬁca en que se inscriban, como para poder generalizar cualquier aﬁrmación sin matizar (pág. 262).

En este sentido, la autora señala como una de las conclusiones más destacables la correlación existente entre los usos lingüísticos (en términos de cambio de código) y las diferentes tradiciones textuales que se asientan en esta época. V Hasta ahora, el comentario de los diferentes proyectos se ha centrado en corpus diacrónicos más o menos amplios. La sección que nos ocupa, «La biblia como corpus», centra su atención en la descripción y en la aplicación, desde diferentes análisis, del corpus paralelo y alineado Biblia Medieval. Como ya se ha comentado en la introducción, el punto en común que se exhibe en los tres trabajos incluidos en esta sección se basa en la clara interrelación entre la tipología de corpus modulares y los principios del paradigma de las Tradiciones Discursivas. Así pues, la sección recoge tres contribuciones que, desde diferentes perspectivas, estudian las potencialidades de la Biblia como subcorpus relevante en la investigación histórica del español. La sección se abre con el artículo de Andrés Enrique-Arias, titulado «Ventajas e inconvenientes del uso de Biblia Medieval (un corpus paralelo y alineado de textos bíblicos)». En él, Andrés Enrique-Arias describe las potencialidades que 26 B. Vincent, El río morisco, Universitat de València / Prensas Universitarias de Zaragoza / Editorial Universidad de Granada, 2006, pág. 117, se refiere a la situación lingüística en estos términos: «Pero en el campo cristiano, después de 1570, se alzaban, cada vez más atronadoras, voces que reclamaban remedios expeditivos. Se conocen las posiciones extremas del arzobispo de Valencia, Juan de Ribera, y la nota, sugiriendo la prohibición de la lengua árabe, remitida por el dominico Luis Beltrán, en 1579, al duque de Nájera, virrey del reino valenciano».

410

AnMal, XXXVI, 1-2, 2013

SANTIAGO VICENTE LLAVATA

ofrece el corpus Biblia Medieval27 en su aplicación al campo de estudio de la Diacronía28. Así, una de las ventajas más destacables reside en su condición de corpus paralelo, pues el hecho de poder consultar diferentes versiones de un mismo contenido le conﬁere gran relevancia, por cuanto nos permite constatar procesos de variación y cambio lingüístico. Asimismo, el hecho de disponer del facsímil junto con la transcripción paleográﬁca resulta de gran ﬁabilidad a la hora de conferir calidad ﬁlológica a los datos utilizados. En una segunda parte del estudio, Andrés Enrique-Arias sopesa muy atinadamente las ventajas e inconvenientes de este corpus de traducciones bíblicas medievales con relación a los grandes corpus históricos del español: CORDE y Corpus del Español. Así, a partir del análisis de variables como la diversidad (entendida en términos de representar la variación lingüística), la fase de análisis, la perspectiva, la calidad, la representatividad (sin duda alguna, una de las variables más decisivas y complejas) y la comparabilidad, el autor llega a la conclusión de que el corpus en línea Biblia Medieval constituye un complemento útil y valioso a los grandes corpus históricos del español. Ahora bien, tal como apunta Andrés Enrique-Arias, es importante tener presentes las especiﬁcidades de las traducciones bíblicas (inﬂuencia de la lengua fuente, intención autorial y presencia de rasgos de estilo) a la hora de utilizar los datos contextuales en la investigación de un fenómeno lingüístico determinado, pues tales especiﬁcidades pueden condicionar la interpretación ﬁlológica. Partiendo de uno de los fenómenos más representativos en la sintaxis histórica del español, Valentina Vincis analiza en el trabajo «Describir textos a partir de estructuras de ilación oracional: un corpus de romanceamientos bíblicos medievales» este tipo de relación sintáctica a partir de las traducciones bíblicas medievales. En el análisis de las coordenadas aportadas por el corpus en línea Bíblia Medieval, se observan dos tipos de variación interna: por un lado, la variación horizontal da cuenta de los procesos históricos referidos a la morfosintaxis, como la generalización de la conjunción de valor aditivo et para iniciar pasajes narrativos, frente a su ausencia en secuencias dialógicas. Por otro lado, la variación vertical hace referencia a las diferentes soluciones expresivas documentadas en las versiones de una misma unidad oracional. Precisamente, el estudio detallado de la variación vertical en el texto de Números ofrece como resultado la inﬂuencia directa del texto fuente en la elección de estructuras sintácticas, como es el caso de las estructuras con inﬁnitivo o las suboraciones de valor temporal a comienzo de versículo. Como se ha visto antes, este aspecto constituye uno de los «factores de distorsión» más frecuentes 27 A. Enrique-Arias (dir.), Biblia Medieval [en línea]: [Palma]: Universitat de les Illes Balears [fecha de consulta: 12 de noviembre de 2012]. 28 A este respecto, véanse los estudios de A. Enrique-Arias, «Biblia Medieval: diseño y aplicaciones de un corpus paralelo y alineado del español medieval», en E. Montero Cartelle y C. Manzano (eds.), op. cit., págs. 2455-2465 y A. Enrique-Arias, «Dos problemas en el uso de corpus diacrónicos del español: perspectiva y comparabilidad», Scriptum digital. Revista de corpus diacrónicos y edición digital en lenguas iberorrománicas, 1, 2012, págs. 85-106.

HISTORIA DE LA LENGUA

AnMal, XXXVI, 1-2, 2013

411

advertidos por Enrique-Arias en su artículo-presentación (págs. 281-282). Finalmente, Valentina Vincis cierra el artículo con un conjunto de propuestas de investigación, como el estudio de la variación léxica en el marco de una misma clase de ilación, la determinación del porcentaje de aﬁnidad sintáctica entre las diferentes versiones o la posibilidad de ampliar el corpus y, con ello, considerar otros fenómenos en el análisis. Una de las relaciones sintácticas que suscita mayor interés entre los investigadores de la sintaxis histórica es la concesividad. Así, en el artículo «Notas sobre los nexos concesivos en los romanceamientos bíblicos medievales», Lola Pons Rodríguez se propone estudiar la variación diacrónica en la elección de nexos concesivos tomando como herramienta el corpus Biblia Medieval. A partir del estudio contrastado entre la versión latina de la Biblia y sus traducciones al castellano, la autora llega a certiﬁcar el proceso de «vacío y ruptura» (pág. 307) en la evolución a una sintaxis plenamente romance en lo que respecta a la expresión de la concesividad, sin dejar de apuntar que la concesividad se da desde los orígenes en español. En ese estudio contrastivo, Lola Pons destaca la locución conjuntiva romance aun si (i? Fenómeno estudiado a la luz de la acomodación de los diptongos en el reinado de Alfonso Onceno», en A. Cabedo, M. J. Aguilar y E. López-Navarro (eds.), Estudios de Lingüística: investigaciones, propuestas y aplicaciones, Universitat de València, 2013, págs. 303-311, así como el capítulo de Mª T. Echenique Elizondo y F. P. Pla Colomer, «Reconstrucción fonética y periodización a la luz de la métrica y la rima», en Mª T. Echenique Elizondo y F. J. Satorre Grau (eds.), op. cit., págs. 63-106. 40 A este respecto, incluimos el detalle de algunos inventarios de fraseología histórica (unos ya clásicos y otros de reciente constitución), que podrían ser utilizados para el diseño de una gran base de datos propiamente fraseológica. F. Rodríguez Marín, Modos adverbiales castizos y bien autorizados que piden lugar en nuestro léxico [s. n.], Madrid, 1931. M. Morreale, «La fraseología bíblica en la General Estoria. Observaciones para su estudio», en A. S. Crisafulli (ed.), Linguistic and Literary Studies in Honour of Helmut A. Hatzfeld, The Catholic University of America, Washington, 1964, págs. 269-279. Mª J. Martínez Alcalde, «Las unidades fraseológicas en el Diccionario de Terreros», Boletín de la Sociedad Española de Historiografía Lingüística, 2002, págs. 129-149. E. T. Montoro del Arco, «La fraseología popular en el Siglo de Oro: análisis de la Segunda Parte del Lazarillo de Tormes de Juan de Luna», en Mª L. Lobato y F. Domínguez Matito (eds.), Memoria de la palabra. Actas del VI Congreso de la Asociación Internacional del Siglo de Oro, II, Iberoamericana / Vervuert, Madrid, 2004, págs. 201-211. R. Morillo-Velarde, «Forma y función de la fraseología en el Deçir que fizo Juan Alfonso de Baena», Corónica, 32, 2, 2004, págs. 45-68. V. Scandola Cenci, El tratamiento de la fraseología en los Diccionarios de la Real Academia Española (17262001): análisis fraseológico y fraseográfico. Contribución a la historia de la fraseología española, Universitat de València / Departamento de Filología Española, 2006 [tesis doctoral inédita dirigida por la Dra. Mª T. Echenique Elizondo]. Los trabajos presentados en el marco del VI Congreso Internacional de Historia de la Lengua Española, publicados en J. J. Bustos Tovar y J. L. Girón Alconchel (eds.), Actas del VI Congreso Internacional de

418

AnMal, XXXVI, 1-2, 2013

SANTIAGO VICENTE LLAVATA

de diseñar corpus diacrónicos digitales41. En este sentido, la fraseología como Historia de la Lengua Española, Universidad Complutense / Arco Libros / Asociación de Historia de la Lengua Española, Madrid, 2006: M. Quilis Merín, «Palabras y plumas el viento las lleva. La fraseología en los diálogos de los hermanos Alfonso y Juan de Valdés», págs. 2027-2038; A. Ricós Vidal, «Las unidades fraseológicas en los textos hispanos y lusos del siglo XVI. El ejemplo de Gil Vicente», págs. 2039-2050; A. García Valle, «Una primera aproximación al estudio de la formulación jurídica medieval de la Edad Media desde la perspectiva de la fraseología», págs. 1385-1399; S. Vicente Llavata, «La fraseología en los libros de viajes castellanos del siglo XV», págs. 2091-2101. A. García Valle y A. Ricós Vidal, «Estudio filológico comparativo de documentación peninsular medieval. Las fórmulas jurídicas desde la fraseología», en D. Trotter (ed.), Actes du XXIVe Congrès International de Linguistique et de Philologie Romanes (Aberystwyth 2004), Max Niemeyer Verlag, Tubinga, 2007, págs. 173-186. M. Velando Casanova, «Las unidades fraseológicas en la obra de Gonzalo de Berceo», en S. Fortuño y M. Casanova (eds.), José Luis Aguirre, maestro y escritor, Universitat Jaume I, Castellón, 2007. Mª T. Echenique Elizondo, «¿Tradición múltiple en la lexicografía vasco-latino-románica? Algunas notas sobre el componente fraseológico en diccionarios bilingües y trilingües de los siglos XVI al XVIII: de Nicolás Landuchio (1562) a José María Aizpitarte (c. 1785)», Philologia Hispalensis, 22, 2008, págs. 141-163. F. J. Satorre Grau, «Las locuciones adverbiales en la lexicografía hispanolatina del siglo de oro», en C. Company Company y J. Moreno de Alba (eds.), Actas del VII Congreso Internacional de Historia de la Lengua Española, Arco Libros / Asociación Internacional de Historia de la Lengua Española, Madrid, 2008, págs. 1125-1137. A. García Valle, «La Fraseología Histórica en el Fuero de Valfermoso de las Monjas: Fórmulas jurídicas y locuciones adverbiales», en Mª J. Martínez Alcalde y F. J. Satorre Grau (eds.), Actas del Simposio Internacional «El legado de Rafael Lapesa (Valencia, 1908-Madrid, 2001)», Biblioteca Valenciana / Sociedad Estatal de Conmemoraciones Culturales, Valencia, 2008, págs. 225-234. A. García Valle, «Locuciones adverbiales de ámbito jurídico: de los fueros medievales a su consolidación en la lengua», Revista de Filología Española, XC, 1, 2010, págs. 137-172. S. Vicente Llavata, Estudio de las locuciones en la obra literaria de don Íñigo López de Mendoza (Marqués de Santillana). Hacia una fraseología histórica del español, Quaderns de Filologia, Anejo 76, Universitat de València, 2011. V. Álvarez Vives, Estudio fraseológico contrastivo de las locuciones adverbiales en los diccionarios de Vicente Salvá y de Esteban Pichardo. Hacia una fraseología histórica del español en la lexicografía del siglo XIX, Quaderns de Filologia, Anejo 79, Universitat de València, 2013. V. Codita, Locuciones prepositivas en español medieval: siglos XIII-XV, Departamento de Filología Española de la Universitat de València / Eberhard-Karls Universïtat, Valencia / Tubinga, 2013 [tesis doctoral dirigida por la Dra. Mª T. Echenique Elizondo y por el Dr. Johannes Kabatek]. Hemos prescindido de trabajos centrados de manera exclusiva en la Paremiología. Para una visión de conjunto sobre los estudios publicados en este ámbito, véase el artículo de M. J. Aguilar Ruiz, «Fuentes bibliográficas para el estudio de las locuciones desde una perspectiva histórica: elaboración de corpus e inserción en diccionarios», Res Diachronicae, 8, 2010, págs. 123-135. 41 Un grupo de trabajo de la Universitat de València dirigido por la Dra. Mª Teresa Echenique Elizondo se ha dedicado en los últimos años al estudio histórico de la fraseología a partir de los proyectos DIAFRAES (Diacronía Fraseológica del español. Referencia: BFF20012958) e HISLA (Historia, codificación y fijeza de las locuciones adverbiales en un segmento temporal del español (1492-1596). HUM2005-02879 / FILO). Para una descripción de los principios y objetivos generales de esta disciplina, véanse los estudios siguientes: Mª T. Echenique Elizondo, «Pautas para el estudio histórico de las unidades fraseológicas», en J. L. Girón Alconchel, R. Santiago Lafuente y E. de Bustos Gisbert (eds.), Homenaje a José Jesús de Bustos Tovar, Editorial Complutense, Madrid, 2003, págs. 545-560. Mª T. Echenique Elizondo, «Notas de sintaxis histórica en el marco del corpus de diacronía fraseológica del español (DIAFRAES)», en E. Stark, R. Schmidt-Riese y E. Stoll (eds.), Romanische Syntax in Wandel, Gunter Narr Verlag, Tubinga, 2008, págs. 387-397. Mª T. Echenique Elizondo, «Algunas

HISTORIA DE LA LENGUA

AnMal, XXXVI, 1-2, 2013

419

fenómeno lingüístico particular presenta, ya de por sí, un conjunto de especiﬁcidades que provoca una reﬂexión profunda sobre el diseño y uso actual de corpus diacrónicos digitales. De hecho, las mismas propiedades generales que deﬁnen a la Fraseología se conforman como elementos singulares que se resisten, de manera general, a las sistematizaciones que pueden observarse en otros fenómenos lingüísticos. Así, propiedades como la pluriverbalidad, la frecuencia, la variación fraseológica o la existencia de palabras idiomáticas requieren de una reﬂexión profunda a la hora de diseñar e implementar corpus diacrónicos digitales42. La pluriverbalidad, en su condición de propiedad fundamental, encierra algunas diﬁcultades en el caso de algunas unidades que presentan diferentes formas de escribirse43, como es el caso de alalimón / al alimón, entretanto / entre tanto, enseguida / en seguida, aprisa (o deprisa) / a prisa (o de prisa), aposta / a posta, aporrillo / a porrillo, sobremanera / sobre manera, apenas / a penas, entremedias / entre medias44. Por su parte, la baja notas sobre latín y romance en la fraseología hispánica medieval», en R. Wright (ed.), Latin vulgaire-latin tardif VIII: Actes du VIII colloque international sur le latin vulgaire et tardif (Oxford, 6-9 de septiembre de 2006), St. Catherine’s College, Oxford, 2008, págs. 540-547. Mª T. Echenique Elizondo, «¿Tradición múltiple en la lexicografía vasco-latino-románica? Algunas notas sobre el componente fraseológico en diccionarios bilingües y trilingües de los siglos XVI al XVIII: de Nicolás Landuchio (1562) a José María Aizpitarte (c. 1785)», Philologia Hispalensis, 22, 2008, págs. 141-163. Mª T. Echenique Elizondo, «Locuciones adverbiales de origen romá-nico en la lengua vasca», en M. Iliescu, H. Siller-Runggaldier, P. Danler (eds.), Actes du XXVe Congrès International de Linguistique et Philologie Romanes (Innsbruck 2007), I, Walter de Gruyter, Berlín / Nueva York, 2010, págs. 295-303. Mª T. Echenique Elizondo y Mª J. Martínez Alcalde, Diacronía y gramática histórica de la lengua española (ed. revisada y aumentada), Tirant Humanidades, Valencia, 2011, así como los trabajos pioneros en el ámbito de la Fraseología histórica de J. Casares Sánchez, Introducción a la lexicografía moderna, CSIC, Madrid, 1992 [1950] y de R. Lapesa, «Alma y ánima en el Diccionario Histórico de la Lengua Española: su fraseología», en J. R. Lodares (ed.), Léxico e Historia, II: Diccionarios, Istmo, Madrid, 1992 [1980], págs. 79-86. R. Lapesa, «Sobre las construcciones “el diablo del toro”, el bueno de Minaya”, “¡ay de mí!”, “¡pobre de Juan!”, “por malos de pecados”», en R. Lapesa (ed. de R. Cano Aguilar y Mª T. Echenique Elizondo), op. cit., págs. 137-153. Finalmente, en relación con los proyectos DIAFRAES e HISLA, es necesario puntualizar que los trabajos iniciados en ellos se encuentran en fase de desarrollo y aplicación, por lo que los objetivos principales de esta línea innovadora de investigación todavía están abiertos a próximas iniciativas científicas. Remitimos a la nota anterior, en la que se recoge el detalle de algunos inventarios de fraseología histórica creados en el seno de este grupo de investigación y que podrán ser aprovechados para la creación de una base de datos propiamente fraseológica. 42 Nos hemos ocupado de esta cuestión en S. Vicente Llavata, «Sobre el aprovechamiento de corpus diacrónicos en el ámbito de estudio de la Fraseología histórica», Scriptum digital. Revista de corpus diacrónicos y edición digital en lenguas iberorrománicas, 2, 2013. La descripción que incluimos en estas líneas se ha tomado de la referencia mencionada. 43 Tal como afirma Mª T. Echenique Elizondo, «Pautas para el estudio histórico...», pág. 549: «De hecho, creo que es la visión escrita de ciertas unidades lingüísticas la que provoca la reflexión sobre su naturaleza, así como, y esto me parece importante, las conclusiones sobre su (in)corrección». 44 M. Quilis Merín, «Diccionario y normas ortográficas: panorama y aplicaciones en la lexicografía española de los siglos XVIII al XXI», en E. de Miguel, S. Sánchez, A. Serradilla, R. A. Radulescu y O. Batiukova (eds.), Fronteras de un diccionario. Las palabras en movimiento,

420

AnMal, XXXVI, 1-2, 2013

SANTIAGO VICENTE LLAVATA

frecuencia de algunas unidades fraseológicas obligan al investigador a complementar la información escasa que pueda ofrecer un corpus con otros canales de información ﬁlológica y lingüística, como son los datos de la Lexicografía histórica o de la Crítica Textual, entre otros muchos. La variación fraseológica, concretada en el estudio de la transmisión literaria en «variación textual», proporciona datos de gran relevancia para el estudio de la historia particular de una unidad, hasta el punto de condicionar de manera decisiva los resultados cientíﬁcos a los que nos es dado llegar45. Finalmente, el estudio de una unidad fraseológica con palabras idiomáticas está condicionado por la nula disponibilidad léxica de la voz diacrítica, con frecuencia caracterizada por un marcado carácter oral, que diﬁculta en buena parte su representación escrita. Como puede apreciarse, todas estas propiedades condicionan de manera poderosa el diseño (y posterior explotación) de corpus diacrónicos digitales en el ámbito de estudio de la Fraseología histórica, aunque de ningún modo pueden considerarse escollos insalvables a la hora de emprender una investigación de estas características. Descritas estas cuestiones de importancia, parece que existen algunos ámbitos más propicios que otros a la hora de ser sometidos a un análisis con corpus. Así, en el marco de los corpus diacrónicos digitales, la morfosintaxis histórica parece concentrar la mayor parte de los estudios elaborados desde la lingüística de corpus46. Si nos centramos especíﬁcamente, pues, en este ámbito, coincidimos con la valoración de Enrique-Arias, en el sentido de que las Nuevas Tecnologías existentes presentan una potencialidad de análisis, que puede resultar altamente fructífera con un conocimiento avanzado de las mismas. En este sentido, quizá uno de los aspectos que debería potenciarse a la hora de diseñar corpus diacrónicos digitales resida en la necesidad de poder establecer restricciones de búsqueda en torno a la ﬁliación discursiva de un fenómeno lingüístico dado, encaminadas a destacar precisamente la conexión constante entre esa forma y su cadena discursiva; conexión que, muy probablemente, podría verse enriquecida con un análisis profundo tanto de las coordenadas sociohistóricas que intervienen, así como de la renovación de los recursos estilísticos disponibles en cada época histórica. En deﬁnitiva, existen, en nuestra opinión, dos constataciones empíricas que deberían tenerse presente para que el diseño y el uso de corpus diacrónicos digitales se desarrolle de forma adecuada en el seno de nuestra comunidad Fundación San Millán de la Cogolla / Cilengua, San Millán de la Cogolla, 2009, págs. 83-120. En este caso concreto, el etiquetado gramatical de cada forma constituiría una gran ayuda a la hora de delimitar formas. 45 En su caracterización general sobre el diseño de corpus, afirma G. Rojo, op. cit., página 2472: «La construcción de corpus es, como he indicado antes, un trabajo de segundo nivel en este sentido y depende totalmente de lo que se haya hecho previamente sobre los textos». Ahora bien, reiteramos la necesidad de incorporar cada una de las variantes textuales que se recogen en el aparato crítico de las ediciones críticas. 46 Al menos en el ámbito hispánico.

HISTORIA DE LA LENGUA

AnMal, XXXVI, 1-2, 2013

421

cientíﬁca: por un lado, si tenemos en cuenta ámbitos de estudio caracterizados por una marcada interdisciplinariedad, parece razonable señalar que en esos ámbitos se debería partir de la idea de que los corpus diacrónicos digitales suponen una información relevante a la hora de plantear en su forma básica el estudio de un fenómeno lingüístico, pero que tal problema ﬁlológico necesita complementarse con datos procedentes de otros ámbitos representativos del fondo de tradición ﬁlológica, como la información procedente de las fuentes historiográﬁcas (ortografías, gramáticas y diccionarios principalmente, aunque sin olvidar otras fuentes menores), los datos extraídos de los diccionarios cronológicos (etimológicos e históricos) o el acopio sistemático de variantes que brinda la Crítica Textual, entre otros muchos. Por otro lado, en una visión pretendidamente más amplia, se debería abrir un espacio de discusión en torno a las potencialidades reales del uso de estos corpus en cada uno de los espacios iberorromances, puesto que la trayectoria histórica de cada uno de ellos ha resultado ser claramente asimétrica en diferentes sentidos.

Lihat lebih banyak...

Historia de la lengua, lingüística de corpus y cambio lingüístico. En torno a la irrupción de las Nuevas Tecnologías en la investigación histórica del español

Descripción

Comentarios