Cuantificación de la frecuencia estadística de los fonemas del cabécar por medio de un corpus electrónico

June 14, 2017 | Autor: G. González Campos | Categoría: Phonology, Cabecar Language, Quantitative Methods In Linguistics, Phonostatistic
Share Embed


Descripción

Cuantificación de la frecuencia estadística de los fonemas del cabécar por medio de un corpus electrónico
Guillermo González Campos
¿Cómo se hizo el conteo?
Se utilizó la fórmula:
=(LARGO(A7)-LARGO(SUSTITUIR(A7;$D$2;"")))*B7

Algunos datos
Cabécar de Chirripó
27 fonemas
3,58 fonemas por palabra
31.225 palabras
111.710 fonemas
Más numerosos: /a/, /k/, /d/, /i/, /ã/, /t/, /u/, /b/




Cabécar sureño
23 fonemas
3,60 fonemas por palabra
14.518 palabras
52.301 fonemas
Más numerosos: /a/, /k/, /i/, /d/, /ã/, /e/, /t/, /u/


Creación del transcriptor
Existes tres tipos de transcriptores
Por diccionario
Por reglas
Por uso de algoritmos sobre "grandes datos"
La ortografía del cabécar sigue el "principio fonémico".
Debe resolver dos problemas:
El teclado chibcha: apilación de los clíticos.
El tratamiento de tres grafemas: w y ä en el cabécar de Chirripó y n en ambas variedades de la lengua.
Se utiliza la fórmula "=sustituir(texto, texto_original, texto_nuevo, [núm_de_instancia])"

Esquema de la presentación
Introducción
Sobre el cabécar
Objetivos de la investigación
Etapas de la investigación
Sobre el corpus
Creación del transcriptor
¿Cómo se hizo el conteo?
Algunos datos


Introducción
¿Por qué hacerlo?
En nuestro ámbito existe una carencia de este tipo de estudios.
"Our sample of 95 languages does not include languages from all language families. American and African languages are notably underrepresented. We were limited to languages for which we could find or compute tabulations of phoneme frequencies" Tambovtsev & Martindale (2007, p. 4).
¿Para qué sirve el cálculo?
Desarrollo de tecnologías del lenguaje.
¿Por qué nadie lo ha hecho antes? ¿Es difícil hacerlo?
Se requiere un corpus electrónico. La lingüística computacional está poco desarrollada en la región.
Sobre el cabécar
El cabécar es una de las cinco lenguas indígenas que aún se habla en territorio costarricense. De todas, es la lengua con mayor número de hablantes.
11 133 (Censo del 2011)
Actualmente, el territorio donde vive la mayor parte de la población cabécar es Chirripó, el cual fue definido jurídicamente en 1976 y abarca la parte alta del río Chirripó (Duchí).
6650 (Censo del 2011)

Mapa – Territorios cabécares actuales
1. Naírí Awarí
2. Bajo Chirripó
3. Alto Chirripó
4. Tayní
5. Telire
6. Ujarrás
7. Talamanca Cabécar
8. Chína Kicha

Objetivos
Los objetivos que se intentan alcanzar a través de esta investigación son los siguientes:
Conformar un corpus electrónico del cabécar que contenga todos los materiales lingüísticos disponibles en dicha lengua.
Cuantificar las frecuencias estadísticas de los fonemas del cabécar de forma automatizada en un corpus electrónico del cabécar.
Analizar desde un punto de vista estadístico la distribución de las frecuencias de aparición de los fonemas del cabécar.

Sobre el corpus
Incluye todo lo que existe y está disponible sobre el cabécar.
No incluye: Nuevo Testamento cabécar (2 versiones), libro El banquete de Sibú ni material de La Estrella.
Es un "corpus oportunista".
Es un corpus anotado de forma semiautomática.
Está creado con FieldWorks Language Explorer (FLEx).
Etapas de la investigación
Digitalización de los textos y conformación del corpus electrónico
Dos subcorpora: A. Cabécar de Chirripó y B. Cabécar sureño.
Diseño e implementación del modelo de transcripción fonológica automática
Implementación del transcriptor en Excel
Cálculo de las frecuencias fonémicas
Implementación del conteo en Excel
Haga clic para modificar el estilo de título del patrón
Haga clic para modificar el estilo de texto del patrón
Segundo nivel
Tercer nivel
Cuarto nivel
Quinto nivel
27/08/2015





Haga clic para modificar el estilo de texto del patrón



Haga clic para modificar el estilo de título del patrón

27/08/2015


Haga clic en el icono para agregar una imagen
Haga clic para modificar el estilo de título del patrón
Haga clic para modificar el estilo de texto del patrón
Segundo nivel
Tercer nivel
Cuarto nivel
Quinto nivel
Haga clic para modificar el estilo de texto del patrón
Segundo nivel
Tercer nivel
Cuarto nivel
Quinto nivel
27/08/2015


Haga clic para modificar el estilo de texto del patrón
Haga clic para modificar el estilo de texto del patrón
Haga clic para modificar el estilo de título del patrón
27/08/2015


27/08/2015


Haga clic para modificar el estilo de título del patrón
27/08/2015


Haga clic para modificar el estilo de texto del patrón
Haga clic para modificar el estilo de texto del patrón
Segundo nivel
Tercer nivel
Cuarto nivel
Quinto nivel
Haga clic para modificar el estilo de título del patrón
Haga clic para modificar el estilo de texto del patrón
Segundo nivel
Tercer nivel
Cuarto nivel
Quinto nivel
27/08/2015


Haga clic para modificar el estilo de título del patrón
Haga clic para modificar el estilo de texto del patrón
Segundo nivel
Tercer nivel
Cuarto nivel
Quinto nivel
Haga clic para modificar el estilo de texto del patrón
Segundo nivel
Tercer nivel
Cuarto nivel
Quinto nivel
27/08/2015


Haga clic para modificar el estilo de título del patrón
27/08/2015


Haga clic para modificar el estilo de texto del patrón
Segundo nivel
Tercer nivel
Cuarto nivel
Quinto nivel
Haga clic para modificar el estilo de título del patrón
30/6/2006


Haga clic para modificar el estilo de texto del patrón
Segundo nivel
Tercer nivel
Cuarto nivel
Quinto nivel
Haga clic para modificar el estilo de título del patrón
Haga clic para modificar el estilo de texto del patrón
Segundo nivel
Tercer nivel
Cuarto nivel
Quinto nivel
27/08/2015








Haga clic para modificar el estilo de título del patrón
Haga clic para modificar el estilo de subtítulo del patrón
27/08/2015


Haga clic para modificar el estilo de texto del patrón



Haga clic para modificar el estilo de título del patrón
27/08/2015



Lihat lebih banyak...

Comentarios

Copyright © 2017 DATOSPDF Inc.