La base de datos
Características
La Base de datos de morfología del español (BDME) está concebida como un archivo morfológico de carácter diacrónico, que permitirá obtener información precisa sobre como se organizan las palabras en el interior de familias léxicas. En este banco de datos se almacenan propiedades morfológicas del léxico de varias lenguas emparentadas, en especial del español y del latín. A partir de la palabra-raíz de cada familia léxica que, en muchos casos, tendrá origen latino, se agrupan todas las voces que la integran y se efectúa un análisis morfológico minucioso de cada uno de los vocablos incorporados a la base.
El trabajo del equipo consiste en introducir el léxico documentado en diferentes épocas del español, en analizar cada palabra morfológicamente (categoría léxica o clase de palabras, base, proceso morfológico, etc.) y en establecer su relación genética (origen latino, griego, préstamo de otras lenguas), con objeto de obtener una representación de las familias y subfamilias léxicas en diferentes épocas del español.
Los términos están relacionados por dos tipos de parentesco (simultánea o alternativamente, según la historia de cada palabra):
1. Origen, que establece los vínculos etimológicos.
2. Base, que establece los vínculos morfológicos dentro de una misma lengua.
Se ha diseñado un formulario estándar de introducción de datos, que en el periodo 2009-2011 ha sido sometido a diversos reajustes motivados por la incorporación de un mayor número de propiedades.
Para cada término, se recogen informaciones como las siguientes:
LENGUA: el idioma al que pertenece el término analizado. El desplegable de lenguas es accesible alfabéticamente, salvo las lenguas más frecuentes que aparecen en primer lugar (español, latín, catalán, francés, gallego, griego, inglés, italiano, occitano, portugués).
TÉRMINO: la forma de cita de la palabra analizada.
ENTRADA: ofrece las variaciones flexivas.
SINONIMIA AFIJAL: términos con afijos distintos e idéntico valor morfológico.
VARIANTES: variaciones gráficas.
HIPOTÉTICA: indica si el vocablo no está documentado.
SIGNIFICADO: subdividido en SIMPLE, glosa breve para las palabras raíces y MORFOLÓGICO, significado tipo para las palabras derivadas.
MARCAS DE FORMA: Culta / Popular
MARCAS DE USO (Geográfica, Histórica, Social, Registro, Ámbito, Histórica NDHE), específicas en función de la lengua analizada. Las marcas están jerarquizadas y son seleccionadas mediante desplegables).
CLASE de palabras del término analizado.
ORIGEN: antecedente inmediato de la palabra analizada. Mediante un Buscador, se localiza la palabra asociada a la lengua originaria, lo que impone un orden rígido a la introducción de datos.
BASE: para palabras derivadas y compuestas, bases morfológicas del término analizado. Las bases provienen del listado de términos de una lengua y se localizan mediante un buscador, lo que impone secuencialidad al análisis.
PROCESO de formación: con selección del procedimiento de formación. Está admitida la combinación de procesos.
TIPO DE AFIJO: Al marcar prefijación se accede a un desplegable con la lista de prefijos para seleccionar el adecuado. Al marcar sufijación, se accede a uno (o varios) desplegable(s) con una lista de sufijos.
HISTORIAL: campo de observaciones.
EJEMPLOS
DATACIÓN: primera documentación e última documentación