In lieu of an abstract, here is a brief excerpt of the content:

Information Technology and Hispanic Studies RESEÑA DEL CORPUS DEL ESPAÑOL DE MARK DAVIES Josep Alba-Salas College ofthe Holy Cross El Corpus del, español es, sin duda alguna, el mejor corpus del idioma existente. Creado por Mark Davies en el 2001-2002 con fondos del National Endowmentfor the Humanities de los EEUU, esta base de datos fue actualizada con una nueva versión en el 2003. Se trata de un corpus en línea de acceso gratuito, al que puede accederse en sin necesidad de registrarse.1 El corpus contiene cien millones de palabras procedentes de casi diez mil textos, y abarca desde el siglo XIII al XX, presentando en una única base de datos lo que el otro gran corpus del español (el de la Real Academia Española) divide en dos bases de datos independientes, aunque ligadas: el CREA (Corpus de Referencia del Español Actual, que cubre de 1979 a 1999) y el CORDE (Corpus Diacrònico del Español, que incluye desde los orígenes del español a 1979). Los textos incluidos en el Corpus del español provienen tanto del español peninsular como del de América. Para el siglo XX, los textos están divididos a partes iguales en tres grupos o registros: literatura, textos orales (entrevistas y transcripciones), y otros textos (artículos de periódicos y enciclopedias; cf. sección 4). 1 Dada la mutabilidad inherente a toda base de datos accesible por internet, conviene advertir al lector que la presente reseña se elaboró durante el mes de noviembre del 2004. El usuario interesado en mantenerse al tanto de cualquier actualización del Cotpus del español posterior a esta fecha puede hacerlo fácilmente inscribiéndose en la lista de correo electrónico que aparece a tal efecto en el área de Ayuda del corpus (cf. sección 1 .3). La corónica 33.1 (Fall, 2004): 207-29 208Josep Alba-SalasLa coránica 33.1, 2004 Como veremos a continuación, el Corpus del español se destaca del CORDE y el CREA por su útilísima interfaz gráfica, por su arquitectura innovadora, y por la variedad, rapidez y complejidad de búsquedas que permite (por categoría gramatical, lema, patrones léxicos, frecuencia, y sinónimos o antónimos, entre otras). 1 . Interfaz gráfica La interfaz gráfica del Corpus del español es de una funcionalidad exquisita, y supera con creces la del CORDE/CREA. Todo está pensado para facilitar la labor del usuario, desde la opción de cambiar la lengua . de interfaz del inglés al español o viceversa, hasta la posibilidad de aumentar el tamaño de la letra para usuarios de Mac o Linux/Unix, pasando por una sección de Ayuda útilísima, así como un excelente diseño visual, con un uso eficaz del espacio, gráficos y colores, y tablas bien organizadas y fáciles de leer. Además, tanto las tablas de resultados como los ejemplos de ocurrencias y cualquier material que aparece en la pantalla puede imprimirse o exportarse a Word, Excel y otros programas sin ninguna dificultad. Como se ilustra en la Figura 1 , la pantalla del Corpus del español se divide en tres ventanas independientes situadas una debajo de la otra sin separación: Opciones, Resultados, y Ayuda/Palabras clave en contexto. Veamos cada ventana por separado. 1.1. Ventana de Opciones La parte superior izquierda de la ventana de Opciones proporciona enlaces a la página web de Mark Davies, las dos universidades donde desarrolló el corpus (Illinois State University y Bringham Young University ), y el National Endowment for the Humanities. La parte superior derecha contiene un botón que nos permite cambiar la lengua de interfaz del inglés (la opción por defecto) al español o viceversa ('Use English/Usar español'), otro que proporciona una introducción al corpus ('Introducción'), y un tercero que nos ofrece una breve guía virtual del mismo ('Guía'). La información obtenida pulsando en estos dos últimos botones se muestra en la ventana de Ayuda/Palabras clave en contexto de la parte inferior...

pdf

Share