Corpus: el pan en la lengua

Los que vivimos en Madrid disfrutamos hoy de una día de fiesta. ¿Qué fiesta católica festejamos hoy? El día del corpus.

Al Molino de Ideas nos alegra mucho que la sociedad occidental en general, y en concreto la madrileña, festejemos el día de una herramienta lingüística tan útil y que tanto ha modificado la investigación en lengua desde hace años.

Para los que no lo sepan, los corpus son programas que te permiten consultar y modificar grandes bases de texto. Eso nos sirve a los lingüistas para saber por ejemplo con qué palabras aparece el verbo tratar, qué locución es más frecuente o cuántas palabras hay que terminen en *ción. Por poner algunos ejemplos.

Los corpus más famosos que existen en español son los dos de la Real Academia CREA y CORDE y el corpus del estadounidense Mark Davies. Estos grandes corpus tienen entre 100 y 200 millones de palabras.

Para celebrar el día de hoy, el Molino presenta en primicia una captura de nuestro corpus, que lanzaremos en breve (quizás en unos días). Vamos adelantando que tiene bastantes más palabras que los de la RAE. Y lo lanzamos como lab, porque esto es sólo el principio 😉

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.