FineDesc Learner Corpus 2.0
10/24/2025
2510243469857

About the work

FineDesc Learner Corpus 2.0 contiene 1,3 millones de palabras repartidas en tres niveles de competencia lingüística (B1, B2 y C1, siguiendo la clasificación y criterios del Marco Común Europeo de Referencia para las Lenguas).

El corpus está compilado teniendo en cuenta variables relacionadas con la persona que escribe el texto (o los textos): a) lengua materna (bilingüismo con lengua cooficial); b) género y; c) realización de un curso de preparación para el examen; así como variables relacionadas con el tipo de texto escrito: a) nivel de competencia lingüística mostrada en el texto; b) grado de formalidad del mismo; c) tipo de texto; d) función comunicativa del texto; y e) tema del texto.

Las aplicaciones que tiene el FineDesc Learner Corpus 2.0 se pueden dividir en cinco bloques:
a. Diseño de materiales específicos (libros de texto, materiales didácticos, etc.) para alumnado de inglés como lengua extranjera cuya lengua materna es el español en tres niveles del Marco Común Europeo de Referencia para las Lenguas (B1, B2 y C1).
b. Diseño y validación de rúbricas de evaluación para el alumnado anteriormente descrito en los niveles especificados.
c. Diseño y validación de exámenes de acreditación.
d. Desarrollo de software basado en Procesamiento de Lenguaje Natural para determinar de forma (semi-)automática el nivel (B1, B2 o C1) de un texto escrito por alumnado con las características anteriormente descritas.
e. Creación de checklists para la auto-evaluación del alumnado en diferentes tipos de texto y niveles
f. Mejora en la creación de futuros corpus de estudiantes

FineDesc Learner Corpus 2.0 es un producto único, que generará conocimiento en diferentes campos de investigación y será utilizado para avanzar en dichos campos y sus aplicaciones a el proceso de enseñanza-aprendizaje, evaluación y acreditación del inglés como lengua extranjera.

FineDesc Learner Corpus 2.0 es resultado del proyecto de investigación "Making the CEFR/CV more user-friendly: fine-tuning descriptors with Learner Corpus Research (LCR) results" (Grant PID2020-117041GA-I00, funded MICIU/AEI/10.13039/501100011033), financiado por el Ministerio de Ciencia, Innovación y Universidades.

Technical
learner corpus
evaluación de idiomas
marco común europeo de referencia para las lengua
language assessment
english as a forein language
common european framework of reference for langua
competencia comunicativa
communicative competence

Copyright registered declarations

UD
Universidad de Jaén
Explotación
Universal
Scope: Universal
Consolidated inscription:
Attached documents:
0
Copyright infringement notifications:
0
Contact
MB
María Belén Díez Bedmar
Author
Consolidated inscription:
Attached documents:
0
Copyright infringement notifications:
0
Contact

Notify irregularities in this registration

AI Availability Declaration

This work cannot be made available to AI systems.

Print work information
Work information

Title FineDesc Learner Corpus 2.0
FineDesc Learner Corpus 2.0 contiene 1,3 millones de palabras repartidas en tres niveles de competencia lingüística (B1, B2 y C1, siguiendo la clasificación y criterios del Marco Común Europeo de Referencia para las Lenguas).

El corpus está compilado teniendo en cuenta variables relacionadas con la persona que escribe el texto (o los textos): a) lengua materna (bilingüismo con lengua cooficial); b) género y; c) realización de un curso de preparación para el examen; así como variables relacionadas con el tipo de texto escrito: a) nivel de competencia lingüística mostrada en el texto; b) grado de formalidad del mismo; c) tipo de texto; d) función comunicativa del texto; y e) tema del texto.

Las aplicaciones que tiene el FineDesc Learner Corpus 2.0 se pueden dividir en cinco bloques:
a. Diseño de materiales específicos (libros de texto, materiales didácticos, etc.) para alumnado de inglés como lengua extranjera cuya lengua materna es el español en tres niveles del Marco Común Europeo de Referencia para las Lenguas (B1, B2 y C1).
b. Diseño y validación de rúbricas de evaluación para el alumnado anteriormente descrito en los niveles especificados.
c. Diseño y validación de exámenes de acreditación.
d. Desarrollo de software basado en Procesamiento de Lenguaje Natural para determinar de forma (semi-)automática el nivel (B1, B2 o C1) de un texto escrito por alumnado con las características anteriormente descritas.
e. Creación de checklists para la auto-evaluación del alumnado en diferentes tipos de texto y niveles
f. Mejora en la creación de futuros corpus de estudiantes

FineDesc Learner Corpus 2.0 es un producto único, que generará conocimiento en diferentes campos de investigación y será utilizado para avanzar en dichos campos y sus aplicaciones a el proceso de enseñanza-aprendizaje, evaluación y acreditación del inglés como lengua extranjera.

FineDesc Learner Corpus 2.0 es resultado del proyecto de investigación "Making the CEFR/CV more user-friendly: fine-tuning descriptors with Learner Corpus Research (LCR) results" (Grant PID2020-117041GA-I00, funded MICIU/AEI/10.13039/501100011033), financiado por el Ministerio de Ciencia, Innovación y Universidades.
Work type Technical
Tags learner corpus, evaluación de idiomas, marco común europeo de referencia para las lengua, language assessment, english as a forein language, common european framework of reference for langua, competencia comunicativa, communicative competence

-------------------------

Registry info in Safe Creative

Identifier 2510243469857
Entry date Oct 24, 2025, 9:21 AM UTC
License All rights reserved

-------------------------

Copyright registered declarations

Explotación 100.00 %. Holder Universidad de Jaén. Date Oct 24, 2025. Geographic coverage: Universal. Scope Universal.
Author 100.00 %. Holder María Belén Díez Bedmar. Date Oct 24, 2025.


Information available at https://www.safecreative.org/work/2510243469857-finedesc-learner-corpus-2-0
© 2026 Safe Creative