FineDesc Learner Corpus 2.0

/ Registration: 2510243469857

10/24/2025

2510243469857

About the work

FineDesc Learner Corpus 2.0 contiene 1,3 millones de palabras repartidas en tres niveles de competencia lingüística (B1, B2 y C1, siguiendo la clasificación y criterios del Marco Común Europeo de Referencia para las Lenguas).

El corpus está compilado teniendo en cuenta variables relacionadas con la persona que escribe el texto (o los textos): a) lengua materna (bilingüismo con lengua cooficial); b) género y; c) realización de un curso de preparación para el examen; así como variables relacionadas con el tipo de texto escrito: a) nivel de competencia lingüística mostrada en el texto; b) grado de formalidad del mismo; c) tipo de texto; d) función comunicativa del texto; y e) tema del texto.

Las aplicaciones que tiene el FineDesc Learner Corpus 2.0 se pueden dividir en cinco bloques:
a. Diseño de materiales específicos (libros de texto, materiales didácticos, etc.) para alumnado de inglés como lengua extranjera cuya lengua materna es el español en tres niveles del Marco Común Europeo de Referencia para las Lenguas (B1, B2 y C1).
b. Diseño y validación de rúbricas de evaluación para el alumnado anteriormente descrito en los niveles especificados.
c. Diseño y validación de exámenes de acreditación.
d. Desarrollo de software basado en Procesamiento de Lenguaje Natural para determinar de forma (semi-)automática el nivel (B1, B2 o C1) de un texto escrito por alumnado con las características anteriormente descritas.
e. Creación de checklists para la auto-evaluación del alumnado en diferentes tipos de texto y niveles
f. Mejora en la creación de futuros corpus de estudiantes

FineDesc Learner Corpus 2.0 es un producto único, que generará conocimiento en diferentes campos de investigación y será utilizado para avanzar en dichos campos y sus aplicaciones a el proceso de enseñanza-aprendizaje, evaluación y acreditación del inglés como lengua extranjera.

FineDesc Learner Corpus 2.0 es resultado del proyecto de investigación "Making the CEFR/CV more user-friendly: fine-tuning descriptors with Learner Corpus Research (LCR) results" (Grant PID2020-117041GA-I00, funded MICIU/AEI/10.13039/501100011033), financiado por el Ministerio de Ciencia, Innovación y Universidades.

Technical

learner corpus

evaluación de idiomas

marco común europeo de referencia para las lengua

language assessment

english as a forein language

common european framework of reference for langua

competencia comunicativa

communicative competence

Print work information

Get Information Note (USD 23)

Copyright registered declarations

Universidad de Jaén

Explotación

Universal
Scope: Universal

Consolidated inscription:

Attached documents:

Contact

María Belén Díez Bedmar

Author

Consolidated inscription:

Attached documents:

Contact

Notify irregularities in this registration

AI Availability Declaration

This work cannot be made available to AI systems.

Print work information

Work information

Title FineDesc Learner Corpus 2.0
FineDesc Learner Corpus 2.0 contiene 1,3 millones de palabras repartidas en tres niveles de competencia lingüística (B1, B2 y C1, siguiendo la clasificación y criterios del Marco Común Europeo de Referencia para las Lenguas).

El corpus está compilado teniendo en cuenta variables relacionadas con la persona que escribe el texto (o los textos): a) lengua materna (bilingüismo con lengua cooficial); b) género y; c) realización de un curso de preparación para el examen; así como variables relacionadas con el tipo de texto escrito: a) nivel de competencia lingüística mostrada en el texto; b) grado de formalidad del mismo; c) tipo de texto; d) función comunicativa del texto; y e) tema del texto.

Las aplicaciones que tiene el FineDesc Learner Corpus 2.0 se pueden dividir en cinco bloques:
a. Diseño de materiales específicos (libros de texto, materiales didácticos, etc.) para alumnado de inglés como lengua extranjera cuya lengua materna es el español en tres niveles del Marco Común Europeo de Referencia para las Lenguas (B1, B2 y C1).
b. Diseño y validación de rúbricas de evaluación para el alumnado anteriormente descrito en los niveles especificados.
c. Diseño y validación de exámenes de acreditación.
d. Desarrollo de software basado en Procesamiento de Lenguaje Natural para determinar de forma (semi-)automática el nivel (B1, B2 o C1) de un texto escrito por alumnado con las características anteriormente descritas.
e. Creación de checklists para la auto-evaluación del alumnado en diferentes tipos de texto y niveles
f. Mejora en la creación de futuros corpus de estudiantes

FineDesc Learner Corpus 2.0 es un producto único, que generará conocimiento en diferentes campos de investigación y será utilizado para avanzar en dichos campos y sus aplicaciones a el proceso de enseñanza-aprendizaje, evaluación y acreditación del inglés como lengua extranjera.

FineDesc Learner Corpus 2.0 es resultado del proyecto de investigación "Making the CEFR/CV more user-friendly: fine-tuning descriptors with Learner Corpus Research (LCR) results" (Grant PID2020-117041GA-I00, funded MICIU/AEI/10.13039/501100011033), financiado por el Ministerio de Ciencia, Innovación y Universidades.
Work type Technical
Tags learner corpus, evaluación de idiomas, marco común europeo de referencia para las lengua, language assessment, english as a forein language, common european framework of reference for langua, competencia comunicativa, communicative competence

-------------------------

Registry info in Safe Creative

Identifier 2510243469857
Entry date Oct 24, 2025, 9:21 AM UTC
License All rights reserved

-------------------------

Copyright registered declarations

Explotación 100.00 %. Holder Universidad de Jaén. Date Oct 24, 2025. Geographic coverage: Universal. Scope Universal.
Author 100.00 %. Holder María Belén Díez Bedmar. Date Oct 24, 2025.

Information available at https://www.safecreative.org/work/2510243469857-finedesc-learner-corpus-2-0