{"id":4953,"date":"2024-05-24T07:00:00","date_gmt":"2024-05-24T05:00:00","guid":{"rendered":"https:\/\/www.safecreative.org\/tips\/es\/?p=4953"},"modified":"2025-08-18T13:25:02","modified_gmt":"2025-08-18T11:25:02","slug":"alia-el-chatgpt-espanol-que-respetara-los-derechos-de-autor","status":"publish","type":"post","link":"https:\/\/www.safecreative.org\/tips\/es\/alia-el-chatgpt-espanol-que-respetara-los-derechos-de-autor\/","title":{"rendered":"Alia, el ChatGPT espa\u00f1ol, podr\u00eda cumplir las normas de derechos de autor"},"content":{"rendered":"\n<p>En septiembre estar\u00e1 disponible el primer modelo de lenguaje de inteligencia artificial (IA) en Espa\u00f1a. Alia, conocido como el ChatGPT espa\u00f1ol, se est\u00e1 entrenando con 175 millones de \u00abpar\u00e1metros\u00bb en castellano y las lenguas cooficiales. De esta forma, se espera eludir incidencias por falta de calidad de los datos, la generaci\u00f3n de sesgos y no respetar los derechos de autor de las obras de las que se extraen.<\/p>\n\n\n\n<p>Al proyecto, desarrollado en colaboraci\u00f3n el Centro de Supercomputaci\u00f3n de Barcelona (BSC) aportando su capacidad de computaci\u00f3n con el superordenador Mare Nostrum, se han sumado ahora <strong>15 <a href=\"https:\/\/portal.mineco.gob.es\/RecursosNoticia\/mineco\/prensa\/noticias\/2024\/20240513_ConvenioGobernanza.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">instituciones<\/a>.<\/strong> Entre ellas, se encuentran el Instituto Cervantes, la Real Academia Espa\u00f1ola (RAE), las academias de las lenguas vasca, gallega y valenciana, el Institut d\u2019Estudis Catalans, as\u00ed como la Biblioteca Nacional, que conserva el <em>corpus<\/em> documental m\u00e1s grande en castellano y en lenguas cooficiales. Tambi\u00e9n est\u00e1 previsto agregar el<strong> material de las Academias de la Lengua de Am\u00e9rica Latina.&nbsp;<\/strong><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Garantizar seguridad, calidad y anonimato&nbsp;<\/h2>\n\n\n\n<p>El objetivo es realizar el seguimiento del modelo de gobernanza de datos y <em>corpus<\/em> que han acordado para garantizar a los usuarios de Alia est\u00e1ndares de seguridad, anonimato, calidad, interoperabilidad y reutilizaci\u00f3n de los datos.&nbsp;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Cumplir con la regulaci\u00f3n de los derechos de autor&nbsp;<\/h2>\n\n\n\n<p>Se prev\u00e9 que Alia llegue a manejar un m\u00ednimo de cuatro millones de palabras para generar un modelo de IA con 175 millones de par\u00e1metros. <strong>La Agencia Espa\u00f1ola de Supervisi\u00f3n de la Inteligencia Artificial (AESIA)<\/strong> certificar\u00e1 estos par\u00e1metros de forma abierta y transparente, y \u00abcon estricto respeto a los derechos de los autores\u00bb, aseguran desde el Ministerio para la Transformaci\u00f3n Digital y de la Funci\u00f3n P\u00fablica.&nbsp;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Transparencia respecto al entrenamiento del modelo&nbsp;<\/h2>\n\n\n\n<p>La iniciativa se enmarca en la nueva Estrategia de Inteligencia Artificial para 2024-2025, que ha acaba de presentar el Gobierno espa\u00f1ol. La intenci\u00f3n del ejecutivo es \u00abhacer p\u00fablica la informaci\u00f3n relativa a Alia para que se conozca desde la composici\u00f3n de los <em>corpus<\/em> hasta los entrenamientos realizados, pasando por la estructura de los modelos y los recursos que se han utilizado\u00bb, seg\u00fan el documento.\u00a0\u00a0<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Un 20% del <em>corpus<\/em> inicial en espa\u00f1ol&nbsp;<\/h2>\n\n\n\n<p>Seg\u00fan el ministerio, en Alia se va a conseguir que \u00abel 20% del <em>corpus<\/em> inicial de la herramienta sean datos en espa\u00f1ol, porque los LLM existentes hasta ahora apenas llegan al 5% de datos en nuestro idioma\u00bb. Explica que para utilizar la IA a nivel profesional y p\u00fablico, cuando se cuenta con <strong>un modelo entrenado sobre todo en ingl\u00e9s, presenta sesgos importantes al traducir<\/strong> las respuestas que ofrece la IA generativa. \u00abQueremos utilizar, otras bases de datos, otros textos que est\u00e1n genuinamente en castellano, en catal\u00e1n o en euskera, y es lo que estamos trabajando, por ejemplo, en la Rioja donde est\u00e1 el mayor repositorio de art\u00edculos cient\u00edficos de castellano\u00bb, seg\u00fan recoge Merca2.&nbsp;&nbsp;<\/p>\n\n\n\n<p>En el entrenamiento futuro de la IA espa\u00f1ola no descartan que se incorporen los datos de fuentes como la Academia de la Historia, los grandes grupos de comunicaci\u00f3n o los fondos de RTVE y todas aquellas instituciones que guarden informaci\u00f3n de calidad en espa\u00f1ol.&nbsp;<\/p>\n\n\n\n<p>Fuentes: <a href=\"https:\/\/portal.mineco.gob.es\/es-es\/comunicacion\/Paginas\/20240514-Gobierno-aprueba-Estrategia-IA-2024.aspx\" target=\"_blank\" rel=\"noreferrer noopener\">Mineco<\/a>, <a href=\"https:\/\/www.merca2.es\/2024\/05\/18\/alia-chatgpt-espanol-sesgos-1673600\/\" target=\"_blank\" rel=\"noreferrer noopener\">Merca2<\/a>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Adem\u00e1s de esquivar el sesgo anglosaj\u00f3n de otros LLM, los impulsores de Alia aseguran que respetar\u00e1 los derechos de autor.<\/p>\n","protected":false},"author":4,"featured_media":4954,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[2,48],"tags":[12,95,33],"class_list":{"0":"post-4953","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-noticias","8":"category-tema-del-momento","10":"tag-espana","11":"tag-inteligencia-artificial"},"acf":[],"_links":{"self":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts\/4953","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/comments?post=4953"}],"version-history":[{"count":5,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts\/4953\/revisions"}],"predecessor-version":[{"id":12015,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts\/4953\/revisions\/12015"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/media\/4954"}],"wp:attachment":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/media?parent=4953"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/categories?post=4953"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/tags?post=4953"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}