{"id":3165,"date":"2024-03-19T08:00:00","date_gmt":"2024-03-19T07:00:00","guid":{"rendered":"https:\/\/www.safecreative.org\/tips\/es\/?p=3165"},"modified":"2025-08-19T08:58:06","modified_gmt":"2025-08-19T06:58:06","slug":"gpt4-el-modelo-de-ia-que-mas-infringe-los-derechos-de-autor","status":"publish","type":"post","link":"https:\/\/www.safecreative.org\/tips\/es\/gpt4-el-modelo-de-ia-que-mas-infringe-los-derechos-de-autor\/","title":{"rendered":"GPT4, el modelo de IA que m\u00e1s infringe los derechos de autor"},"content":{"rendered":"\n<p>Un reciente <a href=\"https:\/\/www.patronus.ai\/blog\/introducing-copyright-catcher\">an\u00e1lisis<\/a> de las cuatro herramientas de inteligencia artificial (IA) generativa m\u00e1s utilizadas desvela su escaso respeto por el copyright. GPT4 de OpenAI lidera el porcentaje de infracciones, seg\u00fan este <strong>informe realizado por Patronus AI,<\/strong> compa\u00f1\u00eda fundada por antiguos investigadores de Meta y especializada en el an\u00e1lisis de grandes modelos de lenguaje (LLM).<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Frecuencia de uso de texto protegido por copyright<\/h2>\n\n\n\n<p>Los modelos que han probado con <strong><a href=\"https:\/\/copyrightcatcher.patronus.ai\/\">CopyrightCatcher,<\/a><\/strong> herramienta dise\u00f1ada por la firma para detectar infracciones en los derechos de autor\u00eda, son <strong>GPT4<\/strong> de OpenAI, <strong>Claude 2<\/strong> de Antropic, <strong>Llama 2<\/strong> de Meta y <strong>Mixtral<\/strong> de Mistral AI. El objetivo ha sido medir la frecuencia con la que responden con texto protegido por derechos de autor a las consultas de los usuarios. La prueba se ha realizado con una selecci\u00f3n de los libros m\u00e1s populares protegidos por derechos de autor en Estados Unidos de la red social <a href=\"https:\/\/www.goodreads.com\/\">Goodreads<\/a>, que cuenta con m\u00e1s de 90 millones de usuarios registrados.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Claude, la IA menos intrusiva<\/h2>\n\n\n\n<p>Rebecca Qian, cofundadora y directora de tecnolog\u00eda de Patronus AI, ha asegurado en una entrevista de <a href=\"https:\/\/www.cnbc.com\/2024\/03\/06\/gpt-4-researchers-tested-leading-ai-models-for-copyright-infringement.html\">CNBC<\/a> que, en todos los modelos evaluados, \u00abencontramos contenido protegido por derechos de autor en todos los \u00e1mbitos, ya sea de c\u00f3digo abierto o de c\u00f3digo cerrado\u00bb. No obstante, lo que m\u00e1s sorprendi\u00f3 es que GPT4, el modelo que utilizan muchas empresas y desarrolladores individuales, \u00abprodujo contenido protegido por derechos de autor en el 44% de las preguntas que construimos\u00bb. En el lado opuesto, seg\u00fan los <a href=\"https:\/\/www.prnewswire.com\/news-releases\/patronus-ai-launches-industry-first-solution-to-detect-copyrighted-content-generated-by-llms-302081438.html\">resultados<\/a> que arroja el estudio, se sit\u00faa Claude 2, con el 8%, mientras que Mixtral lo produce en el 22% y Llama 2 en el 10%.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Lo ideal, parafrasear los conceptos<\/h2>\n\n\n\n<p>Los propios investigadores se\u00f1alan que en el estudio han examinado \u00absi el texto generado incluye cien o m\u00e1s caracteres reproducidos directamente de un libro protegido por derechos de autor\u00bb. Aunque, \u00abpara minimizar los riesgos de infracci\u00f3n, lo ideal ser\u00eda que el modelo se abstuviera de reproducir texto literal de estos libros y, en su lugar, parafraseara los conceptos\u00bb. Construyeron cien preguntas o <em>prompts:<\/em> la mitad para solicitar al modelo el primer cap\u00edtulo de un libro y otras tantas que le ped\u00edan completar el fragmento que le ofrec\u00edan de una obra.<\/p>\n\n\n\n<p>Relacionado: <a href=\"https:\/\/www.safecreative.org\/tips\/es\/entrenar-llms-con-libros-recientes-puede-ser-fair-use\/\">\u00bfEntrenar LLM con libros recientes puede ser fair use?<\/a><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Conclusiones del estudio<\/h2>\n\n\n\n<p>GPT4 fue el modelo con un desempe\u00f1o m\u00e1s imprudente, mientras que los otros, como se\u00f1ala <a href=\"https:\/\/www.genbeta.com\/actualidad\/gpt-4-ofrece-abiertamente-contenido-protegido-copyright-otras-ia-disimulan-mucho-mejor-conclusiones-este-estudio\">Genbeta,<\/a> \u00abdisimulan mejor\u00bb. GPT4 mostr\u00f3 el primer cap\u00edtulo en una de cada cuatro ocasiones en las que se le pidi\u00f3 y complet\u00f3 el texto el 60% de las veces. Por su parte, Claude 2 result\u00f3 m\u00e1s dif\u00edcil de enga\u00f1ar, nunca ofreci\u00f3 el primer cap\u00edtulo de un libro alegando ser \u00abun asistente de IA que no tiene acceso a libros con derechos de autor\u00bb. A la mayor\u00eda de las peticiones para completar, tambi\u00e9n se neg\u00f3, aunque en unos pocos casos, proporcion\u00f3 la l\u00ednea inicial de la novela o un resumen de c\u00f3mo comienza el libro.<\/p>\n\n\n\n<p>Mixtral, aunque casi siempre se mostr\u00f3 reacio a ofrecer el primer cap\u00edtulo de alg\u00fan libro, cuatro de cada diez veces que se le pidi\u00f3 lo mostr\u00f3. Ante la solicitud de completar, s\u00f3lo lo hizo en el 6% de las preguntas. En el caso de Llama 2, los investigadores se\u00f1alan que respondi\u00f3 con pasajes incorrectos a varias de las preguntas sobre el primer cap\u00edtulo, mientras que a las peticiones de completar fragmentos respondi\u00f3 con contenido protegido por derechos de autor, que despu\u00e9s se interrumpi\u00f3.<\/p>\n\n\n\n<p>Estos resultados no dejan de asombrar a los responsables de Patronus AI. Incluso Anand Kannappan, cofundador y director ejecutivo de la compa\u00f1\u00eda, asegura que cuando empezaron a montar estas herramientas de <em>software<\/em> en la \u00e9poca en que trabajaban en Meta, no eran conscientes \u00abde que ser\u00eda relativamente sencillo producir contenido literal como este\u00bb.<\/p>\n\n\n\n<p>Fuentes: CNBC, <a href=\"https:\/\/www.genbeta.com\/actualidad\/gpt-4-ofrece-abiertamente-contenido-protegido-copyright-otras-ia-disimulan-mucho-mejor-conclusiones-este-estudio\">Genbeta,<\/a> Patronus AI<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Un reciente an\u00e1lisis de las 4 herramientas de inteligencia artificial generativa m\u00e1s populares desvela su escaso respeto por el copyright.<\/p>\n","protected":false},"author":4,"featured_media":3161,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[2,48],"tags":[33],"class_list":{"0":"post-3165","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-noticias","8":"category-tema-del-momento","9":"tag-inteligencia-artificial"},"acf":[],"_links":{"self":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts\/3165","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/comments?post=3165"}],"version-history":[{"count":2,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts\/3165\/revisions"}],"predecessor-version":[{"id":12096,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts\/3165\/revisions\/12096"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/media\/3161"}],"wp:attachment":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/media?parent=3165"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/categories?post=3165"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/tags?post=3165"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}