{"id":6307,"date":"2024-08-23T07:00:00","date_gmt":"2024-08-23T05:00:00","guid":{"rendered":"https:\/\/www.safecreative.org\/tips\/es\/?p=6307"},"modified":"2025-08-18T13:10:35","modified_gmt":"2025-08-18T11:10:35","slug":"la-paradoja-del-desaprendizaje-posible-riesgo-para-la-privacidad","status":"publish","type":"post","link":"https:\/\/www.safecreative.org\/tips\/es\/la-paradoja-del-desaprendizaje-posible-riesgo-para-la-privacidad\/","title":{"rendered":"La paradoja del desaprendizaje: posible riesgo para la privacidad\u00a0\u00a0"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">Un estudio de los algoritmos de desaprendizaje ha generado una creciente inquietud sobre la <strong>protecci\u00f3n de datos personales y los derechos de propiedad intelectual.<\/strong> Un equipo de especialistas de reconocidas instituciones acad\u00e9micas ha analizado c\u00f3mo estos algoritmos, creados en principio para eliminar informaci\u00f3n confidencial de los modelos de aprendizaje autom\u00e1tico, podr\u00edan, parad\u00f3jicamente, facilitar la filtraci\u00f3n de datos privados de los usuarios.&nbsp;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">El auge de las t\u00e9cnicas de desaprendizaje: borrado de datos confidenciales&nbsp;<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Los sistemas de lenguaje artificial se desarrollan utilizando enormes vol\u00famenes de texto, entre los que se incluye material protegido por derechos de autor y contenido privado. Este hecho ha provocado que creadores, editoriales y discogr\u00e1ficas emprendan acciones legales para exigir cambios en la forma de recopilar datos, argumentando que estas pr\u00e1cticas afectan negativamente a las obras sujetas a copyright. A modo de respuesta, en los \u00faltimos tiempos han ganado relevancia las estrategias de \u00abdesaprendizaje\u00bb, dise\u00f1adas para que las empresas tecnol\u00f3gicas eliminen de sus bases de datos informaci\u00f3n confidencial o fragmentos que no deber\u00edan estar almacenados.\u00a0<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">El desaprendizaje de modelos de entrenamiento favorece la fuga de informaci\u00f3n confidencial, seg\u00fan un estudio&nbsp;&nbsp; <\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Aunque el objetivo de los algoritmos de desaprendizaje es<strong> eliminar la informaci\u00f3n confidencial<\/strong> de estos modelos de <em>machine learning<\/em> para proteger los datos personales de los usuarios, pueden en realidad propiciar la fuga de informaci\u00f3n privada. Es una de las conclusiones a la que han llegado un grupo de expertos de diferentes instituciones, entre ellas las <strong>Universidades de Washington, Princeton, Chicago y Southern California, junto con Google Research. <\/strong>Los resultados han sido publicados en <a href=\"https:\/\/arxiv.org\/pdf\/2407.06460\" target=\"_blank\" rel=\"noreferrer noopener\">MUSE:<\/a><em><a href=\"https:\/\/arxiv.org\/pdf\/2407.06460\" target=\"_blank\" rel=\"noreferrer noopener\"> Machine Learning Six-Way Evaluation for Language Models<\/a>.&nbsp;<\/em><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Seis propiedades \u00abdeseables\u00bb para un modelo de desaprendizaje&nbsp;<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Los investigadores han estudiado el comportamiento de ocho algoritmos y han establecido un punto de referencia integral llamado MUSE, que los prueba en funci\u00f3n de seis criterios considerados propiedades \u00abdeseables\u00bb para un modelo que ha experimentado el desaprendizaje. <\/p>\n\n\n\n<p class=\"wp-block-paragraph\">El primero indica que estos modelos <strong>no deben memorizar \u00abpalabra por palabra\u00bb,<\/strong> esto es, recordar frases construidas, exactas. Tampoco memorizar conocimientos derivados de los datos espec\u00edficos ni filtrar ninguna informaci\u00f3n privada. <\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Deber\u00edan, por otra parte, ce\u00f1irse al <strong>principio de preservaci\u00f3n<\/strong> y seguir funcionando bien con otros datos que no est\u00e9n destinados a ser eliminados. Adem\u00e1s, se debe plantear la escalabilidad, es decir, gestionar solicitudes grandes y m\u00faltiples de eliminaci\u00f3n de datos de forma eficiente, y tambi\u00e9n peticiones sucesivas de desaprendizaje, sin deteriorar el rendimiento.&nbsp;&nbsp;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">La dificultad de desaprender los datos confidenciales&nbsp;<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Los investigadores han analizado el funcionamiento de ocho algoritmos y han desarrollado un est\u00e1ndar integral denominado MUSE, que eval\u00faa su desempe\u00f1o en base a seis criterios considerados esenciales para un modelo que haya llevado a cabo un proceso de desaprendizaje. Uno de los principios clave es que estos modelos no deben retener informaci\u00f3n textual exacta, es decir, no deben recordar frases literales. Tampoco deber\u00edan conservar conocimiento derivado de datos espec\u00edficos ni exponer informaci\u00f3n privada. Asimismo, deben respetar el principio de conservaci\u00f3n, manteniendo un buen desempe\u00f1o con datos que no est\u00e1n sujetos a eliminaci\u00f3n. Otro aspecto fundamental es la capacidad de escalabilidad, que implica manejar eficientemente solicitudes masivas de eliminaci\u00f3n de datos, adem\u00e1s de gestionar m\u00faltiples peticiones de desaprendizaje consecutivas sin afectar su rendimiento.\u00a0\u00a0<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Fuentes: <a href=\"https:\/\/www.infobae.com\/america\/agencias\/2024\/07\/30\/el-desaprendizaje-de-modelos-de-entrenamiento-favorece-la-fuga-de-informacion-confidencial-segun-expertos\/\" target=\"_blank\" rel=\"noreferrer noopener\">infobae<\/a>, <a href=\"https:\/\/www.europapress.es\/portaltic\/sector\/noticia-desaprendizaje-modelos-entrenamiento-favorece-fuga-informacion-confidencial-expertos-20240730171218.html\" target=\"_blank\" rel=\"noreferrer noopener\">Europa Press<\/a> &nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>El desaprendizaje de modelos de entrenamiento de IA favorece la fuga de informaci\u00f3n confidencial, seg\u00fan un estudio.<\/p>\n","protected":false},"author":4,"featured_media":6308,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[2,48],"tags":[33,112],"class_list":["post-6307","post","type-post","status-publish","format-standard","has-post-thumbnail","category-noticias","category-tema-del-momento","tag-inteligencia-artificial","tag-propiedad-intelectual"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts\/6307","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/comments?post=6307"}],"version-history":[{"count":3,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts\/6307\/revisions"}],"predecessor-version":[{"id":11949,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts\/6307\/revisions\/11949"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/media\/6308"}],"wp:attachment":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/media?parent=6307"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/categories?post=6307"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/tags?post=6307"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}