{"id":3854,"date":"2024-04-15T07:00:00","date_gmt":"2024-04-15T05:00:00","guid":{"rendered":"https:\/\/www.safecreative.org\/tips\/es\/?p=3854"},"modified":"2025-08-19T08:26:16","modified_gmt":"2025-08-19T06:26:16","slug":"nyt-revela-las-malas-practicas-de-las-tecnologicas-para-seguir-entrenando-sus-ia","status":"publish","type":"post","link":"https:\/\/www.safecreative.org\/tips\/es\/nyt-revela-las-malas-practicas-de-las-tecnologicas-para-seguir-entrenando-sus-ia\/","title":{"rendered":"NYT revela malas pr\u00e1cticas de las tecnol\u00f3gicas para entrenar IA"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">The New York Times desvela la desesperaci\u00f3n de las grandes tecnol\u00f3gicas por encontrar datos para alimentar sus modelos de inteligencia artificial (IA). <strong>OpenAI, Google y Meta, <\/strong>en su carrera por encontrar nuevas fuentes de datos para hacer avanzar esta tecnolog\u00eda, han obviado la protecci\u00f3n legal de la autor\u00eda de los contenidos e, incluso, <strong>han pasado por encima de pol\u00edticas corporativas<\/strong> de los servicios digitales que proh\u00edben esta pr\u00e1ctica. Se avecina una nueva pol\u00e9mica con resultados impredecibles.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Relacionado: <a href=\"https:\/\/www.safecreative.org\/tips\/es\/el-new-york-times-demanda-a-microsoft-y-openai\/\">El New York Times demanda a Microsoft y OpenAI<\/a><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">OpenAI transcribi\u00f3 un mill\u00f3n de horas de v\u00eddeos de YouTube<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Una <a href=\"https:\/\/www.nytimes.com\/2024\/04\/06\/technology\/tech-giants-harvest-data-artificial-intelligence.html\" target=\"_blank\" rel=\"noreferrer noopener\">investigaci\u00f3n del New York Times<\/a> remueve los cimientos sobre los que se asienta la IA generativa. Seg\u00fan el diario, a finales de 2021, OpenAI cre\u00f3 una herramienta, que bautiz\u00f3 como <strong>Whisper<\/strong>, para transcribir <strong>un mill\u00f3n de horas de audio procedentes de v\u00eddeos de YouTube<\/strong> para alimentar de contenido a ChatGPT. Y lo hicieron a sabiendas de que ese contenido pertenece a los creadores y <em>youtubers.<\/em> Seg\u00fan las fuentes consultadas por NYT, el presidente de OpenAI, Greg Brockman, particip\u00f3 en la selecci\u00f3n de estos v\u00eddeos.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Sora tambi\u00e9n pudo entrenarse con el mismo material<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Como recoge <a href=\"https:\/\/www.europapress.es\/portaltic\/sector\/noticia-openai-google-entrenan-modelos-ia-transcripciones-videos-youtube-nyt-20240408104816.html\" target=\"_blank\" rel=\"noreferrer noopener\">Europa Press,<\/a> el propio director ejecutivo de la plataforma audiovisual, Neal Mohan, ya hab\u00eda advertido que este hecho <strong>va contra las pol\u00edticas de YouTube,<\/strong> si bien hacia referencia a un supuesto entrenamiento de Sora. Se especula que esta otra herramienta de OpenAI, que permite generar v\u00eddeos realistas a partir de una descripci\u00f3n de texto, tambi\u00e9n se ha podido entrenar con v\u00eddeos de YouTube.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Google cambi\u00f3 los t\u00e9rminos del servicio para evitar responsabilidad legal<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Por otro lado, la investigaci\u00f3n tambi\u00e9n pone de relieve que Google, empresa propietaria de YouTube, ha hecho algo similar. Ha utilizado la transcripci\u00f3n de v\u00eddeos de su plataforma para entrenar a su modelo de IA Bard (ahora, Gemini). Al estar este contenido protegido por las propias pol\u00edticas de la firma de Mountain View, <strong>cambiaron los t\u00e9rminos<\/strong> <strong>de servicio<\/strong> para escapar de posibles responsabilidades legales por violaci\u00f3n de los derechos de autor de los creadores de su aplicaci\u00f3n.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La pol\u00edtica de privacidad de Google hasta ese momento reflejaba que la compa\u00f1\u00eda pod\u00eda utilizar informaci\u00f3n p\u00fablica disponible para \u00abayudar a entrenar los <strong>modelos ling\u00fc\u00edsticos<\/strong> de Google y crear funciones como Google Translate\u00bb. La nueva redacci\u00f3n de los t\u00e9rminos se concibi\u00f3 para que Google pudiera aprovechar los datos para sus <strong>\u00abmodelos de IA <\/strong>y crear productos y funciones como Google Translate, Bard y las capacidades de IA en la nube\u00bb, lo que representaba una colecci\u00f3n m\u00e1s amplia de tecnolog\u00edas de IA.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">\u00abSi Google hiciera un esc\u00e1ndalo por OpenAI, podr\u00eda desatar un <strong>efecto b\u00fameran<\/strong> contra sus propios m\u00e9todos\u00bb, se asegura en el reportaje del diario norteamericano.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Meta recopil\u00f3 contenidos protegidos a sabiendas<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">En el caso de Meta, Mark Zuckerberg tambi\u00e9n se qued\u00f3 sin datos de calidad para seguir alimentando su IA el a\u00f1o pasado. Seg\u00fan recoge NYT, la empresa propietaria de Facebook, Instagram y WhatsApp habr\u00eda recurrido a Internet para recopilar gran cantidad de datos sin respetar si se trataba de contenidos protegidos. El propio Zuckerberg habr\u00eda presionado a su equipo para optar por este m\u00e9todo, aunque hubiera que asumir los costes de acciones judiciales en su contra.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Tambi\u00e9n, la antigua Facebook se habr\u00eda planteado la posibilidad de adquirir una editorial para tener acceso a obras protegidas por derechos de autor, al tiempo que explora <strong>estrategias para utilizar la informaci\u00f3n p\u00fablica disponible en l\u00ednea sin infringir<\/strong> los derechos de sus propios usuarios.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Sin duda, si se mantiene este modo de operar <strong>las demandas ir\u00e1n creciendo.<\/strong> Es evidente que se impone encontrar un equilibrio entre el avance constante de la IA generativa y el respeto por la propiedad intelectual.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Fuente: The New York Times, Europa Press<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Cambios en los t\u00e9rminos de uso, pol\u00edticas ignoradas&#8230; Las tecnol\u00f3gicas \u00abbuscan atajos\u00bb a la desesperada para superar a sus competidores.<\/p>\n","protected":false},"author":4,"featured_media":3855,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[47,2,48],"tags":[33],"class_list":["post-3854","post","type-post","status-publish","format-standard","has-post-thumbnail","category-lo-mas-destacado","category-noticias","category-tema-del-momento","tag-inteligencia-artificial"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts\/3854","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/comments?post=3854"}],"version-history":[{"count":2,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts\/3854\/revisions"}],"predecessor-version":[{"id":12063,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts\/3854\/revisions\/12063"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/media\/3855"}],"wp:attachment":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/media?parent=3854"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/categories?post=3854"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/tags?post=3854"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}