{"id":5666,"date":"2024-06-26T07:00:00","date_gmt":"2024-06-26T05:00:00","guid":{"rendered":"https:\/\/www.safecreative.org\/tips\/es\/?p=5666"},"modified":"2025-08-18T13:19:01","modified_gmt":"2025-08-18T11:19:01","slug":"perplexity-podria-estar-realizando-scraping-en-sitios-que-no-lo-autorizan","status":"publish","type":"post","link":"https:\/\/www.safecreative.org\/tips\/es\/perplexity-podria-estar-realizando-scraping-en-sitios-que-no-lo-autorizan\/","title":{"rendered":"Perplexity podr\u00eda estar realizando scraping en sitios que no lo autorizan\u00a0"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">Dos investigaciones desvelan que el buscador Perplexity AI, que combina las caracter\u00edsticas de los motores de b\u00fasqueda tradicionales y los chatbots, podr\u00eda estar \u00abraspando\u00bb de forma subrepticia partes de <strong>sitios web que los programadores han bloqueado expresamente<\/strong> para su rastreador. Una acci\u00f3n que, adem\u00e1s, incumple su pol\u00edtica de empresa. Estos an\u00e1lisis tambi\u00e9n muestran que el buscador presenta \u00abalucinaciones\u00bb y resume art\u00edculos de forma inexacta con una atribuci\u00f3n m\u00ednima.\u00a0<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Dos investigaciones se\u00f1alan un posible enga\u00f1o en su funcionamiento\u00a0<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">El sitio de noticias <a href=\"https:\/\/es.wired.com\/articulos\/buscador-perplexity-maquina-de-mentiras\" target=\"_blank\" rel=\"noreferrer noopener\">Wired<\/a> y el desarrollador <a href=\"https:\/\/rknight.me\/blog\/perplexity-ai-is-lying-about-its-user-agent\/\" target=\"_blank\" rel=\"noreferrer noopener\">Robb Knight<\/a> han dado a conocer sendas investigaciones sobre el funcionamiento de Perplexity AI para mostrar que ignora el <strong>Protocolo de Exclusi\u00f3n de Robots, <\/strong>a pesar de incluirlo en su <a href=\"https:\/\/docs.perplexity.ai\/docs\/perplexitybot\" target=\"_blank\" rel=\"noreferrer noopener\">pol\u00edtica de empresa<\/a>. Se trata de un est\u00e1ndar web ampliamente aceptado para evitar que los robots accedan a ciertas partes de las p\u00e1ginas web que la <em>startup<\/em>, respaldada por Jeff Bezos, estar\u00eda incumpliendo.\u00a0<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Relacionado: <a href=\"https:\/\/www.safecreative.org\/tips\/es\/dos-medidas-para-que-los-bots-no-accedan-al-contenido-de-tu-web\/\">Dos medidas para que los <em>bots<\/em> no accedan al contenido de tu web<\/a><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Genera alucinaciones y res\u00famenes inexactos sin atribuci\u00f3n clara de la fuente\u00a0<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Por otro lado, Perplexity IA asegura en su <a href=\"https:\/\/www.perplexity.ai\/es\/hub\/blog\/perplexity-raises-series-b-funding-round\" target=\"_blank\" rel=\"noreferrer noopener\">blog<\/a> ofrecer \u00abrespuestas instant\u00e1neas y fiables a cualquier pregunta, con fuentes completas y citas incluidas\u00bb, eliminando la necesidad de \u00abhacer clic en diferentes enlaces\u00bb. Sin embargo, en diferentes pruebas realizadas por Wired se ha comprobado que, en ocasiones, el chatbot parafrasea las historias y, en otras, las resume de forma inexacta y con una atribuci\u00f3n m\u00ednima. Incluso, en un caso, atribuye falsamente a Wired una informaci\u00f3n sobre un delito cometido por un agente de polic\u00eda concreto. Y no es la primera vez. La <a href=\"https:\/\/apnews.com\/article\/perplexity-ai-search-engine-forbes-f307cb607f0db871b05f843a3f744340\" target=\"_blank\" rel=\"noreferrer noopener\">agencia AP<\/a> tambi\u00e9n identific\u00f3 un caso en el que el chatbot atribuy\u00f3 citas falsas a personas reales.&nbsp;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Ignora el protocolo para bloquear los rastreadores web\u00a0<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">En estas pruebas descubrieron que Perplexity <strong>ignoraba el c\u00f3digo para bloquear los rastreadores web,<\/strong> igual que le sucedi\u00f3 a Knight. Los dos informes concluyeron que parec\u00eda estar accediendo a los sitios web bloqueados a trav\u00e9s de su rastreador Perplexity Bot utilizando al menos una direcci\u00f3n IP (44.221.181.252) que no hab\u00eda hecho p\u00fablica. De aqu\u00ed que crean que Perplexity est\u00e1 \u00abraspando\u00bb sitios web sin permiso.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Reconstruye contenido a partir de rastros como si accediera a la fuente original\u00a0<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Respecto a las \u00abalucinaciones\u00bb del chatbot, las respuestas vagas y la inexactitud de otras, parece probable que, en algunos casos, Perplexity \u00abno resuma art\u00edculos de noticias reales, sino que realice reconstrucciones de su contenido basadas en URL y rastros de ellos dejados en motores de b\u00fasqueda, como extractos y metadatos, ofreciendo res\u00famenes que pretenden estar basados en el acceso directo al texto relevante\u00bb, indica Wired.&nbsp;<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">El CEO de Perplexity, Aravind Srinivas, ante el informe de Wired, se\u00f1ala que hab\u00eda \u00abun malentendido profundo y fundamental sobre c\u00f3mo funcionan Perplexity e Internet\u00bb por parte de los reporteros, pero no ha cuestionado los hallazgos.&nbsp;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Infracci\u00f3n deliberada de derechos de autor\u00a0<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Por otro lado, la IP secreta detectada en las investigaciones tambi\u00e9n ha servido para apropiarse de texto e im\u00e1genes de diferentes medios del grupo Cond\u00e9 Nast, al que pertenece Wired, durante los tres \u00faltimos meses. De hecho, Forbes ya ha dirigido a la compa\u00f1\u00eda una carta en la que acusa a la compa\u00f1\u00eda de estar cometiendo una <strong>\u00abinfracci\u00f3n deliberada\u00bb de los derechos de autor. <\/strong>En la misiva exige que reembolse a Forbes los ingresos publicitarios obtenidos por esta infracci\u00f3n y que proporcione pruebas satisfactorias y garant\u00edas por escrito de haber eliminado los art\u00edculos infractores, seg\u00fan recoge <a href=\"https:\/\/www.axios.com\/2024\/06\/18\/forbes-perplexity-ai-legal-action-copyright\" target=\"_blank\" rel=\"noreferrer noopener\">Axios<\/a>.\u00a0<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Fuentes: <a href=\"https:\/\/es.wired.com\/articulos\/buscador-perplexity-maquina-de-mentiras\" target=\"_blank\" rel=\"noreferrer noopener\">Wired<\/a>, <a href=\"https:\/\/es.gizmodo.com\/perplejidad-ai-regla-de-internet-robots-protocolo-de-ex-1851551212\" target=\"_blank\" rel=\"noreferrer noopener\">Gizmodo<\/a>, Axios&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Dos investigaciones revelan que Perplexity podr\u00eda estar ignorando el Protocolo de Exclusi\u00f3n de Bots para competir con Google.<\/p>\n","protected":false},"author":4,"featured_media":5667,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[2,48],"tags":[12,33],"class_list":["post-5666","post","type-post","status-publish","format-standard","has-post-thumbnail","category-noticias","category-tema-del-momento","tag-derechos-de-autor","tag-inteligencia-artificial"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts\/5666","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/comments?post=5666"}],"version-history":[{"count":2,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts\/5666\/revisions"}],"predecessor-version":[{"id":11990,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts\/5666\/revisions\/11990"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/media\/5667"}],"wp:attachment":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/media?parent=5666"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/categories?post=5666"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/tags?post=5666"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}