{"id":1891,"date":"2024-01-26T16:12:12","date_gmt":"2024-01-26T15:12:12","guid":{"rendered":"https:\/\/www.safecreative.org\/tips\/es\/?p=1891"},"modified":"2025-08-21T12:44:34","modified_gmt":"2025-08-21T10:44:34","slug":"dos-medidas-para-que-los-bots-no-accedan-al-contenido-de-tu-web","status":"publish","type":"post","link":"https:\/\/www.safecreative.org\/tips\/es\/dos-medidas-para-que-los-bots-no-accedan-al-contenido-de-tu-web\/","title":{"rendered":"Dos medidas para que los bots no accedan al contenido de tu web"},"content":{"rendered":"<p>\u00bfSabes c\u00f3mo proteger tu sitio web de bots y entrenadores de inteligencia artificial? A continuaci\u00f3n explicamos dos formas est\u00e1ndar que pueden parecer t\u00e9cnicas, pero son en realidad muy sencillas.<\/p>\n<h2>\u00abrobots.txt\u00bb y meta tags<\/h2>\n<p>Si tu sitio web es propiedad privada, estos textos son se\u00f1ales de \u00abprohibido el paso\u00bb. No ser\u00e1n visibles en tu sitio web pero su prop\u00f3sito no es que las lean humanos, sino bots.<\/p>\n<p>Algunas <strong>consideraciones importantes<\/strong> a tener en cuenta:<\/p>\n<ul>\n<li>El respeto por estas etiquetas depende del bot que acceda a tu sitio. Obedecerlas es voluntario. Los bots leg\u00edtimos como los de Google generalmente respetan estas etiquetas, pero los rastreadores maliciosos pueden ignorarlas.<\/li>\n<li>Como los bots de buscadores tambi\u00e9n leen estas se\u00f1ales, el uso de <em>robots.txt<\/em> y las etiquetas <em>noindex, nofollow<\/em> puede impactar a la visibilidad y el SEO de tu sitio. Evita que las p\u00e1ginas se indexen y que se rastreen los enlaces. En el \u00faltimo punto de este art\u00edculo hablamos de qu\u00e9 hacer si quieres que tu contenido se indexe pero no que se use para entrenamiento de IAs.<\/li>\n<\/ul>\n<h2>C\u00f3mo a\u00f1adir un archivo \u00abrobots.txt\u00bb<\/h2>\n<p>Explicaci\u00f3n sencilla en dos pasos:<\/p>\n<ol>\n<li>A\u00f1ade un archivo de texto plano llamado \u00abrobots.txt\u00bb en la ra\u00edz de tu dominio. Por ejemplo: www.miportfolio.com\/robots.txt<\/li>\n<li>Este fichero de texto plano debe indicar las secciones de tu p\u00e1gina que deseas proteger.<\/li>\n<\/ol>\n<p>Por ejemplo, si quieres ocultar de cualquier bot el contenido de una secci\u00f3n llamada \u00abprivado\u00bb, el .txt debe contener este texto:<\/p>\n<pre>User-agent: *\nDisallow: \/privado\/<\/pre>\n<p>Si quieres que Google y\/o Bing s\u00ed tengan acceso (porque quieres que el contenido se indexe en sus buscadores) pero ning\u00fan otro bot, puedes copiar y pegar los p\u00e1rrafos correspondientes de aqu\u00ed:<\/p>\n<pre>User-agent: Bingbot\nDisallow:\n\nUser-agent: Googlebot\nDisallow:\n\nUser-agent: *\nDisallow: \/<\/pre>\n<p>Para informaci\u00f3n m\u00e1s detallada, recomendamos consultar la gu\u00eda de Google: <a href=\"https:\/\/developers.google.com\/search\/docs\/crawling-indexing\/robots\/intro?hl=es&amp;visit_id=638418738307429763-3086735782&amp;rd=2\">Introducci\u00f3n a los archivos robots.txt<\/a>.<\/p>\n<h2>C\u00f3mo a\u00f1adir meta tags noindex y nofollow<\/h2>\n<p>Otra alternativa es usar etiquetas meta en el HTML de tu p\u00e1gina. Si puedes acceder al HTML, sigue estos pasos:<\/p>\n<ol>\n<li>Busca las etiquetas &lt;head&gt;&lt;\/head&gt; de cada p\u00e1gina que quieres proteger de bots.<\/li>\n<li>Entre estas etiquetas html, copia y pega lo siguiente: &lt;meta name=\u00bbrobots\u00bb content=\u00bbnoindex, nofollow\u00bb&gt;<\/li>\n<\/ol>\n<p>El resultado quedar\u00eda m\u00e1s o menos as\u00ed:<\/p>\n<pre>&lt;!DOCTYPE html&gt;\n&lt;html&gt;\n&lt;head&gt;\n&lt;title&gt;Tu T\u00edtulo de P\u00e1gina&lt;\/title&gt;\n&lt;meta name=\"robots\" content=\"noindex, nofollow\"&gt;\n&lt;!-- Otras etiquetas de tu p\u00e1gina --&gt;\n&lt;\/head&gt;\n&lt;body&gt;\n&lt;!-- Contenido de tu p\u00e1gina --&gt;\n&lt;\/body&gt;\n&lt;\/html&gt;<\/pre>\n<h2>\u00bfY si quieres que tu contenido se indexe, pero no que se use para entrenamiento de IA?<\/h2>\n<p>Todav\u00eda no existe un est\u00e1ndar reconocido ni un meta tag espec\u00edfico que comunique \u00abno rascar\u00bb a los bots de rastreo. Una opci\u00f3n es utilizar declaraciones claras y visibles en \u00a0el sitio web, especificando las condiciones de uso del contenido. Por ejemplo:<\/p>\n<blockquote><p>\u00abEl contenido de este sitio est\u00e1 disponible para fines de indexaci\u00f3n y visualizaci\u00f3n en buscadores. Sin embargo, queda estrictamente prohibido el uso de cualquier contenido de este sitio, incluyendo im\u00e1genes, textos y cualquier otro material, para el entrenamiento de modelos de inteligencia artificial o cualquier otra forma de rascado de datos sin el consentimiento expl\u00edcito y por escrito del autor.\u00bb<\/p><\/blockquote>\n<p>Combinar este tipo de declaraciones legales con medidas t\u00e9cnicas como el uso de `robots.txt` y meta tags puede ofrecer una capa adicional de protecci\u00f3n y claridad sobre tus intenciones y restricciones respecto al uso de tu contenido. Aunque esto no garantiza el cumplimiento por parte de los bots malintencionados, puede servir como una base legal para proteger los derechos de autor y tomar acciones contra el uso no autorizado del contenido.<\/p>\n","protected":false},"excerpt":{"rendered":"<p><span class=\"excerpt_part\">&iquest;Sabes c&oacute;mo proteger tu sitio web de bots y entrenadores de inteligencia artificial? A continuaci&oacute;n explicamos dos formas est&aacute;ndar que pueden parecer t&eacute;cnicas, pero son en realidad muy sencillas. &laquo;robots.txt&raquo;&#8230;<\/span><\/p>\n","protected":false},"author":5,"featured_media":1894,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[48],"tags":[33],"class_list":{"0":"post-1891","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-tema-del-momento","8":"tag-inteligencia-artificial"},"acf":[],"_links":{"self":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts\/1891","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/comments?post=1891"}],"version-history":[{"count":1,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts\/1891\/revisions"}],"predecessor-version":[{"id":12492,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/posts\/1891\/revisions\/12492"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/media\/1894"}],"wp:attachment":[{"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/media?parent=1891"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/categories?post=1891"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.safecreative.org\/tips\/es\/wp-json\/wp\/v2\/tags?post=1891"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}