234 Shares 7611 views

Cómo eliminar un sitio o sus fragmentos del índice de Google

De acuerdo con el concepto de indexación adoptada por el Google, representado por la integridad, la objetividad de la información y su conformidad a la consulta de búsqueda en la emisión de los resultados. Si el índice cae sitio web con contenidos ilegales, o de recursos de mensajes, en las páginas de este sitio no serán marcados en el motor de búsqueda de base de datos común. Para nosotros es importante aprender cómo eliminar un sitio de la emisión de los resultados del servidor de búsqueda.

Las variantes de cero indexación de Google

Una vez que el robot de búsqueda – un programa para recopilar información sobre los nuevos recursos – escaneará la página del sitio de la página y, a continuación, cuando bajo requisitos de la política de Google para el análisis, que será indexado. Pero también te mostramos cómo eliminar su sitio o fragmentos de los motores de búsqueda a través de un robots.txt – indexar y buscar al mismo tiempo parada.

Para excluir de la emisión del recurso en su conjunto, en la carpeta raíz del servidor en el que se encuentra el sitio, crea una cierta área de texto – dijo robots.txt. Esta zona se trata con los motores de búsqueda y actuar de acuerdo a las instrucciones de leer.

Tenga en cuenta que los índices de los motores de búsqueda de Google a la página, incluso si un usuario tiene acceso para ver prohibidos. Cuando el navegador responde con 401 o 403 "El acceso no es válido", que se aplica sólo a los visitantes, en lugar de programas que recogen para este motor de búsqueda.

Para entender cómo quitar el sitio de la indexación del motor de búsqueda, un puntero de texto debe introducir las siguientes líneas:

User-agent: Googlebot

No permitir: /

Esto indica al rastreador de índice de la prohibición de todo el contenido en el sitio. Aquí es cómo eliminar un sitio de Google, de modo que éste no almacena en caché el recurso en la lista de detectar.

Las realizaciones de la exploración de diferentes protocolos

Si necesita una lista de estándares de comunicaciones individuales, para los que desea aplicar reglas especiales para la indexación de Google, por ejemplo, por separado para hipertexto protocolos HTTP / HTTPS, también es necesario registrar en el archivo robots.txt de la siguiente manera (ejemplo).

(Http://yourserver.com/robots.txt) – un nombre de dominio de su sitio (cualquier)

User-agent: * – cualquier motor de búsqueda

Permitir: / – permitir la indexación completa

Cómo eliminar un sitio de la cuestión por completo con el protocolo https

(Https://yourserver.com/robots.txt):

User-agent: *

No permitir: / prohibición total de la indexación

Acelerados direcciones de recursos URL- la eliminación de Google SERPs

Si no desea esperar a que re-indexación, y el sitio que desea ocultar como, recomiendo utilizar el servicio de http://services.google.com/urlconsole/controller pronto como sea posible. robots.txt pre tiene que ser colocado en el directorio raíz del servidor del sitio. Se debe prescribir las instrucciones adecuadas.

Si el puntero por alguna razón no se puede editar en el directorio raíz, cree lo suficiente en la carpeta con los objetivos para los que desea ocultar a los motores de búsqueda. Una vez hecho esto y se refieren al servicio de la eliminación automática de direcciones de hipertexto, Google no analizará las carpetas de la que se describe un defecto en el archivo robots.txt.

El período de esta invisibilidad se establece durante 3 meses. Después de este período, el directorio retirado del tema, de nuevo será procesada por el servidor de Google.

H ow para eliminar un sitio para escanear parcialmente

Cuando un robot de búsqueda está leyendo el contenido del archivo robots.txt, que ciertas decisiones se toman sobre la base de su contenido. Digamos que usted desea excluir de la muestra en todo el directorio llamado anatom. Es suficiente para dictar los reglamentos:

User-agent: Googlebot

No permitir: / anatom

O, por ejemplo, desea no indexar todos los tipos de imagen .gif. Para ello, agregue la siguiente lista:

User-agent: Googlebot

No permitir: /*.gif$

He aquí otro ejemplo. Que sean borrados de analizar la información en las páginas generadas dinámicamente, al tiempo que añade al tipo de entrada de índice:

User-agent: Googlebot

Disallow: / *?

Eso es, y se establecen las normas para los motores de búsqueda. Otra cosa es que es mucho más conveniente que sólo tiene que utilizar esta etiqueta META. Y webmasters utilizan a menudo sólo un nivel tan regula el funcionamiento de los motores de búsqueda. Pero hablaremos de esto en futuros artículos.