유틸리티, 정보/WEB TIP

구글검색에서 원치않는 페이지 노출 색인 삭제하는 방법

romeo1052 2016. 3. 11. 21:08
반응형

구글검색에 노출된 이미지나 포스팅. 한번 색인된 문건은 온라인에서 절대로 사라지지않습니다.

페이지가 수정되었거나 게시물의 변경이 있다면 구글봇이 크롤링을 다시해가게되면 변경이 되기도 하지만

사이트맵을 새로 작성하여 제출해 보아도 하루이틀내에 되지도 않고 저만그런지는 모르겠지만 수일이 지났음에도 계속 링크는 망가져있더군요.

이렇게 되고 며칠 추이를 지켜보니 리디렉션된 첫페이지로 연결되어 트래픽만 늘고 사이트 신뢰도만 떨어뜨리게 되는것같습니다.

 

이렇게 본인의 게시물이 더이상 노출되는것이 싫은때도 있을것입니다.
이때 구글의 검색  결과에서 이미지나 포스팅이 노출되지 않도록 삭제하는 방법을 알아 봅니다.

 

웹사이트 또는 블로그나 까페등 온라인에 공개로 올린 이미지가 구글에 색인되어 원본을 삭제 했는데도 검색결과에 나타나곤합니다. 때로는 실수로 비공개처리하는 과정에서 노출되어 긁어 가는 경우가 있습니다.
이럴때는 삭제해야 하며 본인외에는 삭제할수 없으며 구글에서도 이런 종류의 삭제는 해 주지 않지만 스스로 할수 있도록 구글웹마스터 도구로 준비 하고 있습니다.

 

구글봇에 의해서 수집된 글이나 이미지가 색인되어 구글 검색에서 노출되지 않게 하는 노력은 전적으로 올린 본인이 해야합니다. 

 

어떤 이미지나 포스팅을 삭제 하고싶다면 아래 규칙과 방법에 따라야 합니다.

 

먼저 구글계정이 있어야 하며 구글계정에 사이트가 등록되어 있어야 합니다.

이 조건을 만족 한다면 구글계정에 로긴한후 

 

1. 구글 웹마스터 도구- 서치콘솔로 접속합니다.

www.google.com/webmasters/tools/?hl=ko 

2. Google 색인 - URL제거메뉴에 들어가서 일시적으로 숨기기를 시작합니다.

3. 방금입력한 URL과 함께 [보류][취소]가 나오면 정상적으로 완료입니다.

 

구글검색에서 원치않는 페이지 노출 색인 삭제하는 방법 - 팁!! - romeo1052.net

 

취소를 클릭하지 않으면 며칠내에 검색결과에서 사라집니다.

단 원본 이미지를 홈페이지나 블로그에서 삭제했을때만 가능하며 원본이 남아있을때는 곧 다시 수집되고 색인됩니다.

robots.txt를 사용하여 검색엔진이 사이트를 크롤링하는 방법을 지정해서 구글봇의 접근을 막을수도 있습니다.

이 일련의 과정은 사이트 소유자와 전적인 권한을 가진 사용자만이 삭제를 요청할 수 있으며 타인의 사이트 저작물은 별도의 방법으로 가능합니다.

 

 

 

 

그런데 구글에선 아래와같은 도움말을 제시하고 있으니 참고하시길 바랍니다.

URL 삭제 도구 오용

URL 삭제 도구는 기밀 데이터가 실수로 노출된 콘텐츠 등 긴급히 차단해야 하는 콘텐츠에 첫 조치로 사용되어야 합니다. URL 삭제 도구를 다른 용도로 사용하면 사이트에 문제가 생길 수 있습니다.

  • 404 오류가 표시되는 오래된 페이지 등 쓸모없는 자료를 정리하기 위해 이 도구를 사용하지 마세요. 최근에 사이트를 변경하여 오래된 URL이 색인에 남은 경우는 Google 크롤러가 다음에 URL을 크롤링할 때 반영되므로 결국 자연스럽게 검색결과에서 사라집니다. 따라서 긴급하게 업데이트를 요청할 필요가 없습니다.
  • Search Console 계정에서 크롤링 오류를 해결하기 위해 이 도구를 사용하지 마세요. 차단 도구는 Search Console 계정이 아닌 Google 검색결과에서 URL을 차단합니다. 시간이 지나면서 URL이 자연스럽게 삭제되므로 보고서에서 직접 URL을 삭제할 필요가 없습니다.
  • 사이트를 '처음부터 시작'하기 위해 이 도구를 사용하지 마세요. 사이트에 직접 조치가 있을까 우려되거나 다른 사용자로부터 구매한 도메인을 처음부터 다시 시작하려는 경우에는 재검토 요청을 제출하여 우려되는 사항과 변경된 항목에 대해 Google에 알리는 것이 좋습니다.
  • 해킹된 사이트를 '오프라인'으로 전환하기 위해 이 도구를 사용하지 마세요. 사이트가 해킹되어 색인 생성된 잘못된 URL을 제거하려는 경우 URL 차단 도구를 사용하여 해커가 만든 새 URL(예: http://www.example.com/buy-cheap-cialis-skq3w598.html)을 모두 차단할 수 있습니다. 하지만 사이트 전체를 차단하거나 나중에 색인을 생성하고 싶은 URL을 차단하는 것은 좋지 않습니다. 대신 해킹된 내용을 삭제한 뒤 Google이 다시 사이트를 크롤링하도록 해주세요. 해킹된 사이트 처리에 대해 자세히 알아보기
  • 사이트의 올바른 '버전'을 색인 생성하기 위해 이 도구를 사용하지 마세요. 대부분 사이트에서는 동일한 HTML 콘텐츠 또는 파일을 다양한 URL을 통해 제공합니다. 이 경우 검색결과에 중복된 내용이 표시되지 않기를 원한다면 권장 표준화 방식을 검토하시기 바랍니다. 검색결과에 원하지 않는 URL을 차단하기 위해 URL 도구를 사용해서는 안 됩니다. URL의 모든 버전(http/https 및 www 포함/불포함)이 삭제되어 선호하는 버전의 페이지까지 잃을 수 있습니다.

 

검색결과내 자신이 운영하는 사이트의 컨텐츠 삭제

원본문서의 삭제는 원하지 않고 검색결과에서만 삭제를 원할때:

해당 문서의 html을 수정할수 있는 권한이 있어야 합니다.
< head>와 < /head>사이에 < meta name="googlebot" content="noindex"> 를 삽입하면 다음번에 구글봇이 해당 페이지를 방문했을때 변경된 부분을 감지하고 자동으로 색인을 삭제시킵니다.
구글봇 이외에 어떤 검색엔진에서도 색인을 원하지 않으시면 < meta name="robots" content="noindex"> 를 사용하면 됩니다.
간혹 robots.txt 파일로 구글봇의 크롤링을 컨트롤 하려는 사람들도 있는데 이는 문서가 검색결과에 색인되지 않았을 경우에 유용하게 쓰이며, 이미 색인되어있는 경우에는 html문서내에 < meta name="googlebot" content="noindex"> 태그를 사용하는것이 맞는 방법입니다.
자세한 내용은 robots.txt 파일과 meta robots 태그의 차이점 포스팅을 참조하시길 바랍니다.

위의 내용처럼 html 수정이 불가능한 경우: (구글 웹마스터 도구 사용)

원본문서의 삭제가 선행되거나 아래의 방법을 통한 삭제 요청이후 원본문서의 삭제가 필수 입니다.
그렇지 않을경우 삭제요청은 무의미해 집니다.

 

검색결과내 다른 사이트의 컨텐츠 삭제

다른 사람이 운영하는 사이트에 대한 검색결과를 아무런 제제없이 무작위로 삭제할수 있다면 큰 혼란이 올것입니다. 악의적인 의도로 경쟁사이트의 컨텐츠 삭제 요청 하는 경우도 생길거구요.
이런 경우도 마찬가지로 원본문서의 삭제가 선행되어야 합니다.
물론 문서에 대한 삭제권한이 없다면 해당 사이트 웹마스터/관리자에게 도움을 요청해야 합니다.

 

해당 문서가 이미 삭제되어 있는 경우:

구글 공개 URL 삭제도구에서 삭제요청을 해 보세요.

만약 문서가 삭제되지 않은 상태에서 저작권이나 개인정보 유출 때문에 삭제를 요청하는경우:

 

 


반응형