robots.txt 란? - 검색엔진 크롤링 막기

서버에서 사이트 페이지 index.html 이 있는 곳에 robots.txt 파일을 보신 분들이 계실겁니다.

구글 검색 엔진은 크롤러를 이용해서 세상에 있는 사이트들의 정보를 수집합니다.

이 때, robots.txt 파일을 이용하면 크롤러가 내 사이트 정보를 가져가지 않도록 할 수 있습니다.

그렇다고 내 사이트가 구글에서 검색이 안 되는 것은 아니고, 크롤링만 막는 것이지요.

지금 이 글을 올리고 있는 제 티스토리 볼로그에도 robots.txt 파일이 있습니다.

검색엔진 크롤러들이 robots.txt 파일에 따를지 아닐지는 검색엔진 크롤러마다 다르다고 합니다. 구글의 검색엔진 크롤러들은 robots.txt 파일을 따르지만요.

references

Google Help Center

Collapsing Margin 마진 겹침 현상 (0)	2020.06.16
CSS 의 px 단위 이해하기 (0)	2020.06.16
Elastic IP 이것 모르면 돈 낼 수 있습니다 (0)	2020.05.25
Ubuntu + Anaconda + Apache2 + Django 사용하기 (0)	2020.05.25
구글 검색엔진에 내 사이트 안 보이도록 하기 (0)	2020.05.18

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

초이스페이스