서버에서 사이트 페이지 index.html 이 있는 곳에 robots.txt 파일을 보신 분들이 계실겁니다.
구글 검색 엔진은 크롤러를 이용해서 세상에 있는 사이트들의 정보를 수집합니다.
이 때, robots.txt 파일을 이용하면 크롤러가 내 사이트 정보를 가져가지 않도록 할 수 있습니다.
그렇다고 내 사이트가 구글에서 검색이 안 되는 것은 아니고, 크롤링만 막는 것이지요.
지금 이 글을 올리고 있는 제 티스토리 볼로그에도 robots.txt 파일이 있습니다.
검색엔진 크롤러들이 robots.txt 파일에 따를지 아닐지는 검색엔진 크롤러마다 다르다고 합니다. 구글의 검색엔진 크롤러들은 robots.txt 파일을 따르지만요.
references
Google Help Center
'개발 카테고리' 카테고리의 다른 글
Collapsing Margin 마진 겹침 현상 (0) | 2020.06.16 |
---|---|
CSS 의 px 단위 이해하기 (0) | 2020.06.16 |
Elastic IP 이것 모르면 돈 낼 수 있습니다 (0) | 2020.05.25 |
Ubuntu + Anaconda + Apache2 + Django 사용하기 (0) | 2020.05.25 |
구글 검색엔진에 내 사이트 안 보이도록 하기 (0) | 2020.05.18 |