웹모아
웹모아[가입] 로그인 / 회원가입   검색     


  
질문&답변
 

[RE] 아파치 에러로그 중에서 robots.txt error이 무엇 인가요 ?
2008-10-04 14:32:32 댓글:(0)   조회:4289
 


robot.txt 에 대한 자세한 내용은 
http://www.robotstxt.org  중 http://www.robotstxt.org/wc/robots.html 에 나와 있습니다. 

간략하게 말씀 드리면 웹상에서 자동으로 검색을 하는 프로그램 - 로봇 - 들이 검색을 하고간 흔적 입니다. 현재 로봇데이타베이스에 등록된 검색 로봇은 280 여개 입니다. 

이 검색을 배제하려면 robot.txt 라는 텍스트 파일을 아래의 내용으로 만들어 놓으면 됩니다.

User-agent: *
Disallow: /

다른 예를 보면 

User-agent: webcrawler
Disallow:
*. webcrawler 라는 검색 로봇에 허용을 하는 경우 입니다.

User-agent: lycra
Disallow: /
*. lycra 라는 검색 로봇에 전부 허용하지 않는 경우 입니다.

User-agent: *
Disallow: /tmp
Disallow: /logs
*. 모든 검색 로봇에 대해 /tmp, /log 디렉토리를 허용하지 않는 경우 입니다.

또, 웹 페이지에 아래와 같은 메타 태그를 넣는 방법도 있습니다.



ROBOTS meta-tag
<META NAME="ROBOTS" CONTENT="ALL | NONE | NOINDEX | NOFOLLOW">

default = empty = "ALL"
"NONE" = "NOINDEX, NOFOLLOW"
의 형태 인데 

<META NAME="ROBOTS" CONTENT="NOINDEX">
; 검색 로봇에 인덱스를 허용하지 않는 경우

<META NAME="ROBOTS" CONTENT="NOFOLLOW">
; 페이지에 파싱을 허용하지 않는 경우 

와 같이 사용 해도 됩니다. 그런데 이런 robot.txt를 만드는 방법이나 메타 태그를 이용하는 경우는 표준을 따르는 검색 로봇들에 대해서만 해당 합니다. 

>아파치의 에러로그를 보면 아래와 같은 robots.txt 를 못찾는 다는 로그가 계속 쌓입니다.
>이 로그가 무엇입니까 ?
>
>Sun Jan 25 06:49:43 2004] [error] [client 216.88.158.142] File does not exist: /www/robots.txt

>
>아파치의 에러로그를 보면 아래와 같은 robots.txt 를 못찾는 다는 로그가 계속 쌓입니다.
>이 로그가 무엇입니까 ?
>
>Sun Jan 25 06:49:43 2004] [error] [client 216.88.158.142] File does not exist: /www/robots.txt

. 


[이전글]  리눅스오픈소스 다운로드 경로
[다음글]  여러분의 robots.txt 는 안녕하십니까?


 
댓글쓰기는 회원(로그인 하신분) 이상 가능합니다.


 댓글 (0)

  
질문&답변
페이지: 2 / 10   

 리눅스에서 make로 설치된 프로그램 삭제하는 법
열람:3821   2008.10.14


 마운트 명령어
열람:4210   2008.10.06


 페도라 웹설치는 안되나요?
열람:2540   2008.10.05


 리눅스오픈소스 다운로드 경로
열람:2728   2008.10.05


 여러분의 robots.txt 는 안녕하십니까?
열람:3310   2008.10.04


   [RE] 아파치 에러로그 중에서 robots.txt error이 무엇 인가요 ?
열람:4290   2008.10.04


 페도라를 개인적으로 사용중인데요..
열람:3993   2008.04.07


 리눅스 팁
열람:9280   2008.04.07


 삼바관련질문 : 리눅스 -> 윈도우머신으로
열람:3759   2008.02.05


 리눅스 checking filesystems
열람:2594   2008.01.30



  [1]  [2]  [3]  [4]  [5]  

복수단어 검색은 공백(space)로 구분해 주세요.




 
최근 글 [손님]
 
인기 글 [손님]
[홈마스타] [RE] input type=\\