Sử dụng robots.txt để xác định mục tiêu

DDos

VIP Members
22/10/2013
524
2.191 bài viết
Sử dụng robots.txt để xác định mục tiêu
Như chúng ta đã biết, đa số các webmaster sẽ upload một file gọi là robots.txt tới server của họ để khi một search engine tìm đến Website nào đó, nó sẽ tìm một file đặc biệt trước tiên, đó là file robots.txt. File robots.txt cho search engine đó biết rằng, Website này có thể index hoặc không (tùy theo lệnh được viết trong file robots.txt). Thực chất, file robots.txt là một tập tin văn bản đơn giản (không chứa mã HTML) được đặt trong thư mục gốc của web site, ví dụ: http://www.example.com/robots.txt.

Vậy tại sao webmaster muốn ẩn một vài URLs? Một trong những điều đầu tiên hacker có thể làm là kiểm tra file này. Hacker có thể nhận được rất nhiều thông tin giá trị để xác định data, scripts.. mà webmaster muốn chúng được ẩn đi.

Đôi khi qua một vài tìm kiếm trên Google với file robots.txt, kết quả tìm kiếm sẽ đưa hacker một cơ hội để xác định nội dung trong file này thông qua tìm kiếm.

Ví dụ, nếu hacker muốn xác định phpMyAdmin, hacker có thể sử dụng file robots.txt trong Google để xác định chúng và cố gắng để khai thác chúng.

1490892993Robots_phpmyadmin_uno.png


1490892993robots_phpmyadminII.png


1490892993Robots_phpmyadmin4.png

Hacker cũng có thể xác định việc cài đặt của Wordpress trên server
inurl:".com/robots.txt" + "Disallow: /wp-admin/

1490892993Robots_201.png


1490892993Robots_205.png


1490892993Robots_203.png


1490892993Robots_204.png

Hacker cũng có thể xác định việc cài đặt của Drupal trên server
inurl:".com/robots.txt" + "Disallow: ?q=admin"

1490892993Robots_Drupal2.png


1490892993Robots_drupal3.png

Hacker cũng có thể xác định việc cài đặt của Joomla trên server
inurl:"/robots.txt" + "Disallow: joomla"

1490892993Robots_joomla.png

Hacker có thể xác định việc cài đặt của Plesk Statistics trên server
inurl:"/robots.txt" + "Disallow: plesk-stat"

1490892993Robots_Plesk.png


1490892993Robots_Plesk2.png


1490892993Robots_Plesk3.png

Hacker có thể xác định sự có mặt của Tinymce trên server để cố gắng nhận được thông tin về các plugin được cài đặt trên server và cố gắng để khai thác chúng.
inurl:".com/robots.txt" + "Disallow: tinymce"

1490892993Robots_1.png


1490892993Robots_2.png

Một vài người đang thử ẩn mật khẩu của họ?
inurl:"/robots.txt" + "Disallow: passwords.txt"

1490892993Robots_password.png


1490892993Robots_password2.png



Bạn nên cẩn trọng khi bạn viết file robots.txt bởi vì nếu bất kỳ ai kiểm tra nó hoặc một vài người với khả năng sáng tạo tìm kiếm trên google với các loại truy vấn này, bạn có thể trở thành mục tiêu của các hacker.
 
Chỉnh sửa lần cuối bởi người điều hành:
Mời các bạn tham gia Group WhiteHat để thảo luận và cập nhật tin tức an ninh mạng hàng ngày.
Lưu ý từ WhiteHat: Kiến thức an ninh mạng để phòng chống, không làm điều xấu. Luật pháp liên quan
Re: Sử dụng robots.txt để xác định mục tiêu

Làm sao để đọc file robot trên 1 website cụ thể vậy?
 
Mời các bạn tham gia Group WhiteHat để thảo luận và cập nhật tin tức an ninh mạng hàng ngày.
Lưu ý từ WhiteHat: Kiến thức an ninh mạng để phòng chống, không làm điều xấu. Luật pháp liên quan
Comment
Re: Sử dụng robots.txt để xác định mục tiêu

nktung;10860 đã viết:
Làm sao để đọc file robot trên 1 website cụ thể vậy?

Có một vài công cụ cho phép xác định đó bạn. Ví dụ như owasp-zap
 
Mời các bạn tham gia Group WhiteHat để thảo luận và cập nhật tin tức an ninh mạng hàng ngày.
Lưu ý từ WhiteHat: Kiến thức an ninh mạng để phòng chống, không làm điều xấu. Luật pháp liên quan
Comment
Bên trên