Khai thác lỗ hổng web tự động bằng AI

Bài viết được dựa trên bài nghiên cứu https://arxiv.org/html/2402.06664v1 Đây là lần đầu tiên mình nghiên cứu về LLM nên có thể có sai sót, mong bạn đọc có thể góp ý bằng cách comment bên dưới hoặc mail về kyhungchien@gmail.com. Xin cảm ơn! 1. Các khái niệm cơ bản AI là viết tắt của từ Artifical Intelligence hay được gọi là trí thông minh nhân tạo. Các mô hình ngôn ngữ lớn (LLM) là các mô hình học sâu rất lớn, được đào tạo trước dựa trên một lượng dữ liệu khổng lồ. ChatGPT (Chat Generative Pre-training Transformer) là một chatbot do OpenAI phát triển dựa trên mô hình Transformer của Google. Đây là một AI (trí tuệ nhân tạo) giúp tạo các cuộc trò chuyện tự động và trả lời các câu hỏi về nhiều chủ đề và lĩnh vực khác nhau. ChatGPT có thể trò chuyện như con người, và điều đặc biệt hơn là nó có khả năng tương tác ở dạng các cuộc hội thoại, đàm thoại tương tự như cách hai con người với nhau. Mặc dù công cụ này phổ biến, tuy nhiên nó vẫn tồn tại nhiều hạn chế (xin trích lại từ https://viblo.asia/p/langchain-1-diem-qua-cac-chuc-nang-sung-so-nhat-cua-langchain-mot-framework-cuc-ba-dao-khi-lam-viec-voi-llm-BQyJKmrqVMe): Không có tính realtime: Bạn thử lên ChatGPT và hỏi nó về thời tiết ngày hôm nay xem. Nó sẽ không trả lời được đâu. Bởi đơn giản nó chỉ là một mô hình ngôn ngữ và chỉ có có thể trả lời được trên các thông tin nó đã được huấn luyện thôi chứ không thể cập nhật dữ liệu một cách real time được. Ví dụ như hình này luôn cho các bạn dễ hình dung nhé Không truy cập được vào các dữ liệu cá nhân: Điều này là chắc chắn rồi. Nó mà trả lời được các thông tin liên quan đến dữ liệu cá nhân của mình thì quá đáng sợ phải không nào. Ví dụ nãy hỏi nó về tài khoản Facebook của bạn xem nó có biết không nhé Đương nhiên câu trả lời cũng là không rồi. 2. Đặt vấn đề và hướng giải quyết cơ bản Tương tự như ChatGPT, liệu ta có thể tạo ra một phần mềm AI, chỉ cần ra lệnh là nó có thể tự động thu thập dữ liệu và khai thác lỗ hổng Website thông dụng được hay không? Câu trả lời là có thể (mặc dù đã có sẵn nhan nhản các sản phẩm cực kì nổi tiếng như Acunetix, Nessus, ...

Apr 1, 2025 - 04:24
 0
Khai thác lỗ hổng web tự động bằng AI

Bài viết được dựa trên bài nghiên cứu https://arxiv.org/html/2402.06664v1
Đây là lần đầu tiên mình nghiên cứu về LLM nên có thể có sai sót, mong bạn đọc có thể góp ý bằng cách comment bên dưới hoặc mail về kyhungchien@gmail.com. Xin cảm ơn!

1. Các khái niệm cơ bản

  • AI là viết tắt của từ Artifical Intelligence hay được gọi là trí thông minh nhân tạo.
  • Các mô hình ngôn ngữ lớn (LLM) là các mô hình học sâu rất lớn, được đào tạo trước dựa trên một lượng dữ liệu khổng lồ. https://inwedo.com/blog/llm-ml-models-in-business/
  • ChatGPT (Chat Generative Pre-training Transformer) là một chatbot do OpenAI phát triển dựa trên mô hình Transformer của Google. Đây là một AI (trí tuệ nhân tạo) giúp tạo các cuộc trò chuyện tự động và trả lời các câu hỏi về nhiều chủ đề và lĩnh vực khác nhau. ChatGPT có thể trò chuyện như con người, và điều đặc biệt hơn là nó có khả năng tương tác ở dạng các cuộc hội thoại, đàm thoại tương tự như cách hai con người với nhau. ChatGPT website Mặc dù công cụ này phổ biến, tuy nhiên nó vẫn tồn tại nhiều hạn chế (xin trích lại từ https://viblo.asia/p/langchain-1-diem-qua-cac-chuc-nang-sung-so-nhat-cua-langchain-mot-framework-cuc-ba-dao-khi-lam-viec-voi-llm-BQyJKmrqVMe): Không có tính realtime: Bạn thử lên ChatGPT và hỏi nó về thời tiết ngày hôm nay xem. Nó sẽ không trả lời được đâu. Bởi đơn giản nó chỉ là một mô hình ngôn ngữ và chỉ có có thể trả lời được trên các thông tin nó đã được huấn luyện thôi chứ không thể cập nhật dữ liệu một cách real time được. Ví dụ như hình này luôn cho các bạn dễ hình dung nhé Ask weather Không truy cập được vào các dữ liệu cá nhân: Điều này là chắc chắn rồi. Nó mà trả lời được các thông tin liên quan đến dữ liệu cá nhân của mình thì quá đáng sợ phải không nào. Ví dụ nãy hỏi nó về tài khoản Facebook của bạn xem nó có biết không nhé Ask personal information Đương nhiên câu trả lời cũng là không rồi.

2. Đặt vấn đề và hướng giải quyết cơ bản

Tương tự như ChatGPT, liệu ta có thể tạo ra một phần mềm AI, chỉ cần ra lệnh là nó có thể tự động thu thập dữ liệu và khai thác lỗ hổng Website thông dụng được hay không? Câu trả lời là có thể (mặc dù đã có sẵn nhan nhản các sản phẩm cực kì nổi tiếng như Acunetix, Nessus, ...