RAG: Tương lai tri thức – kết hợp tìm kiếm và sáng tạo

Trong kỷ nguyên của Trí tuệ nhân tạo tạo sinh, một kiến trúc lai mới đã nổi lên, kết hợp khả năng tạo nội dung mới với năng lực truy xuất tri thức đã được thiết lập. Được biết đến với tên gọi Retrieval-Augmented Generation (RAG), mô hình này đại diện cho một bước tiến quan trọng trong cách chúng ta tương tác với thông tin. Không giống như các hệ thống tạo sinh trước đây chỉ dựa vào các mẫu thống kê trong dữ liệu, hệ thống RAG vươn tới các nguồn bên ngoài – cơ sở dữ liệu, tài liệu và kho tri thức – để neo đậu các kết quả đầu ra của chúng vào các sự kiện có thể truy xuất. Nhưng vượt ra ngoài hiệu quả kỹ thuật, RAG chỉ ra một sự thay đổi rộng lớn hơn: một sự tái cấu trúc tri thức, từ thứ gì đó cố định và được lưu trữ sang thứ gì đó năng động và được trung gian hóa một cách tương tác.

Bài viết này khám phá cách RAG biến đổi mối quan hệ của chúng ta với tri thức. Nó lập luận rằng chúng ta đang chuyển dịch từ một mô hình nơi tri thức chủ yếu được hiểu là sự tích lũy nội dung ổn định – sách, bài báo, bộ dữ liệu – sang một mô hình nơi tri thức trở thành một quá trình trung gian hóa ý nghĩa theo thời gian thực giữa truy vấn của con người và hệ thống máy móc. Các hệ thống RAG không chỉ truy xuất và trình bày sự kiện; chúng tạo ra các phản hồi phù hợp theo ngữ cảnh, pha trộn truy xuất với mô phỏng. Sự lai ghép này buộc chúng ta phải suy nghĩ lại ý nghĩa của việc biết, cách quyền uy được xây dựng và cách ý nghĩa được ổn định hóa trong một thế giới nơi thông tin vừa được neo giữ vừa linh hoạt.

Quan điểm cổ điển về tri thức: sự ổn định và quyền uy

Trong phần lớn lịch sử hiện đại, tri thức được xem như một thứ có thể được lưu trữ, phân loại và truyền đạt. Thư viện, kho lưu trữ và cơ sở dữ liệu đã đóng vai trò là nơi lưu giữ sự thật, với vai trò của giáo dục và chuyên môn là tiếp cận, diễn giải và áp dụng tri thức này. Quyền uy, theo quan điểm này, bắt nguồn từ sự gần gũi với nguồn – những người có quyền truy cập dữ liệu tốt nhất, các nguồn đáng tin cậy nhất hoặc sự hiểu biết sâu sắc nhất về quy chuẩn được xem là những người nắm giữ tri thức hợp pháp.

Quan điểm này phù hợp với những gì triết gia Jürgen Habermas gọi là tình huống diễn ngôn lý tưởng, nơi các yêu cầu về sự thật có thể được tranh luận và xác nhận một cách hợp lý trong một khuôn khổ giao tiếp chung. Sự ổn định của tri thức được đảm bảo bởi các chuẩn mực chung về xác minh, ranh giới kỷ luật và sự tin cậy của tổ chức.

RAG và sự lai ghép của tri thức

Các hệ thống RAG thách thức mô hình cổ điển này bằng cách hợp nhất hai quy trình: truy xuất và tạo sinh. Khi bạn đặt câu hỏi cho một AI dựa trên RAG, nó không chỉ đơn giản tạo ra câu trả lời dựa trên dữ liệu đào tạo trước đó, cũng không chỉ đơn giản là truy xuất một đoạn văn từ cơ sở dữ liệu. Thay vào đó, nó truy xuất nội dung có liên quan và sau đó sử dụng các thuật toán tạo sinh để soạn một phản hồi phù hợp với truy vấn của bạn. Phản hồi này không phải là trích dẫn trực tiếp từ nguồn, cũng không phải là hoàn toàn bịa đặt – đó là sự tổng hợp, một sự tái cấu trúc tri thức được trung gian hóa để đáp ứng ngữ cảnh.

Sự lai ghép này có nhiều hàm ý. Thứ nhất, nó thay đổi tính thời gian của tri thức. Trong các hệ thống truyền thống, tri thức là thứ đã tồn tại, để được tiếp cận. Trong RAG, tri thức được tạo ra một phần tại thời điểm tương tác. Thứ hai, nó làm thay đổi quyền uy. Quyền uy của một phản hồi do RAG tạo ra không còn chỉ dựa vào nguồn gốc ban đầu hoặc mô hình thống kê của hệ thống mà dựa vào độ tin cậy của chính quy trình trung gian hóa – cách các nguồn được chọn, cách chúng được tổng hợp và quy trình này minh bạch đến mức nào đối với người dùng.

Tri thức như một sự trung gian hóa ý nghĩa

Từ góc độ trung gian hóa ý nghĩa, RAG minh họa cho sự chuyển dịch từ tri thức như nội dung tĩnh sang tri thức như một tương tác năng động. Tương tác này không chỉ đơn thuần là kỹ thuật mà còn là ngữ nghĩa – nó liên quan đến việc thương lượng ý nghĩa liên tục giữa người dùng là con người và hệ thống máy móc. Thành phần truy xuất neo đậu phản hồi vào các cấu trúc tri thức hiện có, trong khi thành phần tạo sinh điều chỉnh và định hình lại tri thức đó để phù hợp với các ngữ cảnh mới. Ý nghĩa không đơn giản được truyền từ nguồn này sang người nhận; nó được đồng sản xuất thông qua sự tương tác giữa truy xuất và tạo sinh.

Trong cuốn sách của tôi, “AI and the Mediation of Meaning”, tôi khám phá sâu sắc sự thay đổi này, lập luận rằng các công nghệ như RAG là một phần của sự chuyển đổi rộng lớn hơn trong văn hóa nhận thức của chúng ta. Dựa trên lý thuyết hệ thống, đặc biệt là ý tưởng về sự ghép đôi cấu trúc, chúng ta có thể xem RAG như một trường hợp mà các hệ thống nhận thức của con người (tìm kiếm sự hiểu biết) và các hệ thống công nghệ (sản xuất và truy xuất các biểu đạt) ngày càng liên kết chặt chẽ với nhau. Sự ghép đôi cấu trúc đề cập đến cách các hệ thống khác nhau – sinh học, xã hội, công nghệ – tương tác trong khi vẫn duy trì ranh giới của riêng chúng. Các hệ thống RAG ghép đôi quá trình tạo nghĩa của con người với các quy trình của máy móc, tạo ra các hình thức tương tác tri thức mới mà cả con người và máy móc đều không thể tạo ra một mình.

Vai trò của diễn giải và sự tin cậy

Trong môi trường nhận thức mới này, diễn giải trở nên trung tâm. Người dùng không chỉ phải tiếp nhận thông tin mà còn phải tham gia một cách phê phán vào cách thức thông tin đó được trung gian hóa. Những nguồn nào đã được truy xuất? Chúng được chọn như thế nào? Những giả định nào đã định hướng quy trình tạo sinh? Sự tin cậy, trong bối cảnh này, chuyển từ sự phụ thuộc vào quyền uy tĩnh sang sự tự tin vào tính minh bạch và độ tin cậy của các quy trình trung gian hóa.

Điều này đòi hỏi các hình thức hiểu biết mới – không chỉ là hiểu biết kỹ thuật số, mà còn là hiểu biết ngữ nghĩa, khả năng điều hướng, đặt câu hỏi và đồng sáng tạo ý nghĩa trong một thế giới nơi tri thức liên tục được tái cấu trúc. Nó cũng kêu gọi các khuôn khổ thể chế mới có thể hướng dẫn và quản lý cách các hệ thống RAG được thiết kế, sử dụng và đánh giá, đảm bảo rằng tính linh hoạt của tri thức không làm xói mòn tính toàn vẹn của nó.

Hệ sinh thái tri thức và tương lai

Cuối cùng, RAG mời gọi chúng ta xem tri thức như một phần của một hệ sinh thái sống – một hệ thống phức tạp, thích ứng, trong đó các tác nhân con người và phi con người tham gia vào quá trình xây dựng ý nghĩa liên tục. Trong hệ sinh thái này, sự ổn định và thay đổi cùng tồn tại. Truy xuất mang lại sự liên tục với tri thức đã được thiết lập, trong khi tạo sinh mang lại sự mới lạ và khả năng thích ứng.

Tương lai của tri thức, do đó, không nằm ở việc chống lại sự lai ghép này mà là học cách sống chung với nó – phát triển các thực hành, công nghệ và văn hóa có thể khai thác thế mạnh của cả hai.

Chia sẻ tới bạn bè và gia đình
Gọi ngay Chat