Tạo sinh dựa trên truy xuất tăng cường (tiếng Anh: retrieval-augmented generation hoặc RAG) là một kỹ thuật cho phép các mô hình ngôn ngữ lớn (LLM) truy xuất và kết hợp thông tin mới. Với RAG, các LLM không trả lời truy vấn của người dùng ngay lập tức. Thay vào đó, chúng sẽ tham khảo một bộ tài liệu được chỉ định trước. Ví dụ, kỹ thuật này giúp các chatbot dựa trên LLM truy cập dữ liệu nội bộ của công ty. Nó cũng giúp tạo ra các phản hồi dựa trên những nguồn đáng tin cậy.
RAG cải thiện các mô hình ngôn ngữ lớn (LLM) bằng cách tích hợp cơ chế truy xuất thông tin trước khi tạo ra phản hồi. hiện tượng này đã khiến các chatbot mô tả những chính sách không tồn tại, hoặc đề xuất các vụ án không có thật cho luật sư đang tìm kiếm án lệ để hỗ trợ cho lập luận của họ.
RAG cũng làm giảm nhu cầu huấn luyện lại các LLM bằng dữ liệu mới. Điều này giúp tiết kiệm chi phí tính toán và tài chính. Tạp chí MIT Technology Review đưa ra ví dụ về một phản hồi do AI tạo ra, nói rằng, "Hoa Kỳ đã có một tổng thống Hồi giáo, Barack Hussein Obama." Mô hình đã truy xuất thông tin này từ một cuốn sách học thuật có tựa đề tu từ là Barack Hussein Obama: Tổng thống Hồi giáo đầu tiên của nước Mỹ? LLM đã không "biết" hoặc "hiểu" ngữ cảnh của tiêu đề, do đó đã tạo ra một tuyên bố sai sự thật.
Quy trình
Tạo sinh dựa trên truy xuất tăng cường (RAG) nâng cao các mô hình ngôn ngữ lớn (LLM) bằng cách tích hợp một cơ chế truy xuất thông tin. Cơ chế này cho phép các mô hình truy cập và sử dụng dữ liệu bổ sung ngoài bộ dữ liệu huấn luyện ban đầu. AWS cho biết, "RAG cho phép các LLM truy xuất thông tin liên quan từ các nguồn dữ liệu bên ngoài để tạo ra các phản hồi chính xác và phù hợp với ngữ cảnh hơn" ("lập chỉ mục"). Ars Technica lưu ý rằng "khi có thông tin mới, thay vì phải huấn luyện lại mô hình, tất cả những gì cần làm là tăng cường cơ sở tri thức bên ngoài của mô hình bằng thông tin cập nhật" ("tăng cường").
thumb|Tổng quan về quy trình RAG, kết hợp các tài liệu bên ngoài và đầu vào của người dùng vào một câu lệnh LLM để có được đầu ra tùy chỉnh
Truy xuất
Khi có một truy vấn từ người dùng, một bộ truy xuất tài liệu sẽ được gọi đầu tiên. Nó sẽ chọn ra các tài liệu phù hợp nhất để sử dụng cho việc tăng cường truy vấn. Các phiên bản mới hơn () cũng có thể tích hợp các mô-đun tăng cường cụ thể. Chúng có các khả năng như mở rộng truy vấn sang nhiều lĩnh vực, sử dụng bộ nhớ và tự cải thiện để học hỏi từ các lần truy xuất trước đó.
- Hiệu suất được cải thiện bằng cách tối ưu hóa cách tính độ tương đồng của vectơ. Tích vô hướng giúp nâng cao điểm tương đồng, trong khi tìm kiếm hàng xóm gần nhất xấp xỉ (ANN) cải thiện hiệu quả truy xuất so với tìm kiếm K hàng xóm gần nhất (KNN).
- Độ chính xác có thể được cải thiện bằng Tương tác muộn (Late Interactions), cho phép hệ thống so sánh các từ một cách chính xác hơn sau khi truy xuất. Điều này giúp tinh chỉnh xếp hạng tài liệu và cải thiện mức độ phù hợp của tìm kiếm.
Các phương pháp lấy bộ truy xuất làm trung tâm
Các phương pháp này nhằm mục đích nâng cao chất lượng truy xuất tài liệu trong cơ sở dữ liệu vectơ:
- Tiền huấn luyện bộ truy xuất bằng Tác vụ Cloze đảo ngược (Inverse Cloze Task - ICT). Đây là một kỹ thuật giúp mô hình học các mẫu truy xuất bằng cách dự đoán văn bản bị che trong tài liệu.
- Các kỹ thuật xếp hạng lại (reranking) có thể tinh chỉnh hiệu suất của bộ truy xuất bằng cách ưu tiên các tài liệu được truy xuất phù hợp nhất trong quá trình huấn luyện. là một bộ tiêu chuẩn mã nguồn mở được thiết kế để kiểm tra chất lượng truy xuất trên các tài liệu pháp lý. Nó đánh giá độ phủ (recall) và độ chính xác (precision) cho các quy trình RAG khác nhau bằng cách sử dụng các câu hỏi và tài liệu pháp lý trong thực tế.
Thách thức
RAG không phải là giải pháp hoàn chỉnh cho vấn đề ảo giác ở các LLM. Theo Ars Technica, "Nó không phải là một giải pháp trực tiếp vì LLM vẫn có thể tạo ra ảo giác xung quanh tài liệu nguồn trong phản hồi của mình."
Mặc dù RAG cải thiện độ chính xác của các mô hình ngôn ngữ lớn (LLM), nó không loại bỏ được tất cả các thách thức. Một hạn chế là dù RAG làm giảm nhu cầu huấn luyện lại mô hình thường xuyên, nó không loại bỏ hoàn toàn nhu cầu này. Ngoài ra, các LLM có thể gặp khó khăn trong việc nhận ra khi nào chúng không có đủ thông tin để đưa ra một câu trả lời đáng tin cậy. Nếu không được huấn luyện cụ thể, các mô hình có thể tạo ra câu trả lời ngay cả khi chúng nên thể hiện sự không chắc chắn. Theo IBM, vấn đề này có thể phát sinh khi mô hình thiếu khả năng tự đánh giá giới hạn kiến thức của chính nó.
Các hệ thống RAG có thể truy xuất các nguồn thông tin đúng sự thật nhưng lại gây hiểu lầm, dẫn đến sai sót trong việc diễn giải. Trong một số trường hợp, một LLM có thể trích xuất các phát biểu từ một nguồn mà không xem xét ngữ cảnh của nó, dẫn đến một kết luận không chính xác. Thêm vào đó, khi đối mặt với thông tin mâu thuẫn, các mô hình RAG có thể gặp khó khăn trong việc xác định nguồn nào là chính xác. Chúng có thể kết hợp các chi tiết từ nhiều nguồn, tạo ra các phản hồi trộn lẫn thông tin lỗi thời và cập nhật một cách gây hiểu lầm. Theo tạp chí MIT Technology Review, những vấn đề này xảy ra vì các hệ thống RAG có thể diễn giải sai dữ liệu mà chúng truy xuất.
👁️
5 | 🔗 | 💖 | ✨ | 🌍 | ⌚
**Tạo sinh dựa trên truy xuất tăng cường** (tiếng Anh: **retrieval-augmented generation** hoặc **RAG**) là một kỹ thuật cho phép các mô hình ngôn ngữ lớn (LLM) truy xuất và kết hợp thông tin mới.
**Kỹ thuật tạo lệnh** hoặc **kỹ thuật ra lệnh** (prompt engineering) là quá trình cấu trúc một **văn bản đầu vào** cho AI tạo sinh giải thích và diễn giải. Một **văn bản đầu vào**
**_Truy tìm thanh gươm báu_** (tên gốc: **Quest for Camelot**) còn có nhan đề _The magic sword: Quest for Camelot_, là một phim hoạt hình sản xuất năm 1998 của hãng Warner Bros, dựa theo
Đông trùng hạ thảo là một loại dược thảo quý hiếm, được xem trọng trong cả nền y học cổ truyền lẫn y học hiện đại nhờ những tác dụng vượt trội như củng cố
Đông trùng hạ thảo là một loại dược thảo quý hiếm, được xem trọng trong cả nền y học cổ truyền lẫn y học hiện đại nhờ những tác dụng vượt trội như củng cố
**_Án mạng trên sông Nile_** (tựa gốc: **_Death on the Nile_**) là một bộ phim điện ảnh Anh – Mỹ thuộc thể loại trinh thám – giật gân ra mắt vào năm 2022 do Kenneth
Bài viết dưới đây trình bày lịch sử của các loại xe tăng được sử dụng bởi các lực lượng khác nhau ở Việt Nam. ## Những vết xích tăng đầu tiên Vào năm 1918,
**Nền kinh tế nền tảng** (trong tiếng Anh gọi là **Platform Economy**) được hiểu là một phần của nền kinh tế mà tại đó các hoạt động kinh tế và xã hội được diễn ra
Thành phần của Viên tiểu đường công nghệ cao MPsunoCông dụng của Viên tiểu đường công nghệ cao MPsunoMPsuno hiệp đồng tác dụng của 3 loại Nano thảo dược gồm Nano Dây thìa canh, Nano
Thành phần của Viên tiểu đường công nghệ cao MPsunoCông dụng của Viên tiểu đường công nghệ cao MPsunoMPsuno hiệp đồng tác dụng của 3 loại Nano thảo dược gồm Nano Dây thìa canh, Nano
**Trí tuệ nhân tạo** (**TTNT**) (tiếng Anh: **_Artificial intelligence_**, viết tắt: **_AI_**) là khả năng của các hệ thống máy tính thực hiện các nhiệm vụ liên quan đến trí thông minh của con người,
**Tân Cương** (; ; bính âm bưu chính: **Sinkiang**), tên chính thức là **Khu tự trị Duy Ngô Nhĩ Tân Cương**, là một khu vực tự trị tại Cộng hòa Nhân dân Trung Hoa. Năm
**Máy truy tìm dữ liệu trực tuyến** hay **máy tìm kiếm** hay **cỗ máy tìm kiếm** (tiếng Anh: _search engine_), hay còn được gọi với nghĩa rộng hơn là **công cụ tìm kiếm** (_search tool_),
**Bảo tàng Chứng tích Chiến tranh** (War Remnants Museum) là một bảo tàng vì hòa bình ở số 28 đường Võ Văn Tần, Phường Võ Thị Sáu, Quận 3, Thành phố Hồ Chí Minh. Bảo
**Tư duy sáng tạo** là chủ đề của một lĩnh vực nghiên cứu còn mới. Nó nhằm tìm ra các phương án, biện pháp thích hợp để kích hoạt khả năng sáng tạo và để
**_Lệnh truy nã đỏ_** (tựa gốc tiếng Anh: **_Red Notice_**) là một bộ phim hài hành động của Mỹ năm 2021 do Rawson Marshall Thurber viết kịch bản, đạo diễn kiêm sản xuất. Dwayne Johnson
**Tin sinh học** (_bioinformatics_) là một lĩnh vực khoa học sử dụng các công nghệ của các ngành toán học ứng dụng, tin học, thống kê, khoa học máy tính, trí tuệ nhân tạo, hóa
Mối nguy hại của bệnh khớp ở người cao tuổi và dân văn phòngỞ người cao tuổi, khớp kém linh động hơn, tế bào khớp bị thoái hóa dần, độ nhày trong các ổ khớp
Mối nguy hại của bệnh khớp ở người cao tuổi và dân văn phòngỞ người cao tuổi, khớp kém linh động hơn, tế bào khớp bị thoái hóa dần, độ nhày trong các ổ khớp
thumb|right|Thuận chiều kim đồng hồ từ góc trên bên trái: [[Søren Kierkegaard, Fyodor Dostoevsky, Jean-Paul Sartre, Friedrich Nietzsche.]] **Chủ nghĩa hiện sinh** hay **thuyết hiện sinh** là luồng tư tưởng triết học của một nhóm
**Sinh vật huyền bí trong bộ truyện Harry Potter** gồm rất nhiều sinh vật hư cấu được nhà văn J. K. Rowling sáng tạo ra với chủng loại, kích thước khác nhau trong đó có
**Tăng Cách Lâm Thấm** (chữ Hán: 僧格林沁, ,; 24 tháng 7 năm 1811 - 18 tháng 5 năm 1865), quý tộc Mông Cổ, người Khoa Nhĩ Thấm Tả Dực Hậu kỳ , thị tộc Bác
**Dừa** (_Cocos nucifera_) là một loài thực vật thân gỗ, thành viên thuộc họ Cau (Arecaceae) và là loài duy nhất còn sống thuộc chi _Cocos._ Dừa có mặt khắp nơi tại các vùng nhiệt
**Xe tăng Iosif Stalin** (hay **Xe tăng IS**), là một loại xe tăng hạng nặng được Liên bang Xô viết phát triển trong Thế chiến II. Những chiếc xe tăng thuộc loại này thỉnh thoảng
Trong giao dịch kinh tế, **phái sinh** () là một dạng hợp đồng dựa trên giá trị của các tài sản cơ sở khác nhau như tài sản, chỉ số, lãi suất hay cổ phiếu
Qua thực nghiệm của cuộc sống, có thể thấy bất cứ doanh nghiệp nào khi tham gia vào một hoặc nhiều hệ sinh thái rõ ràng đều nhận được những lợi ích không thể chối
Cindel Tox White Cream được sản xuất trên dây chuyền công nghệ tiên tiến. Mỗi sản phẩm trước khi đưa đến tận tay người tiêu dùng đều phải được kiểm định chặt chẽ về chất
**Học sâu** (tiếng Anh: **deep learning**, còn gọi là **học cấu trúc sâu**) là một phần trong một nhánh rộng hơn các phương pháp học máy dựa trên mạng thần kinh nhân tạo kết hợp
Hai con sư tử đang giao cấu ở [[Maasai Mara, Kenya]] phải|nhỏ| "Sự giao hợp giữa nam và nữ" (tranh [[Leonardo da Vinci vẽ khoảng 1492), mô tả những gì xảy ra bên trong cơ
**Lương Võ Đế** (chữ Hán: 梁武帝; 464 – 549), tên húy là **Tiêu Diễn** (蕭衍), tự là **Thúc Đạt** (叔達), tên khi còn nhỏ **Luyện Nhi** (練兒), là vị Hoàng đế khai quốc của triều
Giới thiệu cơ bản về Hệ sinh thái con (Sub Ecosystems) cũng như những chức năng nổi bật của nó. Với khả năng mở rộng vô hạn, Sub Ecosystem là một sự đột phá trong
Giới thiệu tổng quan về Hệ sinh thái con (Sub Ecosystems) và các chức năng nổi bật của nó. Với tiềm năng mở rộng không giới hạn, Sub Ecosystem là một bước tiến cách mạng
**Tiếp thị nội dung** là một thuật ngữ bao gồm tất cả dạng thức marketing liên quan đến việc tạo và chia sẻ nội dung. Nội dung được tạo ra dùng để hướng khách hàng
Đạo luật cải cách và bảo vệ người tiêu dùng của Phố Wall Dodd - Frank (thường được gọi là Dodd - Frank) là một đạo luật liên bang Hoa Kỳ có hiệu lực vào
Tư duy thiết kế (DT) là chủ đề của nhiều cuộc tranh luận và ứng dụng rộng rãi trên nhiều lĩnh vực kiến thức khác nhau, bao gồm cả lĩnh vực thực phẩm; tuy nhiên,
Tư duy thiết kế (DT) là chủ đề của nhiều cuộc tranh luận và ứng dụng rộng rãi trên nhiều lĩnh vực kiến thức khác nhau, bao gồm cả lĩnh vực thực phẩm; tuy nhiên,
_Về các con đường khác cùng tên "Đường Hồ Chí Minh", xem Đường Hồ Chí Minh (định hướng)._ **_Đường Hồ Chí Minh trên biển_** là tên gọi của tuyến hậu cần chiến lược trên Biển
**_Criminal Minds_** là một bộ phim truyền hình về cảnh sát và tội phạm Mỹ được tạo và sản xuất bởi Jeff Davis. Bộ phim lần đầu phát sóng trên CBS vào ngày 22 tháng
**Hunter × Hunter** (tiếng Nhật: ハンター×ハンター, phát âm: Hantā Hantā) (còn được biết đến ở Việt Nam với tên gọi Việt hóa là **Thợ săn tí hon**) là bộ manga dành cho thanh thiếu niên
**Trịnh Cương** (chữ Hán: 鄭棡, 9 tháng 7 năm 1686 – 20 tháng 12 năm 1729), còn có tên khác là **Trịnh Chù**, thụy hiệu là **Hy Tổ Nhân vương** (禧祖仁王), là vị chúa Trịnh
là bộ truyện tranh Nhật Bản do Tozuka Yoshifumi sáng tác và minh họa, được đăng dài kỳ trên tạp chí Weekly Shōnen Jump của Shueisha kể từ tháng 4 năm 2020. Các chương riêng
nhỏ|phải|Những con [[tê giác châu Phi, ngày nay, chúng là biểu tượng của sự nghiệp bảo tồn động vật, trong lịch sử chúng từng được xem như loài thần thú trị thủy]] nhỏ|phải|Họa phẩm về
**Kuroshitsuji** (黒執事, くろしつじ) là một loạt manga được viết và minh họa bởi Toboso Yana. Loạt manga này ra mắt vào ngày 16 tháng 9 năm 2006 đăng trên tạp chí truyện tranh hàng tháng
phải|thumb|Lao động Việt Nam được khai thác, đào tạo tại [[Cộng hòa Dân chủ Đức|Đông Đức năm 1982.]] **Xuất khẩu lao động Việt Nam ra nước ngoài**, thường gọi tắt là **Xuất khẩu lao động
**_Sòng bạc hoàng gia_** (tựa gốc ) là bộ phim đề tài gián điệp công chiếu năm 2006 và là phần thứ 21 trong loạt phim điện ảnh _James Bond_ của Eon Productions, cũng như
**Lò đào tạo quái vật** (tên gốc , còn có tên gọi khác là **Đại học quái vật**) là phim điện ảnh hoạt hình máy tính 3D của Mỹ năm 2013 do hãng Pixar Animation
**Thương hiệu số** là một loại kỹ thuật quản trị thương hiệu, kết hợp giữa quảng bá thương hiệu thông qua internet và tiếp thị kỹ thuật số, tiếp thị trực tuyến để phát triển
Chuyển đổi số là quá trình thay đổi tổng thể và toàn diện của cá nhân, tổ chức về cách sống, cách làm việc và phương thức sản xuất dựa trên các công nghệ số.Chuyển
**_American Sniper_** (tựa tiếng Việt: **_Lính bắn tỉa Mỹ_**) là một bộ phim điện ảnh chính kịch tiểu sử đề tài chiến tranh năm 2014 của Mỹ, do Clint Eastwood làm đạo diễn và Jason
là một bộ phim điện ảnh hoạt hình Nhật Bản thuộc thể loại tình cảm lãng mạn, kỳ ảo, chính kịch do Shinkai Makoto làm đạo diễn. Phim do hãng CoMix Wave Films sản xuất