✨Mạng Bayes

Mạng Bayes

Mạng Bayes (tiếng Anh: Bayesian network hoặc Bayesian belief network hoặc belief network) là một mô hình xác suất dạng đồ thị.

Mạng Bayes là cách biểu diễn đồ thị của sự phụ thuộc thống kê trên một tập hợp các biến ngẫu nhiên, trong đó các nút đại diện cho các biến, còn các cạnh đại diện cho các phụ thuộc có điều kiện. Phân phối xác suất đồng thời (joint probability distribution) của các biến được xác định bởi cấu trúc đồ thị của mạng. Mô tả đồ thị của mạng Bayes dẫn tới các mô hình dễ giải thích, và tới các thuật toán toán học và suy luận hiệu quả.

Trong trường hợp tổng quát hơn, các nút có thể đại diện cho các loại biến khác, một tham số đo được, một biến ẩn (latent variable) hay một giả thuyết, chứ không nhất thiết phải đại diện cho các biến ngẫu nhiên.

Định nghĩa

Một mạng Bayes là một đồ thị có hướng phi chu trình mà trong đó:

  • các nút biểu diễn các biến,
  • các cạnh biểu diễn các quan hệ phụ thuộc thống kê giữa các biến và phân phối xác suất địa phương cho mỗi giá trị nếu cho trước giá trị của các cha của nó.

Nếu có một cạnh từ nút A tới nút B, thì biến B phụ thuộc trực tiếp vào biến A, và A được gọi là cha của B. Nếu với mỗi biến Xi, i \isin {1, \ldots, N}, tập hợp các biến cha được ký hiệu bởi parents(Xi), thì phân phối có điều kiện phụ thuộc của các biến là tích của các phân phối địa phương :Pr(X_1, \ldots, Xn) = \prod{i=1}^n Pr(X_i \mid \operatorname{parents}(X_i))

Nếu Xi không có cha, ta nói rằng phân phối xác suất địa phương của nó là không có điều kiện, ngược lại thì gọi là có điều kiện. Nếu biến được biểu diễn bởi một nút được quan sát, thì ta nói rằng nút đó là một chứng cứ (evidence node).

Các câu hỏi về sự phụ thuộc không tương đẳng giữa các biến có thể được trả lời bằng cách nghiên cứu đồ thị. Có thể chứng minh rằng trong đồ thị, tính độc lập có điều kiện được biểu diễn bởi tính chất đồ thị d-khả ly: cho trước một số nút hiển nhiên cụ thể, các nút XYd-khả ly trong đồ thị khi và chỉ khi các biến XY là độc lập, với giá trị đã biết các chứng cứ tương ứng. Tập hợp gồm tất cả các nút khác mà X có thể phụ thuộc trực tiếp được cho bởi bao Markov của X.

Một ưu điểm của mạng Bayes là, về mặt trực quan, ta có thể hiểu các quan hệ phụ thuộc một cách trực tiếp và các phân phối địa phương dễ dàng hơn là phân phối có điều kiện phụ thuộc hoàn chỉnh.

Ví dụ

Nếu có hai lý do cho việc cỏ bị ướt (GRASSWET): hoặc do được tưới nước (SPRINKLER), hoặc do trời mưa (RAIN), thì tình huống này có thể được mô hình hóa bởi một mạng Bayes. Ở đây, các biến có hai trạng thái có thể: T (đúng) và F (sai).

Hàm xác suất phụ thuộc có điều kiện là :Pr(GRASSWET, SPRINKLER, RAIN) = Pr(GRASSWET | SPRINKLER, RAIN).Pr(SPRINKLER | RAIN).Pr(RAIN)

Mô hình có thể trả lời các câu hỏi như "Nếu cỏ ướt thì khả năng trời mưa là bao nhiêu?" bằng cách sử dụng các công thức xác suất có điều kiện và lấy tổng tất cả các biến trở ngại (nuisance variable): :Pr(\mathit{RAIN}=T \mid \mathit{GRASSWET}=T) = \frac{Pr(\mathit{GRASSWET}=T, \mathit{RAIN}=T)}{Pr(\mathit{GRASSWET}=T)} := \frac{\sum{\mathit{SPRINKLER} \in {T, F\ Pr(\mathit{GRASSWET}=T, \mathit{SPRINKLER}, \mathit{RAIN}=T)}{\sum{\mathit{SPRINKLER}, \mathit{RAIN} \in {T, F\ Pr(\mathit{GRASSWET}=T, \mathit{SPRINKLER}, \mathit{RAIN})}

Thay thế các giá trị số, ta được Pr(RAIN=T | GRASSWET=T) = 891/2491 ≈ 35.77%.

Cách khác: (P(G=T,S=F,R=T) + P(G=T,S=T,R=T)) / (P(G=T,S=F,R=F) + P(G=T,S=T,R=F) + P(G=T,S=F,R=T) + P(G=T,S=T,R=T)) = (15.84%+0.198%) / (0.0%+28.8%+15.84%+0.198%) = 16.038% / 44.838% ≈ 35.77%.

Mạng Bayes nhân quả

Mạng Bayes nhân quả là một mạng Bayes mà trong đó các cạnh có hướng của đồ thị được hiểu là các quan hệ nhân quả trong một miền xác định có thực nào đó. Các cạnh có hướng, một cách tổng quát, không nhất thiết phải được hiểu là các quan hệ nhân quả; tuy nhiên, trong thực tiễn, tri thức về các quan hệ nhân quả rất hay được dùng để hướng dẫn vẽ các đồ thị mạng Bayes, kết quả là có được các mạng Bayes nhân quả.

Học cấu trúc

Trong trường hợp đơn giản nhất, một mạng Bayes được xây dựng bởi một chuyên gia và rồi được dùng để thực hiện việc suy luận. Trong các ứng dụng khác, công việc xây dựng mạng quá phức tạp đối với con người. Trong trường hợp này, cấu trúc và các tham số mạng của các phân bố địa phương phải được học từ dữ liệu.

Học cấu trúc của một mạng Bayes (nghĩa là học đồ thị) là một phần rất quan trọng của ngành nhận thức máy. Giả thiết rằng dữ liệu được sinh từ một mạng Bayes và rằng tất cả các biến là quan sát được (chứng cứ) trong mọi lần lặp, việc tối ưu hóa dựa trên phương pháp tìm kiếm có thể được dùng để tìm cấu trúc mạng. Việc này đòi hỏi một hàm tính điểm (scoring function) và một chiến lược tìm kiếm. Hàm tính điểm thông dụng là xác suất hậu nghiệm (posterior probability) của cấu trúc khi cho trước dữ liệu huấn luyện (training data). Quá trình tìm kiếm duyệt toàn cục để trả về một cấu trúc có số điểm tối ưu đòi hỏi thời gian cấp siêu lũy thừa (superexponential) theo số lượng biến. Ngược lại, các chiến lược tìm kiếm địa phương thực hiện các thay đổi tăng dần hướng tới việc nâng cao điểm số của cấu trúc. Một thuật toán tìm kiếm toàn cục như Phương pháp xích Markov Monte Carlo (Markov chain Monte Carlo) có thể tránh việc bị bẫy trong một cực tiểu địa phương.

Học tham số

Để cụ thể hóa mạng Bayes và biểu diễn đầy đủ các phân bố xác suất phụ thuộc có điều kiện, đối với mỗi biến X, cần phải chỉ ra phân bố xác suất X theo điều kiện thông tin từ các cha của X. Phân bố của X theo các cha của nó có thể có hình thức bất kỳ. Người ta thường dùng các phân bố rời rạc hay phân bố Gauss, do các phân bố này làm đơn giản việc tính toán. Đôi khi, khi chỉ biết được các ràng buộc của các phân bố; ta có thể dùng nguyên lý entropy cực đại để xác định một phân bố cụ thể, phân bố với entropy cực đại thỏa mãn các ràng buộc đó. (Tương tự, trong ngữ cảnh cụ thể của một mạng Bayes động, người ta thường lấy phân bố có điều kiện cho sự phát triển theo thời gian của trạng thái ẩn để cực đại hóa hệ số entropy (entropy rate) của quá trình ngẫu nhiên được nói đến.)

Thông thường, các phân bố có điều kiện này bao gồm các tham số chưa biết và phải được ước lượng từ dữ liệu, đôi khi bằng cách tiếp cận khả năng cực đại (maximum likelihood). Việc cực đại hóa trực tiếp khả năng (hoặc xác suất hậu nghiệm) thường phức tạp khi có các biến không quan sát được. Một cách tiếp cận truyền thống đối với vấn đề này là thuật toán cực đại hóa kỳ vọng (expectation-maximization algorithm), thuật toán này luân phiên giữa việc tính toán các giá trị kỳ vọng của các biến không được quan sát theo dữ liệu quan sát được, với việc cực đại hóa khả năng (hay hậu nghiệm) hoàn chỉnh với giả thuyết rằng các giá trị mong đợi đã tính được là đúng đắn. Dưới các điều kiện chính quy và vừa phải, quá trình này hội tụ về các giá trị khả năng cực đại (hay xác suất hậu nghiệm cực đại) của các tham số. Một cách tiếp cận Bayes đầy đủ hơn đối với việc học tham số là coi các tham số như là các biến không quan sát được khác và tính một phân bố hậu nghiệm đầy đủ trên toàn bộ các nút theo dữ liệu quan sát được, sau đó tách các tham số ra. Cách tiếp cận này có thể có chi phí tính toán cao và dẫn đến các mô hình có số chiều lớn, do đó trong thực tế, các cách tiếp cận truyền thống thường được sử dụng hơn.

Suy luận

Do mạng Bayes là một mô hình hoàn chỉnh cho các biến và các quan hệ giữa chúng, có thể dùng mạng Bayes để trả lời các truy vấn xác suất về các biến này. Ví dụ, mạng Bayes có thể được dùng để tìm tri thức mới nhất về trạng thái của một tập con gồm các biến khi các biến khác (các biến hiển nhiên) được quan sát. Quá trình tính phân bố hậu nghiệm này của các biến khi cho trước các biến hiển nhiên được gọi là suy luận xác suất. Quá trình hậu nghiệm cho ra một thống kê đủ phổ quát (universal sufficient statistic) cho các ứng dụng phát hiện, khi người ta muốn chọn các giá trị cho một tập con các biến nhằm mục đích cực tiểu hóa một hàm phí tổn nào đó, chẳng hạn xác suất của lỗi quyết định. Do đó, có thể coi mạng Bayes là một cơ chế cho việc xây dựng tự động các mở rộng của định lý Bayes cho các bài toán phức tạp hơn.

Ứng dụng

Mạng Bayes được dùng cho việc mô hình hóa tri thức trong các mạng điều hòa gene (gene regulatory network) , trong các hệ thống y học, phân tích văn bản, xử lý ảnh dung hợp dữ liệu , và các hệ hỗ trợ quyết định (decision support system)

👁️ 2 | 🔗 | 💖 | ✨ | 🌍 | ⌚
**Mạng Bayes** (tiếng Anh: _Bayesian network_ hoặc _Bayesian belief network_ hoặc _belief network_) là một mô hình xác suất dạng đồ thị. Mạng Bayes là cách biểu diễn đồ thị của sự phụ thuộc thống
Một **mô hình xác suất đồ thị** là một mô hình xác suất sử dụng đồ thị để biểu diễn phụ thuộc có điều kiện giữa các biến ngẫu nhiên một cách trực quan. Mô
thumb|Người chơi Mastermind sử dụng suy luận giả định để đoán màu sắc bí mật _(trên)_ từ các kết quả sai lệch _(góc dưới bên trái)_ dựa trên các phỏng đoán _(góc dưới bên phải)_.
## Học có giám sát * AODE * Mạng nơ-ron nhân tạo ** Truyền ngược ** Autoencoders ** Hopfield networks ** Máy Boltzmann ** Máy Boltzmann hạn chế ** Spiking neural networks * Thống kê
**Phân loại bằng thống kê** là một thủ tục thống kê trong đó các thể riêng biệt sẽ được sắp vào từng nhóm dựa trên số lượng thông tin về một hay nhiều tính chất
**Học máy** hay **máy học** (_machine learning_) là một lĩnh vực của trí tuệ nhân tạo liên quan đến việc nghiên cứu và xây dựng các kĩ thuật cho phép các hệ thống "học" tự
**Chẩn đoán** (_διάγνωσις_) là sự xác định tính chất và nguyên nhân của sự vật, hiện tượng. Chẩn đoán được sử dụng trong nhiều ngành qua nhiều biến thể khác nhau bằng cách sử dụng
**Trí tuệ nhân tạo** (**TTNT**) (tiếng Anh: **_Artificial intelligence_**, viết tắt: **_AI_**) là khả năng của các hệ thống máy tính thực hiện các nhiệm vụ liên quan đến trí thông minh của con người,
**Phân loại nhị phân** (tiếng Anh: _Binary classification_) là nhiệm vụ phận loại các phần tử của một tập hợp các đối tượng ra thành 2 nhóm dựa trên cơ sở là chúng có một
Trong thống kê, **biến tiềm ẩn** (hay đôi khi gọi là _biến ẩn_, tiếng Anh: **latent variable**, từ tiếng Latinh: thì hiện tại phân từ của _lateo_ có nghĩa “ẩn lời nói dối”), đối lập
**Nhóm ngôn ngữ Semit Ethiopia** (còn gọi **Ethio-Semitic,** **Ethiosemitic,** **Ethiopia** hoặc **Abyssinia**) là một nhóm ngôn ngữ được nói ở Ethiopia, Eritrea và Sudan. Cùng với ngôn ngữ Nam bán đảo Ả Rập cổ đại,
Trong **thị giác máy tính**, **mô hình túi từ** (**bag-of-words model,** mô hình BoW) có thể được áp dụng để phân loại hình ảnh, bằng cách coi các đặc trưng của hình ảnh như từ
**Điều khiển thông minh** là một lớp các kỹ thuật điều khiển sử dụng các phương pháp tính toán trí tuệ nhân tạo khác nhau như mạng nơ-ron nhân tạo (neural networks), xác suất Bayes,
Bài này nói về từ điển các chủ đề trong toán học. ## 0-9 * -0 * 0 * 6174 ## A * AES * ARCH * ARMA * Ada Lovelace * Adrien-Marie Legendre *
_Kẻ bạc gian_ (Le Tricheur), họa phẩm của [[Georges de La Tour, trưng bày tại bảo tàng Louvre, Paris]] **Ngụy biện con bạc**, hay **ngụy biện của tay cá cược**, **ngụy biện Monte Carlo** hoặc
**Học có giám sát** là một kĩ thuật của ngành học máy để xây dựng một hàm (_function_) từ dữ liệu huấn luyện. Dữ liệu huấn luyện bao gồm các cặp gồm đối tượng đầu
right|thumb|Sơ đồ biểu diễn một quá trình Markov với hai trạng thái E và A. Mỗi số biểu diễn xác suất của quá trình Markov chuyển từ trạng thái này sang trạng thái khác theo
Đây là bài con của **Trí tuệ nhân tạo**, nội dung chú trọng vào sự phát triển và **lịch sử ngành trí tuệ nhân tạo**. ## Sự phát triển của lý thuyết trí tuệ nhân
Trong toán học, **hàm softmax**, hoặc **hàm trung bình mũ**, Biệt thức tuyến tính phân tích nhiều lớp, Phương pháp phân loại Bayes, và mạng neuron. Đặc biệt, trong hồi quy logistic đa biến và
**Hổ Siberia**, **hổ Amur**, **hổ Triều Tiên**, **hổ Ussuri** hay **hổ Mãn Châu** hoang dã; biệt danh: "Chúa tể rừng Taiga", là một phân loài hổ sinh sống chủ yếu ở vùng núi Sikhote-Alin ở
**_Mosasaurus_** (nghĩa đen là "thằn lằn sông Meuse") là chi điển hình của họ Mosasauridae, một nhóm bò sát có vảy thủy sinh đã tuyệt chủng. Chúng từng sinh sống cách đây 82-66 triệu năm
Trong nhận dạng mẫu, các **đặc trưng** là các thuộc tính riêng rẽ mà ta có thể xác định và đo đạc được khi quan sát một hiện tượng nào đó. Việc lựa chọn các
Một **mô hình toán học** là một mô hình trừu tượng sử dụng ngôn ngữ toán để mô tả về một hệ thống. Mô hình toán được sử dụng nhiều trong các ngành khoa học
**Tự sát** (Hán tự: 自殺, có nghĩa là "tự giết", tiếng Anh: _suicide._ Bắt nguồn từ Tiếng Latinh: _Suicidium, từ_ chữ _sui caedere_ nghĩa là "giết chính mình") hay **tự tử**, **quyên sinh**, **trẫm mình**,
**Niên đại học** là khoa học về trật tự phát sinh sự kiện lịch sử theo thời gian. **Niên đại học đại cương** là khoa học định vị và dung giải chuỗi thời gian của