✨Định lý Bayes

Định lý Bayes

nhỏ|Định lý Bayes được viết lên bằng đèn neon xanh tại văn phòng của Autonomy ở Cambridge. Định lý Bayes (Tiếng Anh: Bayes theorem) là một kết quả của lý thuyết xác suất. Nó phản ánh mối quan hệ giữa xác suất của một biến cố mà không quan tâm các yếu tố khác (gọi là xác suất biên hay xác suất tiền nghiệm) với xác suất của biến cố đó sau khi một biến cố khác đã xảy ra (gọi là xác suất có điều kiện hay xác suất hậu nghiệm). Cụ thể hơn, nó đề cập đến phân bố xác suất có điều kiện của biến ngẫu nhiên A, với giả thiết:

  • thông tin về một biến khác B: phân bố xác suất có điều kiện của B khi biết A, và
  • phân bố xác suất của một mình A. Định lý Bayes là một khái niệm đặt nền tảng cho thống kê Bayes, một trường phái suy luận thống kê dựa trên bằng chứng và niềm tin và tồn tại song song với trường phái suy luận thống kê mẫu lặp (frequentist). Trong suy luận Bayes, xác suất được coi là một phép đo về niềm tin vào khả năng xảy ra một sự kiện, và được cập nhật liên tục mỗi khi quan sát được một bằng chứng (hay một điểm dữ liệu) mới.

Phát biểu định lý

Định lý Bayes cho phép tính xác suất xảy ra của một sự kiện ngẫu nhiên A khi biết sự kiện liên quan B đã xảy ra. Xác suất này được ký hiệu là P(A|B), và đọc là "xác suất của A nếu có B". Đại lượng này được gọi là xác suất có điều kiện hay xác suất hậu nghiệm vì nó được rút ra từ giá trị được cho của B hoặc phụ thuộc vào giá trị đó.

Theo định lý Bayes, xác suất xảy ra A khi biết B sẽ phụ thuộc vào 3 yếu tố:

  • Xác suất xảy ra A của riêng nó, không quan tâm đến B. Ký hiệu là P(A) và đọc là xác suất của A. Đây được gọi là xác suất biên duyên hay xác suất tiên nghiệm, nó là "tiên nghiệm" theo nghĩa rằng nó không quan tâm đến bất kỳ thông tin nào về B.
  • Xác suất xảy ra B của riêng nó, không quan tâm đến A. Ký hiệu là P(B) và đọc là "xác suất của B". Đại lượng này còn gọi là hằng số chuẩn hóa (normalising constant), vì nó luôn giống nhau, không phụ thuộc vào sự kiện A đang muốn biết.
  • Xác suất xảy ra B khi biết A xảy ra. Ký hiệu là P(B|A) và đọc là "xác suất của B nếu có A". Đại lượng này gọi là khả năng (likelihood) xảy ra B khi biết A đã xảy ra. Chú ý không nhầm lẫn giữa khả năng xảy ra B khi biết A và xác suất xảy ra A khi biết B.

Khi biết ba đại lượng này, xác suất của A khi biết B cho bởi công thức: :P(A|B) = \frac{P(B | A) P(A)}{P(B)} = \frac{likelihood * prior}{normalizing_constant}

Từ đó dẫn tới

:P(A|B) P(B) = P(A \cap B) = P(B|A) P(A)\,

Các dạng khác của định lý Bayes

Định lý Bayes thường cũng thường được viết dưới dạng

:P(B) = P(A, B) + P(A^C, B) = P(B|A) P(A) + P(B|A^C) P(A^C)\,

hay

:P(A|B) = \frac{P(B | A) P(A)}{P(B|A)P(A) + P(B|A^C)P(A^C)}\,,

trong đó AC là biến cố bù của biến cố A (thường được gọi là "không A"). Tổng quát hơn, với {Ai} tạo thành một phân hoạch của không gian các biến cố,

:P(A_i|B) = \frac{P(B | A_i) P(A_i)}{\sum_j P(B|A_j)P(A_j)}\,,

với mọi Ai trong phân hoạch.

Công thức này còn được biết dưới tên công thức xác suất đầy đủ.

Định lý Bayes với hàm mật độ xác suất

Cũng có một dạng của định lý Bayes cho các phân bố liên tục. Đối với chúng, thay cho các xác suất trong định lý Bayes ta dùng hàm mật độ xác suất. Như vậy ta có các công thức tương tự định nghĩa xác suất điều kiện:

: f(x|y) = \frac{f(y|x)\,f(x)}{f(y)}

và công thức tương tự công thức xác suất đầy đủ:

: f(x|y) = \frac{f(y|x)\,f(x)}{\int_{-\infty}^{\infty} f(y|x')\,f(x')\,dx'}.

Ý nghĩa của các thành phần trong các công thức trên là f(x, y) là mật độ phân phối của phân phối đồng thời của các biến ngẫu nhiên XY, f(x|y) là mật độ phân phối xác suất hậu nghiệm của X với điều kiện Y=y, f(y|x) = L(x|y) là (một hàm của x) hàm khả năng của X với điều kiện Y=y, và f(x) và f(y) là các mật độ phân phối của XY tách biệt nhau, với f(x) là mật độ phân phối tiền nghiệm của X.

Điều kiện mặc định trong các công thức là hàm f khả vi và các tích phân công thức tồn tại.

Ứng dụng của định lý Bayes thường dựa trên một giả thiết có tính triết học Bayesian probability ngầm định rằng độ bất định và kỳ vọng có thể tính toán được giống như là xác suất. Định lý Bayes được đặt theo tên của Reverend Thomas Bayes (1702—1761), người nghiên cứu cách tính một phân bố với tham số là một phân bố nhị phân. Người bạn của ông, Richard Price, chỉnh sửa và giới thiệu công trình năm 1763, sau khi Bayes mất, với tựa đề An Essay towards solving a Problem in the Doctrine of Chances. Pierre-Simon Laplace mở rộng kết quả trong bài luận năm 1774.

👁️ 0 | 🔗 | 💖 | ✨ | 🌍 | ⌚
nhỏ|Định lý Bayes được viết lên bằng đèn neon xanh tại văn phòng của Autonomy ở Cambridge. **Định lý Bayes** (Tiếng Anh: _Bayes theorem_) là một kết quả của lý thuyết xác suất. Nó phản
thumb | 220x124px | right | Suy luận Bayes dựa trên các [[xác suất có điều kiện liên quan đến các bằng chứng E được đưa ra nhằm kiểm định và cập nhật xác suất
**Mạng Bayes** (tiếng Anh: _Bayesian network_ hoặc _Bayesian belief network_ hoặc _belief network_) là một mô hình xác suất dạng đồ thị. Mạng Bayes là cách biểu diễn đồ thị của sự phụ thuộc thống
**Thomas Bayes** (1701-1761) là nhà thống kê học, nhà triết học người Anh.Bayes cũng là người đứng đấu các tín đồ giáo hội trưởng lão. Ông là người đặt nền móng cho thống kê Bayes.
**Lý thuyết thông tin thuật toán** là một lĩnh vực của lý thuyết thông tin và khoa học máy tính liên quan đến mối quan hệ giữa tính toán và thông tin. Theo Gregory Chaitin,
Trong lý thuyết trò chơi, **chiến lược **của người chơi là bất kì lựa chọn nào mà người chơi có thể thực hiện, trong bối cảnh kết quả thu được không chỉ phụ thuộc vào
Trong lý thuyết trò chơi, **trò chơi Bayes** là trò chơi mà thông tin về đặc điểm của những người chơi còn thiếu (ví dụ, không biết về thu hoạch của đối phương). Theo phương
Trong lý thuyết trò chơi, **cách giải** được định nghĩa là một nguyên tắc chính thống, dùng để dự đoán trò chơi sẽ diễn ra như thế nào. Những dự đoán này được gọi là
Trong lý thuyết ước lượng và lý thuyết quyết định, một công cụ **ước lượng Bayes** là một phép ước lượng hoặc luật quyết định sao cho nó cực tiểu giá trị kì vọng hậu
_Kẻ bạc gian_ (Le Tricheur), họa phẩm của [[Georges de La Tour, trưng bày tại bảo tàng Louvre, Paris]] **Ngụy biện con bạc**, hay **ngụy biện của tay cá cược**, **ngụy biện Monte Carlo** hoặc
thumb|Người chơi Mastermind sử dụng suy luận giả định để đoán màu sắc bí mật _(trên)_ từ các kết quả sai lệch _(góc dưới bên trái)_ dựa trên các phỏng đoán _(góc dưới bên phải)_.
**Lý thuyết xác suất** là ngành toán học chuyên nghiên cứu xác suất. Các nhà toán học coi xác suất là các số trong khoảng [0,1], được gán tương ứng với một _biến cố_ mà
**Nghịch lý Bertrand** là một bài toán trong diễn giải cổ điển của lý thuyết xác suất, được Joseph Bertrand công bố lần đầu trong công trình của ông _Calcul des probabilités_ (1889), như là
**Xác suất hậu nghiệm** (tiếng Anh: _posterior probability_) của một biến cố ngẫu nhiên hoặc một mệnh đề không chắc chắn là xác suất có điều kiện mà nó nhận được khi một bằng chứng
**Ước lượng hợp lý cực đại** (trong tiếng Anh thường được nhắc đến với tên **MLE**, viết tắt cho **Maximum Likelihood Estimation**) là một phương pháp trong thống kê dùng để ước lượng giá trị
**Dịch máy thống kê** (**SMT**) là một phương pháp dịch máy, trong đó các bản dịch được tạo ra trên cơ sở các mô hình thống kê có các tham số được bắt nguồn từ
Xác suất _P_ của biến cố _E_ nào đó, ký hiệu P(E), được xác định trong một "vũ trụ" hoặc không gian mẫu \Omega gồm mọi biến cố sơ cấp (_elementary event_) sao cho _P_
:_Xác suất biên duyên và Xác suất hợp được định hướng tới bài này._ Bài này định nghĩa một số thuật ngữ về phân bố xác suất của hai biến trở lên. **Xác suất có
[[Tập tin:High accuracy Low precision.svg | nhỏ | Biểu đồ này miêu tả độ chính xác cao và độ chính xác thấp bằng cách suy luận, phân tích dữ liệu.
Chú thích:
_Màu đỏ_: độ chính
Bài này nói về từ điển các chủ đề trong toán học. ## 0-9 * -0 * 0 * 6174 ## A * AES * ARCH * ARMA * Ada Lovelace * Adrien-Marie Legendre *
nhỏ|250x250px|Xác suất của việc tung một số con số bằng cách sử dụng hai con xúc xắc. **Xác suất** (Tiếng Anh: _probability_) là một nhánh của toán học liên quan đến các mô tả bằng
**Arnold Zellner** (2 tháng 1 năm 1927 – 11 tháng 8 năm 2010) là một nhà kinh tế học người Hoa Kỳ và người làm thống kê chuyên trong các lĩnh vực xác suất Bayes
right|thumb|Sơ đồ biểu diễn một quá trình Markov với hai trạng thái E và A. Mỗi số biểu diễn xác suất của quá trình Markov chuyển từ trạng thái này sang trạng thái khác theo
**Minimax** (còn gọi là **minmax**) là một phương pháp trong lý thuyết quyết định có mục đích là tối thiểu hóa (_mini_mize) tổn thất vốn được dự tính có thể là "tối đa" (_max_imize). Có
**Bằng chứng khoa học** là bằng chứng hỗ trợ hoặc phản bác một lý thuyết hoặc giả thuyết khoa học. Những bằng chứng này được kỳ vọng là bằng chứng thực nghiệm và có thể
Trong học máy, một bộ **phân loại xác suất** là một bộ phân loại có khả năng dự đoán, dựa trên việc quan sát một đầu vào, một **phân phối xác suất** trên tập hợp
Trong khoa học máy tính, đặc biệt là trong biểu diễn tri thức và siêu logic học, lĩnh vực **suy luận tự động** (automated reasoning) được dành riêng cho việc hiểu các khía cạnh khác
**Logic mờ** (tiếng Anh: _Fuzzy logic_) được phát triển từ lý thuyết tập mờ để thực hiện lập luận một cách xấp xỉ thay vì lập luận chính xác theo logic vị từ cổ điển.
**Kiểm tra Miller-Rabin** là một thuật toán xác suất để kiểm tra tính nguyên tố cũng như các thuật toán kiểm tra tính nguyên tố: Kiểm tra Fermat và Kiểm tra Solovay-Strassen. Nó được đề
**Xích Markov Monte Carlo** (tiếng Anh: _Markov chain Monte Carlo_, viết tắt _MCMC_) là một thuật toán để lấy mẫu từ phân phối xác suất. Bằng cách xây dựng một chuỗi Markov có phân phối
right|thumb|200x200px|Biểu diễn "Trò chơi ra tín hiệu" theo dạng mở rộng **Trò chơi ra tín hiệu **là trò chơi Bayes dạng động (người chơi có thể nói dối, thực hiện hành vi khác với bản
**Phân tích hồi quy** là một phân tích thống kê để xác định xem các biến độc lập (biến thuyết minh) quy định các biến phụ thuộc (biến được thuyết minh) như thế nào. ##
**Mô hình túi từ (bag-of-words)** là một biểu diễn đơn giản hóa được sử dụng trong xử lý ngôn ngữ tự nhiên và truy vấn thông tin (IR). Trong mô hình này, một văn bản
Một **mô hình xác suất đồ thị** là một mô hình xác suất sử dụng đồ thị để biểu diễn phụ thuộc có điều kiện giữa các biến ngẫu nhiên một cách trực quan. Mô
**Phạm Gia Thụ** là một nhà toán học thống kê người Việt. Ông là giáo sư emeritus tại Đại học Moncton, Canada. Ông được biết đến với nhiều đóng góp cho ngành Thống kê Toán
**Điều khiển thông minh** là một lớp các kỹ thuật điều khiển sử dụng các phương pháp tính toán trí tuệ nhân tạo khác nhau như mạng nơ-ron nhân tạo (neural networks), xác suất Bayes,
**Tâm trí** là tập hợp các lĩnh vực bao gồm các khía cạnh nhận thức như ý thức, trí tưởng tượng, nhận thức, suy nghĩ, trí thông minh, khả năng phán quyết, ngôn ngữ và
**Alan Mathison Turing** OBE FRS (23 tháng 6 năm 1912 – 7 tháng 6 năm 1954) là một nhà toán học, logic học và mật mã học người Anh, được xem là một trong những
nhỏ|372x372px|Cơ chế nạp xả thông tin và giá trị mindsponge trong bài nghiên cứu khởi điểm ) và triển khai xuất bản cùng với giáo sư Nancy K. Napier của Đại học bang Boise (Boise
Một **tham số** là một đối số của một hàm toán học. ## Các loại tham số ### Toán học Trong toán học, sự khác nhau giữa một "tham số" (_parameter_) và một "đối số"
**Đồng hóa số liệu** là một trong những kỹ thuật phân tích của phương pháp dự báo số trong đó thông tin quan trắc được tích lũy vào trạng thái của mô hình vốn được
**Phân loại nhị phân** (tiếng Anh: _Binary classification_) là nhiệm vụ phận loại các phần tử của một tập hợp các đối tượng ra thành 2 nhóm dựa trên cơ sở là chúng có một
**Ngữ hệ Altai** (**Altaic** /ælˈteɪ.ɪk/, được đặt theo tên của dãy núi Altai ở trung tâm châu Á; có khi còn được gọi là **Transeurasian**, tức là **hệ Liên Á-Âu**) là một _Sprachbund_ (tức một
Trong **thị giác máy tính**, **mô hình túi từ** (**bag-of-words model,** mô hình BoW) có thể được áp dụng để phân loại hình ảnh, bằng cách coi các đặc trưng của hình ảnh như từ
## Học có giám sát * AODE * Mạng nơ-ron nhân tạo ** Truyền ngược ** Autoencoders ** Hopfield networks ** Máy Boltzmann ** Máy Boltzmann hạn chế ** Spiking neural networks * Thống kê
**Thị giác** là khả năng nhận và diễn giải thông tin từ ánh sáng đi vào mắt. Việc tri giác này còn được gọi là **thị lực**, **sự nhìn**. Những bộ phận khác nhau cấu
**Học máy** hay **máy học** (_machine learning_) là một lĩnh vực của trí tuệ nhân tạo liên quan đến việc nghiên cứu và xây dựng các kĩ thuật cho phép các hệ thống "học" tự
**Học có giám sát** là một kĩ thuật của ngành học máy để xây dựng một hàm (_function_) từ dữ liệu huấn luyện. Dữ liệu huấn luyện bao gồm các cặp gồm đối tượng đầu
**Phân loại bằng thống kê** là một thủ tục thống kê trong đó các thể riêng biệt sẽ được sắp vào từng nhóm dựa trên số lượng thông tin về một hay nhiều tính chất
Trong lý thuyết xác suất và thống kê, **Phân phối Poisson** (Tiếng Anh: _Poisson distribution_) là một phân phối xác suất rời rạc cho biết xác suất xảy ra một số lượng sự kiện trong