✨Thuật toán cực đại hóa kỳ vọng

Thuật toán cực đại hóa kỳ vọng

Thuật toán cực đại hóa kỳ vọng (tiếng Anh hay được gọi là EM viết tắt của Expectation-Maximization) là một kỹ thuật được dùng rộng rãi trong thống kê và học máy để giải bài toán tìm hợp lý cực đại (MLE) hoặc hậu nghiệm cực đại (MAP) của một mô hình xác suất có các biến ẩn. EM sở dĩ được gọi vậy một phần do thuật toán này bao gồm việc thực hiện liên tiếp tại mỗi vòng lặp 2 quá trình (E): tính kỳ vọng của hàm hợp lý của giá trị các ẩn biến dựa theo ước lượng đang có về các tham số của mô hình và (M): ước lượng tham số của mô hình để cực đại hóa giá trị của hàm tính được ở (E). Các giá trị tìm được ở (E) và (M) tại mỗi vòng lặp sẽ được dùng cho việc tính toán ở vòng lặp kế tiếp.

Lịch sử

Năm 1977, ba nhà khoa học máy tính Arthur Dempster, Nan Laird, and Donald Rubin viết một bài báo giới thiệu về thuật toán EM và các tính chất và áp dụng của nó trong bài toán hợp lý cực đại trong trường hợp dữ liệu không đầy đủ (thiếu dữ liệu hoặc có chứa biến ẩn) qua đó phổ biến tên gọi trên. Dù sao, các tác giả có ghi lưu ý rằng ý tưởng trên đã xuất hiện ở một số công trình của nhiều ngành khác nhau từ trước đó.

Giới thiệu

Trong thống kê học, nếu một mô hình xác suất có chứa các biến ẩn hoặc thiếu dữ liệu thì việc tính toán ước lượng của các tham số trở nên khó khăn hoặc không thực hiện được. Thật vậy, thông thường ta cần một trong 2 đại lượng trên (biến ẩn và tham số) để ước lượng giá trị của cái còn lại.

Giải thuật EM cho ta một phương pháp giải quyết bài toán trên một lớp bài toán tương đối rộng. Nguyên lý của nó là tại mỗi bước (E) ta giả thiết rằng tham số đã biết và cố gắng ước lượng giá trị của biến ẩn này và dùng giá trị tìm được này ở bước (M) để tìm giá trị của các tham số. Ta có thể chứng minh được rằng tại mỗi vòng lặp, ta luôn tìm được kết quả tốt hơn của vòng lặp trước đó, vì thế EM luôn hội tụ về giá trị tối ưu (địa phương).

Phát biểu bài toán

Xét một mô hình thống kê bao gồm 1 tập dữ liệu quan sát được \mathbf{X}, 1 tập dữ liệu bị thiếu hoặc ẩn biến \mathbf{Z} và 1 vector tham số \boldsymbol\theta, cùng hàm số hợp lý (likelihood) L(\boldsymbol\theta; \mathbf{X}, \mathbf{Z}) = p(\mathbf{X}, \mathbf{Z}|\boldsymbol\theta) .

Đầu tiên giải thuật EM sẽ gán \boldsymbol\theta với một bộ giá trị khởi điểm. Sau đó, EM sẽ tuần tự thực hiện các vòng lặp bằng cách áp dụng tại mỗi vòng 2 bước sau: Tại vòng lặp thứ t+1, t\geq 0:

  • (E): Tính kỳ vọng của log hàm hợp lý (log-likelihood) của phân phối có điều kiện của \mathbf{Z} cho trước giá trị của \mathbf{X} và ước lượng của \boldsymbol\theta^{(t)} có được ở vòng sát trước: Q(\boldsymbol\theta|\boldsymbol\theta^{(t)}) = \operatorname{E}_{\mathbf{Z}|\mathbf{X},\boldsymbol\theta^{(t)\left[ \log L (\boldsymbol\theta;\mathbf{X},\mathbf{Z}) \right] \ *(M): Ước lượng giá trị tham số để cực đại hoá đại lượng ở (E): \boldsymbol\theta^{(t+1)} = \underset{\boldsymbol\theta}{\operatorname{arg\,max \ Q(\boldsymbol\theta|\boldsymbol\theta^{(t)})

Thuật toán lặp lại (E) và (M) liên tiếp cho đến khi điều kiện dừng được thoả mãn.

Ứng dụng

EM được dùng rộng rãi trong thống kê, học máy, Xử lý ngôn ngữ tự nhiên v.v. Thuật toán K-Means phổ biến trong phân cụm dữ liệu có thể xem là một trường hợp riêng của EM.

👁️ 1 | 🔗 | 💖 | ✨ | 🌍 | ⌚
**Thuật toán cực đại hóa kỳ vọng** (tiếng Anh hay được gọi là **EM** viết tắt của **Expectation-Maximization**) là một kỹ thuật được dùng rộng rãi trong thống kê và học máy để giải bài
right|thumb|upright=1.2|Lính nhảy dù Mỹ thuộc Lữ đoàn dù 173 tuần tra vào tháng 3 năm 1966 **Hoa Kỳ can thiệp quân sự tại Việt Nam** trong giai đoạn 1948–1975 là quá trình diễn biến của
phải|nhỏ|[[Lưu đồ thuật toán (thuật toán Euclid) để tính ước số chung lớn nhất (ưcln) của hai số _a_ và _b_ ở các vị trí có tên A và B. Thuật toán tiến hành bằng
**Chủ nghĩa tự do hiện đại Hoa Kỳ** là phiên bản chủ đạo của chủ nghĩa tự do tại Hoa Kỳ. Nó kết hợp ý tưởng của tự do dân sự (_civil liberty_) và bình
**Lịch sử Hoa Kỳ**, như được giảng dạy tại các trường học và các đại học Mỹ, thông thường được bắt đầu với chuyến đi thám hiểm đến châu Mỹ của Cristoforo Colombo năm 1492
**Công binh Lục quân Hoa Kỳ** (_United States Army Corps of Engineers_ hay viết tắt là **_USACE_**) là một cơ quan liên bang và là một bộ tư lệnh chính yếu của Lục quân Hoa
**Tu chính án thứ 19** (**Tu chính án XIX**) cấm chính phủ liên bang, tiểu bang từ chối quyền bầu cử của công dân Hoa Kỳ theo giới tính. Tuy đề xuất lên Quốc hội
Nội chiến Hoa Kỳ diễn ra ở nhiều nơi trong hai vùng chiến lược chính, Mặt trận miền Đông và Mặt trận miền Tây. Ngoài ra còn có mặt trận vùng sông Mississippi, bờ biển
**Kinh tế Hoa Kỳ** (Mỹ) là một nền kinh tế tư bản chủ nghĩa hỗn hợp với kỹ nghệ, mức độ công nghiệp hóa và trình độ phát triển rất cao. Đây không chỉ là
Sau cuộc bạo loạn tại Điện Capitol Hoa Kỳ 2021, các cuộc điều tra tội phạm, lo ngại về sức khỏe cộng đồng và các tác động chính trị khác nhau đã xảy ra, đáng
**Dịch vụ chăm sóc sức khỏe ở Hoa Kỳ** được cung cấp bởi nhiều tổ chức khác nhau, bao gồm các công ty bảo hiểm, nhà cung cấp dịch vụ chăm sóc sức khỏe, hệ
**Tuyên ngôn độc lập của Hoa Kỳ** là tuyên bố được thông qua bởi cuộc họp của Đệ nhị Quốc hội Lục địa tại Tòa nhà bang Pennsylvania (nay là Independence Hall) ở Philadelphia, Pennsylvania
Nội chiến Hoa Kỳ diễn ra tại nhiều nơi trong hai vùng chiến lược chính, Mặt trận miền Tây và Mặt trận miền Đông. Ngoài ra còn có mặt trận vùng sông Mississippi, bờ biển
thumb|[[Tổng thống Hoa Kỳ Donald Trump (trái) và Chủ tịch Trung Quốc Tập Cận Bình (phải) gặp nhau tại Hamburg, Đức tháng 7 năm 2017.]] thumb|Đại sứ quán Hoa Kỳ tại Trung Quốcthumb|Đại sứ quán
Vào ngày 6 tháng 1 năm 2021, một nhóm người ủng hộ cựu Tổng thống Hoa Kỳ Donald Trump đã nỗ lực lật ngược cuộc bầu cử tổng thống 2020 bằng cách tiến vào Washington,
**Thủy quân Lục chiến Hoa Kỳ** (_United States Marine Corps_) là một quân chủng của Quân đội Hoa Kỳ có trách nhiệm phòng vệ vũ trang và tiến công đổ bộ từ phía biển, sử
nhỏ| K Street NW tại đường 19 ở [[Washington, D.C.|Washington DC, địa điểm của nhiều "nhà vận động hành lang đường K" và các tòa văn phòng của nhiều công ty luật. ]] **Vận động
**Chính quyền liên bang Hoa Kỳ** (tiếng Anh: _Federal Government of the United States_) là chính quyền quốc gia của Hoa Kỳ, một nước cộng hoà liên bang gồm 50 tiểu bang, cùng đặc khu
**Mạng Bayes** (tiếng Anh: _Bayesian network_ hoặc _Bayesian belief network_ hoặc _belief network_) là một mô hình xác suất dạng đồ thị. Mạng Bayes là cách biểu diễn đồ thị của sự phụ thuộc thống
Phi cơ [[B-17 Flying Fortress đang bay trên bầu trời châu Âu]] Các giới chức quân sự quan trọng của Mỹ tại châu Âu năm 1945 **Lịch sử quân sự Hoa Kỳ trong Chiến tranh
nhỏ| Để tìm kiếm một mục đã cho trong một danh sách theo thứ tự nhất định, có thể sử dụng cả thuật toán [[Tìm kiếm tuần tự|tìm kiếm nhị phân và tuyến tính (bỏ
trang=7|nhỏ|ODNI đã giải mật đánh giá về "những hoạt động và ý đồ của Nga trong các cuộc bầu cử gần đây của Hoa Kỳ" Chính phủ Nga đã can thiệp vào cuộc bầu cử
**Chiến tranh Hoa Kỳ - Anh Quốc**, hay thường được biết đến với cái tên **Chiến tranh năm 1812**, là một cuộc chiến giữa các lực lượng quân đội Hoa Kỳ và quân đội Đế
Cuộc **bầu cử tổng thống Hoa Kỳ năm 1844** là cuộc bầu cử tổng thống bốn năm một lần thứ 15, được tổ chức từ thứ sáu, ngày 1 tháng 11 đến thứ tư ngày
[[Hồ Saint Mary là hồ lớn thứ hai trong vườn quốc gia, sau Hồ McDonald.]] **Vườn quốc gia Glacier** nằm ở phía Bắc tiểu bang Montana, có biên giới phía Nam với các tỉnh Alberta
Cuộc **bầu cử tổng thống Hoa Kỳ năm 2008** diễn ra vào thứ ba, ngày 4 tháng 11 năm 2008, là cuộc bầu cử tổng thống thứ 56 liên tục bốn năm một lần trong
Việc kiểm phiếu đại cử tri trong một phiên họp chung của Quốc hội Hoa Kỳ vào ngày mùng 6–7 tháng 1 năm 2021 là bước cuối về mặt hình thức để chứng nhận chiến
thumb|upright=1.35|Phiếu bầu Đại cử tri, trong số 538, chia cho mỗi [[Tiểu bang Hoa Kỳ|bang và Đặc khu Columbia cho các cuộc bầu cử tổng thống chuẩn bị được tổ chức vào năm 2024 và
**Tôn giáo tại Hoa Kỳ** đặc trưng bởi sự đa dạng các niềm tin và thực hành tôn giáo. Theo các cuộc thăm dò ý kiến gần đây, 76% tổng số dân Hoa Kỳ nhận
**Quan hệ Hoa Kỳ – Hy Lạp**, là mối quan hệ được xây dựng dựa trên tình hữu nghị giữa hai nước là Hoa Kỳ và Hy Lạp. Do các mối quan hệ lịch sử,
Cuộc **bầu cử tổng thống Hoa Kỳ năm 2024** là cuộc bầu cử tổng thống thứ 60 liên tiếp 4 năm 1 lần, diễn ra vào thứ Ba ngày 5 tháng 11 năm 2024. Liên
**Chiến tranh thương mại giữa Hoa Kỳ và Trung Quốc** (còn được gọi tắt là **Thương chiến Mỹ Trung**) khởi đầu vào ngày vào ngày 22 tháng 3 năm 2018 khi Tổng thống Hoa Kỳ
Cuộc **bầu cử tổng thống Hoa Kỳ năm 1828** là cuộc bầu cử tổng thống bốn năm một lần lần thứ 11. Nó được tổ chức từ ngày 31 tháng 10 đến ngày 2 tháng
**Cơ quan Mật vụ Hoa Kỳ** hay **Sở Mật vụ Hoa Kỳ** (tiếng Anh: _United States Secret Service_, viết tắt: **USSS**) là cơ quan thực thi pháp luật liên bang của Hoa Kỳ và trực
Con dấu của Tổng thống Hoa Kỳ **Tổng thống Hoa Kỳ thăm Việt Nam** là các chuyến thăm của các Tổng thống Hoa Kỳ đến Việt Nam vào những thời điểm, hoàn cảnh khác nhau,
phải|Quân [[Liên bang miền Bắc Hoa Kỳ|Liên bang miền Bắc xung phong]]Trong 4 năm của cuộc Nội chiến Hoa Kỳ quân Liên bang miền Bắc và quân Liên minh miền Nam đánh nhau trong nhiều
**Mạch khuếch đại thuật toán** (tiếng Anh: operational amplifier), thường được gọi tắt là **op-amp** là một mạch khuếch đại "DC-coupled" (tín hiệu đầu vào bao gồm cả tín hiệu BIAS) với hệ số khuếch
Trong tài chính, **phân tích kỹ thuật** là một phương pháp phân tích chứng khoán dự báo hướng của giá cả thông qua việc nghiên cứu các dữ liệu thị trường quá khứ, chủ yếu
Cuộc **bầu cử tổng thống Hoa Kỳ năm 1896** là cuộc bầu cử tổng thống bốn năm một lần lần thứ 28, được tổ chức vào thứ Ba, ngày 3 tháng 11 năm 1896. Cựu
Cuộc **bầu cử tổng thống Hoa Kỳ năm 1876** là cuộc bầu cử tổng thống bốn năm một lần lần thứ 23, được tổ chức vào Thứ Ba, ngày 7 tháng 11 năm 1876, trong
Cuộc **bầu cử tổng thống Hoa Kỳ năm 1868** là cuộc bầu cử tổng thống bốn năm một lần lần thứ 21, được tổ chức vào Thứ Ba, ngày 3 tháng 11 năm 1868. Đây
## Học có giám sát * AODE * Mạng nơ-ron nhân tạo ** Truyền ngược ** Autoencoders ** Hopfield networks ** Máy Boltzmann ** Máy Boltzmann hạn chế ** Spiking neural networks * Thống kê
**Đại học Virginia** (tiếng Anh: _University of Virginia;_ gọi tắt: _U.Va_ hoặc _UVA_) là một trường đại học nghiên cứu công lập tại Charlottesville, Virginia, Hoa Kỳ. Trường được Thomas Jefferson thành lập vào năm
**Chiến tranh cục bộ** là một chiến lược quân sự của Hoa Kỳ trong Chiến tranh Việt Nam (giai đoạn 1965-1968). Nội dung cơ bản của chiến lược này là tận dụng ưu thế hỏa
**_Avengers: Cuộc chiến vô cực_** (tựa gốc tiếng Anh: **_Avengers: Infinity War_**) là một bộ phim điện ảnh đề tài siêu anh hùng của Mỹ năm 2018 dựa trên các nhân vật của Marvel Comics.
thumb|Nước hoa Vintage Atomizer **Nước hoa** hay **dầu thơm** (tiếng Anh: _Perfume_, ) là hỗn hợp của tinh dầu thơm hoặc các hợp chất tạo mùi thơm, chất hãm hương (lưu hương) và dung môi,
_Cuốn [[The Compendious Book on Calculation by Completion and Balancing_]] Từ _toán học_ có nghĩa là "khoa học, tri thức hoặc học tập". Ngày nay, thuật ngữ "toán học" chỉ một bộ phận cụ thể
**Việt Nam hóa chiến tranh** (tiếng Anh: _Vietnamization_) hay **Đông Dương hóa chiến tranh** là chiến lược của Chính phủ Hoa Kỳ dưới thời tổng thống Richard Nixon trong Chiến tranh Việt Nam, được áp
**Trận chiến Đại Tây Dương** được xem là trận chiến kéo dài nhất trong lịch sử Chiến tranh thế giới thứ hai mặc dù có nhiều nhà sử học, nhà nghiên cứu hải quân của
**_Chiến tranh giữa các vì sao: Tập 4 – Niềm hi vọng mới_** (tựa gốc tiếng Anh ban đầu: **_Star Wars_**, sau này được đổi tựa đề là **_Star Wars: Episode IV – A New