✨Mô hình Markov ẩn

Mô hình Markov ẩn

Mô hình Markov ẩn (tiếng Anh là Hidden Markov Model - HMM) là mô hình thống kê trong đó hệ thống được mô hình hóa được cho là một quá trình Markov với các tham số không biết trước và nhiệm vụ là xác định các tham số ẩn từ các tham số quan sát được, dựa trên sự thừa nhận này. Các tham số của mô hình được rút ra sau đó có thể sử dụng để thực hiện các phân tích kế tiếp, ví dụ cho các ứng dụng nhận dạng mẫu.

Trong một mô hình Markov điển hình, trạng thái được quan sát trực tiếp bởi người quan sát, và vì vậy các xác suất chuyển tiếp trạng thái là các tham số duy nhất. Mô hình Markov ẩn thêm vào các đầu ra: mỗi trạng thái có xác suất phân bổ trên các biểu hiện đầu ra có thể. Vì vậy, nhìn vào dãy của các biểu hiện được sinh ra bởi HMM không trực tiếp chỉ ra dãy các trạng thái.

Đây là một mô hình toán thống kê có ứng dụng rộng rãi trong Tin sinh học.

Các chuyển tiếp trạng thái trong mô hình Markov ẩn

[[Tập tin:Hmm.png|giữa|Ví dụ mô hình Markov.

  • x — Các trạng thái trong mô hình Markov
  • a — Các xác suất chuyển tiếp
  • b — Các xác suất đầu ra
  • y — Các dữ liệu quan sát]]

Sự tiến hóa của mô hình Markov

Biểu đồ(Markov) trên đây làm nổi bật các chuyển tiếp trạng thái của mô hình Markov ẩn. Nó cũng có ích để biểu diễn rõ ràng sự tiến hóa của mô hình theo thời gian, với các trạng thái tại các thời điểm khác nhau t1t2 được biểu diễn bằng các tham biến khác nhau, x(t1) và x(t2).

center|Sự tiến hóa theo thời gian của mô hình Markov ẩn

Trong biểu đồ này, nó được hiểu rằng thời gian chia cắt ra (x(t), y(t)) mở rộng tới các thời gian trước và sau đó như một sự cần thiết. Thông thường lát cắt sớm nhất là thời gian t=0 hay t=1.

Sử dụng các mô hình Markov

Có ba vấn đề cơ bản để giải quyết bằng HMM: Cung cấp cho mô hình các tham số, tính xác suất của dãy đầu ra cụ thể. Giải bằng thuật toán tiến trước (thuật toán tham lam). Cung cấp cho mô hình các tham số, tìm dãy các trạng thái (ẩn) có khả năng lớn nhất mà có thể sinh ra dãy đầu ra đã cung cấp. Giải bằng thuật toán Viterbi. *Cung cấp dãy đầu ra, tìm tập hợp có khả năng nhất của chuyển tiếp trạng thái và các xác suất đầu ra. Giải bằng thuật toán Baum-Welch.

Ví dụ cụ thể

Ví dụ này được xem xét tỉ mỉ hơn trong trang thuật toán Viterbi

Các ứng dụng

  • Sự nhận biết lời nói hay sự nhận biết ký tự quang học
  • Quy trình ngôn ngữ tự nhiên
  • Tin sinh học và hệ gen học Dự đoán các vùng mang mã (khung đọc mở) trên một trình từ gene. Xác định các họ gene hoặc họ protein liên quan. ** Mô phỏng cấu trúc không gian của protein từ trình tự amino acid.
  • và còn nhiều nữa...
👁️ 0 | 🔗 | 💖 | ✨ | 🌍 | ⌚
**Mô hình Markov ẩn** (tiếng Anh là _Hidden Markov Model_ - **HMM**) là mô hình thống kê trong đó hệ thống được mô hình hóa được cho là một quá trình Markov với các tham
right|thumb|Sơ đồ biểu diễn một quá trình Markov với hai trạng thái E và A. Mỗi số biểu diễn xác suất của quá trình Markov chuyển từ trạng thái này sang trạng thái khác theo
**Xích Markov Monte Carlo** (tiếng Anh: _Markov chain Monte Carlo_, viết tắt _MCMC_) là một thuật toán để lấy mẫu từ phân phối xác suất. Bằng cách xây dựng một chuỗi Markov có phân phối
**Học sâu** (tiếng Anh: **deep learning**, còn gọi là **học cấu trúc sâu**) là một phần trong một nhánh rộng hơn các phương pháp học máy dựa trên mạng thần kinh nhân tạo kết hợp
nhỏ|Tổng hợp giọng nói Trên máy tính, **tổng hợp giọng nói** là việc tạo ra giọng nói của người từ đầu vào là văn bản hay các mã hóa việc phát âm. Hệ thống này
Bài này nói về từ điển các chủ đề trong toán học. ## 0-9 * -0 * 0 * 6174 ## A * AES * ARCH * ARMA * Ada Lovelace * Adrien-Marie Legendre *
**Mạng Bayes** (tiếng Anh: _Bayesian network_ hoặc _Bayesian belief network_ hoặc _belief network_) là một mô hình xác suất dạng đồ thị. Mạng Bayes là cách biểu diễn đồ thị của sự phụ thuộc thống
thumb|Hệ thống giám sát Thụy Sĩ-Châu Âu: nhận dạng khuôn mặt và xe cộ, mẫu mã, màu sắc và biển số xe. Sử dụng tại Đức và Thụy Sĩ để giám sát và ghi lại
**Dịch máy thống kê** (**SMT**) là một phương pháp dịch máy, trong đó các bản dịch được tạo ra trên cơ sở các mô hình thống kê có các tham số được bắt nguồn từ
**Phân loại bằng thống kê** là một thủ tục thống kê trong đó các thể riêng biệt sẽ được sắp vào từng nhóm dựa trên số lượng thông tin về một hay nhiều tính chất
## Học có giám sát * AODE * Mạng nơ-ron nhân tạo ** Truyền ngược ** Autoencoders ** Hopfield networks ** Máy Boltzmann ** Máy Boltzmann hạn chế ** Spiking neural networks * Thống kê
Trong đại số trừu tượng, **_nửa vành_** là một cấu trúc đại số tương tự với vành nhưng không yêu cầu mỗi phần tử phải có nghịch đảo phép cộng. Nửa vành nhiệt đới hiện
**Nhận dạng tiếng nói** là một quá trình nhận dạng mẫu, còn được gọi là **nhận dạng giọng nói tự động** (**ASR**), **nhận dạng giọng nói máy tính** hoặc **chuyển đổi giọng nói thành văn
**Tin sinh học** (_bioinformatics_) là một lĩnh vực khoa học sử dụng các công nghệ của các ngành toán học ứng dụng, tin học, thống kê, khoa học máy tính, trí tuệ nhân tạo, hóa
**Trí tuệ nhân tạo** (**TTNT**) (tiếng Anh: **_Artificial intelligence_**, viết tắt: **_AI_**) là khả năng của các hệ thống máy tính thực hiện các nhiệm vụ liên quan đến trí thông minh của con người,
[[Siêu máy tính song song hàng loạt Blue Gene/P của IBM]] **Tính toán song song** (tiếng Anh: _Parallel computing_), là một hình thức tính toán trong đó nhiều phép tính và tiến trình được thực
thumb|alt=Một biểu đồ minh họa về ví dụ của máy Boltzmann.|Biểu đồ minh họa về một ví dụ của máy Boltzmann. Mỗi cạnh không có hướng đại diện cho sự phụ thuộc. Trong ví dụ
phải|Mỗi phần tử của một ma trận thường được ký hiệu bằng một biến với hai chỉ số ở dưới. Ví dụ, a2,1 biểu diễn phần tử ở hàng thứ hai và cột thứ nhất
**Phân tích hồi quy** là một phân tích thống kê để xác định xem các biến độc lập (biến thuyết minh) quy định các biến phụ thuộc (biến được thuyết minh) như thế nào. ##
nhỏ|300x300px|Mạng lưới điện **Mạng lưới điện thông minh** là mạng lưới được hiện đại hóa để sử dụng hoặc áp dụng kỹ thuật số thông tin và công nghệ truyền thông để thu thập thông
**Quản trị vận hành** là một lĩnh vực quản lý liên quan đến việc thiết kế và kiểm soát quá trình sản xuất và thiết kế lại hoạt động kinh doanh trong sản xuất hàng
Trong tài chính, **định giá** là quá trình ước tính giá trị mà một cái gì đó có. Các thứ thường được định giá là các tài sản hoặc trách nhiệm tài chính. Định giá
**Jacques Fabrice Vallée** (; sinh ngày 24 tháng 9 năm 1939) là một nhà khoa học máy tính, nhà đầu tư mạo hiểm, tác giả, nhà UFO học và nhà thiên văn học hiện đang
**Mạng thần kinh hồi quy** (hay còn gọi là **mạng thần kinh/nơ-ron tái phát**, **mạng thần kinh tái phát**, tiếng Anh: **recurrent neural network**, viết tắt **RNN**) là một lớp của mạng thần kinh nhân
**_Q_ -learning** là một thuật toán học tăng cường không mô hình. Mục tiêu của Q-learning là học một chính sách, chính sách cho biết máy sẽ thực hiện hành động nào trong hoàn cảnh
**Ủy ban An ninh Quốc gia** (, ), viết tắt **KGB** (, ; ) còn được gọi là **Ủy ban An ninh Nhà nước**, là lực lượng cảnh sát mật chính, và là cơ quan
**Tatar** (; , ; phiên âm cũ: **Tác-ta** hay **Thát Đát**) là tên gọi chung các bộ lạc hỗn hợp Đột Quyết, Mông Cổ và Thanh Tạng sống rải rác ở miền thảo nguyên Bắc-Trung
**Hristo Stoichkov** (tiếng Bulgaria: Христо Стоичков, sinh 8 tháng 2 năm 1966 tại Plovdiv) là một cựu cầu thủ bóng đá người Bulgaria. Ông là chủ nhân Quả Bóng Vàng năm 1994. ## Sự nghiệp
**Johann Carl Friedrich Gauß** (; ; ; 30 tháng 4 năm 1777 – 23 tháng 2 năm 1855) là một nhà toán học và nhà khoa học người Đức tài năng, người đã có nhiều
**Mikhail Alexandrovich Ulyanov** (; 20 tháng 11 năm 1927 – 26 tháng 3 năm 2007) là diễn viên, đạo diễn, giảng viên nghệ thuật, nhân vật công chúng Liên Xô và Nga. Ông được tặng
**Sukhoi Su-27** (; tên ký hiệu của NATO: **Flanker**) là một máy bay tiêm kích phản lực độc đáo của Liên Xô được thiết kế bởi Phòng thiết kế Sukhoi (SDB) và được sản xuất
Bài viết này là **danh sách các thuật toán** cùng một mô tả ngắn cho mỗi thuật toán. ## Thuật toán tổ hợp ### Thuật toán tổ hợp tổng quát * Thuật toán Brent: tìm
**Trận Smolensk** là một trận đánh lớn trong Chiến tranh Xô-Đức thuộc khuôn khổ chiến dịch Barbarossa năm 1941. Đây là một tổ hợp các trận đánh phòng thủ kết hợp với các hoạt động
**Tupolev Tu-154** () (tên hiệu NATO **Careless**) là một máy bay chở khách ba động cơ phản lực tầm trung của Liên Xô tương tự như chiếc Boeing 727 được thiết kế giữa những năm
**"Phù thủy đêm"** (; , ) là biệt danh mà các binh sĩ Đức Quốc Xã đặt cho các nữ phi công quân sự của **Trung đoàn không quân ném bom đêm 588** (**'), sau
**Jacob David Tamarkin** (, _Yakov Davidovich Tamarkin_; sinh ngày 11 tháng 7 năm 1888 - mất ngày 18 tháng 11 năm 1945) là một nhà toán học người Mỹ gốc Nga được biết đến với