✨Máy Boltzmann hạn chế

Máy Boltzmann hạn chế

nhỏ|Sơ đồ của một máy Boltzmann hạn chế với ba đơn vị nhìn thấy và bốn đơn vị ẩn (không có đơn vị thiên vị)

Máy Boltzmann hạn chế (restricted Boltzmann machine, hoặc RBM) là một loại mô hình tạo sinh ngẫu nhiên của mạng thần kinh nhân tạo, nó có thể học các mẫu xác suất trên các dữ liệu đầu vào mà nó nhận được.

RBM ban đầu được Paul Smolensky giới thiệu với tên Harmonium vào năm 1986. Về sau, nó trở nên phổ biến khi Geoffrey Hinton và nhóm của ông phát triển cách học nhanh hơn cho RBM vào những năm 2000. RBM đã được sử dụng trong nhiều lĩnh vực khác nhau như giảm chiều dữ liệu, phân loại, lọc dữ liệu hợp tác, học đặc trưng, mô hình hóa chủ đề, nghiên cứu miễn dịch học, và thậm chí trong cơ học lượng tử.

RBM có thể được huấn luyện theo cả hai cách có giám sát hoặc không có giám sát, tùy thuộc vào loại nhiệm vụ cần thực hiện.

RBM là một dạng của máy Boltzmann, nhưng có một điểm khác biệt quan trọng: các nơ-ron trong RBM phải sắp xếp thành một mạng lưới hai phía. Điều này có nghĩa là:

  • một cặp nút từ mỗi nhóm trong hai nhóm đơn vị (thường được gọi là các đơn vị "nhìn thấy" và "ẩn" tương ứng) có thể có kết nối đối xứng giữa chúng; và
  • không có kết nối nào giữa các nút trong cùng một nhóm.

Ngược lại, máy Boltzmann không bị hạn chế có thể có các kết nối giữa các đơn vị ẩn. Điều này giúp việc đào tạo hiệu quả hơn bằng các thuật toán so với lớp máy Boltzmann thông thường, đặc biệt là thuật toán phân kỳ đối nghịch dựa trên suy giảm độ dốc.

Máy Boltzmann hạn chế cũng có thể được dùng trong các mạng học sâu. Cụ thể, mạng niềm tin sâu được tạo ra bằng cách "xếp chồng" các RBM, và có thể điều chỉnh lại mạng này bằng suy giảm độ dốc và truyền ngược.

Cấu trúc

Loại RBM chuẩn có các đơn vị ẩn và đơn vị nhìn thấy có giá trị nhị phân (Boolean), với một ma trận trọng số W kích thước m \times n. Mỗi trọng số (w_{i,j}) của ma trận kết nối đơn vị nhìn thấy (đầu vào) v_i và đơn vị ẩn h_j. Ngoài ra, còn có các trọng số bù a_i cho v_ib_j cho h_j. Với các trọng số và bù, năng lượng của một cấu hình (cặp vector Boolean) được định nghĩa như sau:

:E(v,h) = -\sum_i a_i v_i - \sum_j b_j h_j -\sum_i \sum_j vi w{i,j} h_j

hoặc, theo dạng ma trận:

:E(v,h) = -a^{\mathrm{T v - b^{\mathrm{T h -v^{\mathrm{T W h.

Hàm năng lượng này tương tự với của mạng Hopfield. Cũng giống các máy Boltzmann khác, phân phối xác suất đồng thời cho các vector nhìn thấy và ẩn được định nghĩa dựa trên hàm năng lượng:

:P(v,h) = \frac{1}{Z} e^{-E(v,h)}

trong đó Z là một hằng số chuẩn hóa đảm bảo tổng tất cả xác suất là 1. Xác suất biên của một vector nhìn thấy là tổng của P(v,h) trên tất cả các cấu hình của lớp ẩn,

Mô hình đồ thị của RBM tương ứng với phân tích nhân tố.

Thuật toán huấn luyện

Máy Boltzmann hạn chế được huấn luyện để tối đa hóa các xác suất được gán cho một tập huấn luyện V (một ma trận mà mỗi hàng là một vector nhìn thấy v),

:\arg\maxW \prod{v \in V} P(v)

hoặc tương đương, để tối đa hóa logarit kỳ vọng của một mẫu huấn luyện v được chọn ngẫu nhiên từ V: Thuật toán này sử dụng kỹ thuật lấy mẫu Gibbs và nằm trong quy trình suy giảm độ dốc (tương tự như cách truyền ngược hoạt động khi huấn luyện mạng thần kinh tiến thẳng) để tính toán cập nhật trọng số.

Quy trình cơ bản của phân kỳ đối nghịch một bước (CD-1) cho một mẫu đơn lẻ có thể được tóm tắt như sau:

Lấy một mẫu huấn luyện , tính toán xác suất của các đơn vị ẩn và lấy mẫu một vector kích hoạt ẩn từ phân phối xác suất này.

Tính tích ngoài của và , gọi đó là gradient dương.

Từ , lấy mẫu một bản dựng lại của các đơn vị nhìn thấy, sau đó lại lấy mẫu các kích hoạt ẩn từ đó. (Bước lấy mẫu Gibbs)

Tính tích ngoài của và và gọi đó là gradient âm.

Cập nhật ma trận trọng số W bằng cách lấy gradient dương trừ đi gradient âm, nhân với một hệ số học: \Delta W = \epsilon (vh^\mathsf{T} - v'h'^\mathsf{T}).

Cập nhật các trọng số bù và tương tự: \Delta a = \epsilon (v - v'), \Delta b = \epsilon (h - h').

A Practical Guide to Training RBMs (Hướng dẫn Thực hành để Huấn luyện Máy Boltzmann Hạn chế) được viết bởi Hinton có thể được tìm thấy trên trang chủ của ông.

Máy Boltzmann Hạn chế Xếp chồng

  • Sự khác biệt giữa Máy Boltzmann Hạn chế Xếp chồng (Stacked Restricted Boltzmann Machines) và RBM là ở chỗ, trong RBM, các kết nối ngang giữa các nút trong cùng một lớp không được phép, điều này giúp dễ phân tích hơn. Còn Máy Boltzmann Xếp chồng thì kết hợp một mạng ba lớp, trong đó có lớp học tự động (không giám sát) với trọng số đối xứng, và một lớp trên được huấn luyện có giám sát để giúp nhận dạng tốt hơn ba lớp.
  • Máy Boltzmann Xếp chồng được dùng để hiểu ngôn ngữ tự nhiên, tìm kiếm tài liệu, tạo ra hình ảnh và phân loại dữ liệu. Những chức năng này được học qua quá trình học không giám sát (học mà không có sự can thiệp của con người) và/hoặc được tinh chỉnh bằng cách học có giám sát (học với hướng dẫn). Khác với mạng có trọng số đối xứng ở lớp trên, RBM có một lớp hai chiều kết nối không đối xứng. Máy Boltzmann Hạn chế có ba lớp với trọng số không đối xứng và kết hợp hai mạng thành một.
  • Máy Boltzmann Xếp chồng có một số điểm tương đồng với RBM, như các neuron trong Máy Boltzmann Xếp chồng cũng là các neuron nhị phân giống như trong Máy Boltzmann Hạn chế. Cả Máy Boltzmann Hạn chế và RBM đều dựa trên một hàm gọi là hàm xác suất Gibbs: E = -\frac12\sum{i,j}{w{ij}{s_i}{s_j+\sum_i{\theta_i}{s_i}. Quá trình huấn luyện của Máy Boltzmann Hạn chế tương tự như RBM, huấn luyện từng lớp một và dùng một quy trình ba bước để ước lượng trạng thái cân bằng, không dùng cách lan truyền ngược. Máy Boltzmann Hạn chế có thể dùng cả phương pháp giám sát và không giám sát để huấn luyện các RBM khác nhau, nhằm phân loại và nhận dạng. Quá trình huấn luyện sử dụng phân kỳ đối nghịch kết hợp với lấy mẫu Gibbs: Δwij = e*(pij - p'ij).
  • Ưu điểm của Máy Boltzmann Hạn chế là nó có thể thực hiện biến đổi phi tuyến, dễ mở rộng và tạo ra các lớp đặc trưng theo tầng. Tuy nhiên, nhược điểm là nó tính toán phức tạp hơn khi sử dụng các neuron với giá trị là số nguyên hoặc số thực. Nó không tuân theo gradient của bất kỳ hàm nào, vì vậy cần ước lượng phân kỳ đối nghịch với xác suất cực đại để cải thiện.

Văn học

👁️ 1 | 🔗 | 💖 | ✨ | 🌍 | ⌚
nhỏ|Sơ đồ của một máy Boltzmann hạn chế với ba đơn vị nhìn thấy và bốn đơn vị ẩn (không có đơn vị thiên vị) **Máy Boltzmann hạn chế** (**restricted Boltzmann machine**, hoặc **RBM**) là
thumb|alt=Một biểu đồ minh họa về ví dụ của máy Boltzmann.|Biểu đồ minh họa về một ví dụ của máy Boltzmann. Mỗi cạnh không có hướng đại diện cho sự phụ thuộc. Trong ví dụ
## Học có giám sát * AODE * Mạng nơ-ron nhân tạo ** Truyền ngược ** Autoencoders ** Hopfield networks ** Máy Boltzmann ** Máy Boltzmann hạn chế ** Spiking neural networks * Thống kê
thumb|354x354px|Sơ đồ mô hình học đặc trưng trong học máy, được áp dụng cho các nhiệm vụ hạ nguồn, có thể được áp dụng cho dữ liệu thô như hình ảnh hoặc văn bản, hoặc
**Học sâu** (tiếng Anh: **deep learning**, còn gọi là **học cấu trúc sâu**) là một phần trong một nhánh rộng hơn các phương pháp học máy dựa trên mạng thần kinh nhân tạo kết hợp
Trong vật lý, **giới hạn Bekenstein** (đặt tên theo Jacob Bekenstein) là một chặn trên cho entropy , hay thông tin , có thể được chứa trong một vùng không gian hữu hạn với một
## Tác động Nhiều quá trình vật lý liên quan đến nhiệt độ, chẳng hạn như: * Các tính chất vật lý của vật chất bao gồm pha (rắn, lỏng, khí hoặc plasma), tỷ trọng,
nhỏ|phải|Các vật chất ở dạng khí (nguyên tử, phân tử, ion) chuyển động tự do|279x279px**Chất khí** (tiếng Anh: Gas) là tập hợp các nguyên tử hay phân tử hay các hạt nói chung trong đó
[[Siêu máy tính song song hàng loạt Blue Gene/P của IBM]] **Tính toán song song** (tiếng Anh: _Parallel computing_), là một hình thức tính toán trong đó nhiều phép tính và tiến trình được thực
Một hạt nhân nguyên tử ở trạng thái plasma với những tia plasma mở rộng từ [[điện cực bên trong tới lớp thủy tinh cách điện bên ngoài, tạo ra nhiều chùm sáng.]] **Plasma** ()
nhỏ|Bìa quyển _Kimiya-yi sa'ādat_ (bản 1308) của nhà giả thuật Hồi giáo Ba Tư Al-Ghazali được trưng bày tại Bibliothèque nationale de France. **Lịch sử ngành hóa học** có lẽ được hình thành cách đây
nhỏ|Phương trình liên hệ Năng lượng với khối lượng. Trong vật lý, **năng lượng** là đại lượng vật lý mà phải được **chuyển** đến một đối tượng để thực hiện một công trên, hoặc để
**Phương trình Navier-Stokes**, là hệ các phuơng trình đạo hàm riêng miêu tả dòng chảy của các chất lỏng và khí (gọi chung là chất lưu), được đặt theo tên của kỹ sư-nhà vật lý
**Phương pháp làm lạnh Doppler** là một cơ chế được dùng để bẫy và làm lạnh nguyên tử hoặc ion. Phương pháp làm lạnh Doppler là một trong các phương pháp làm lạnh phổ biến
**Mạng Hopfield** là một dạng mạng nơ-ron nhân tạo học định kỳ do John Hopfield sáng chế. Mạng Hopfield đóng vai trò như các hệ thống bộ nhớ có thể đánh địa chỉ nội dung
**Josiah Willard Gibbs** (11 tháng 2 năm 1839 - 28 tháng 4 năm 1903) là một nhà khoa học người Mỹ đã có những đóng góp lý thuyết đáng kể cho vật lý, hóa học
**Photon** hay **quang tử** (, phōs, ánh sáng; tiếng Việt đọc là _phô tông_ hay _phô tôn_) là một loại hạt cơ bản, đồng thời là hạt lượng tử của trường điện từ và ánh
:_Với entropy trong lý thuyết thông tin, xem entropy thông tin. Kết hợp của cả hai, xem Entropy trong nhiệt động học và lý thuyết thông tin. Với các cách dùng khác, xem Entropy (định
**James Clerk Maxwell** (13 tháng 6 năm 1831 – 5 tháng 11 năm 1879) là một nhà toán học, một nhà vật lý học người Scotland. Thành tựu nổi bật nhất của ông đó là thiết
Thuật ngữ **nhiệt động học** (hoặc **nhiệt động lực học**) có hai nghĩa: # Khoa học về nhiệt và các động cơ nhiệt (**nhiệt động học cổ điển**) # Khoa học về các hệ thống
**Sao** (tiếng Anh: _star_), **Ngôi sao**, **Vì sao** hay **Hằng tinh** (chữ Hán: 恒星) là một thiên thể plasma sáng, có khối lượng lớn được giữ bởi lực hấp dẫn. Sao gần Trái Đất nhất
thumb|upright=1.3|Các [[hàm sóng của electron trong một nguyên tử hydro tại các mức năng lượng khác nhau. Cơ học lượng tử không dự đoán chính xác vị trí của một hạt trong không gian, nó
nhỏ|250x250px|Xác suất của việc tung một số con số bằng cách sử dụng hai con xúc xắc. **Xác suất** (Tiếng Anh: _probability_) là một nhánh của toán học liên quan đến các mô tả bằng
**Niên biểu hóa học** liệt kê những công trình, khám phá, ý tưởng, phát minh và thí nghiệm quan trọng đã thay đổi mạnh mẽ vốn hiểu biết của nhân loại về một môn khoa