Dịch máy bằng nơ-ron (Neural machine translation: NMT) là một cách tiếp cận dịch máy sử dụng mạng nơ-ron nhân tạo lớn để dự đoán chuỗi từ được dịch,bằng cách mô hình hóa toàn bộ các câu văn trong một mạng nơ-ron nhân tạo duy nhất.
Dịch máy nơ-ron sâu là một phần mở rộng của dịch máy bằng nơ-ron. Cả hai đều sử dụng một mạng nơ-ron lớn, sự khác biệt là dịch máy nơ-ron sâu sử dụng nhiều lớp nơ-ron thay vì chỉ một lớp nơ-ron như dịch máy bằng nơ-ron.
Tính chất
Dịch máy bằng nơ-ron yêu cầu bộ nhớ ít hơn so với các mô hình dịch máy thống kê truyền thống (SMT). Hơn nữa, không giống như các hệ thống dịch thuật thông thường, tất cả các phần của mô hình dịch thuật nơ-ron được đào tạo cùng lúc với nhau (từ câu ngôn ngữ này sang câu ngôn ngữ khác) để tối đa hóa hiệu suất dịch thuật.
Lịch sử
Các ứng dụng học tập sâu xuất hiện đầu tiên trong nhận dạng giọng nói vào những năm 1990. Bài báo khoa học đầu tiên về việc sử dụng mạng thần kinh trong dịch máy đã xuất hiện vào năm 2014, và đạt được rất nhiều tiến bộ trong vài năm sau đó. (Large-vocabulary NMT, ứng dụng để chú thích ảnh, Subword-NMT, Multilingual NMT, Multi-Source NMT, Character-dec NMT, Zero-Resource NMT, Google, Fully Character-NMT, Zero-Shot NMT in 2017).Năm 2015, sự xuất hiện đầu tiên của hệ thống NMT trong cuộc thi dịch máy nguồn mở (OpenMT'15). WMT'15 cũng lần đầu tiên có một ứng cử viên NMT; năm tiếp theo, đã có 90% hệ thống NMT trong số những người chiến thắng.
Hoạt động
NMT không sử dụng các cách tiếp cận thống kê dựa trên cụm từ, với các thành phần con được thiết kế riêng biệt. Dịch máy bằng nơ-ron (NMT) không phải là một bước lớn của dịch máy thống kê truyền thống (SMT). Nguyên lý chính của nó là việc sử dụng các biểu diễn vectơ ("nhúng", "biểu diễn không gian liên tục") cho các từ và trạng thái bên trong. Cấu trúc của các mô hình nơ-ron nhìn chung đơn giản hơn các mô hình dựa trên cụm từ. Không có mô hình ngôn ngữ, mô hình dịch thuật và mô hình sắp xếp lại riêng biệt, mà chỉ có một mô hình chuỗi nơ-ron duy nhất dự đoán từng từ một. Tuy nhiên, chuỗi nơ-ron này dựa trên toàn bộ câu nguồn và tạo ra toàn bộ câu kết quả.
Mô hình NMT sử dụng học tập sâu và học đại diện.
Mô hình chuỗi từ đầu tiên thường được tạo ra bằng cách sử dụng mạng nơ-ron hồi quy (RNN). Mạng nơ-ron hồi quy hai chiều, được gọi là bộ mã hóa (encoder), được sử dụng để mã hóa câu nguồn cho RNN thứ hai, được gọi là bộ giải mã (decoder), được sử dụng để dự đoán các từ trong ngôn ngữ đích.
Mạng nơ-ron tích chập (Convolutional Neural Networks: Convnets) về nguyên tắc có phần tốt hơn cho các chuỗi nơ-ron dài liên tục, nhưng ban đầu không được sử dụng do một số điểm yếu, các điểm yếu này đã được bù đắp thành công vào năm 2017 bằng cách sử dụng phương pháp tiếp cận dựa trên "sự chú ý".
Sử dụng
Vào năm 2016, hầu hết các hệ thống MT tốt nhất đã sử dụng mạng nơ-ron. và PROMT hiện sử dụng NMT. Google sử dụng Google Neural Machine dịch (GNMT) để ưu tiên cho các phương pháp thống kê trước đó. Microsoft sử dụng một công nghệ tương tự cho các bản dịch lời nói của mình (bao gồm Microsoft Translator live và Skype Translator). Một hệ thống dịch máy thần kinh nguồn mở, OpenNMT, đã được phát hành bởi nhóm Harvard NLP.
👁️
1 | 🔗 | 💖 | ✨ | 🌍 | ⌚
**Dịch máy bằng nơ-ron** (**Neural machine translation:** NMT) là một cách tiếp cận dịch máy sử dụng mạng nơ-ron nhân tạo lớn để dự đoán chuỗi từ được dịch,bằng cách mô hình hóa toàn bộ
nhỏ|Một máy NCR Personas 75-Series, máy ATM đa chức năng ở Hoa Kỳ nhỏ|213x213px|[[Otto., một máy ATM Phần Lan]] nhỏ|Các máy ATM trong nhà có kích thước nhỏ hơn để thuận tiện cho việc chuyển
**Thẻ ghi nợ** (tiếng Anh: _debit card_, còn gọi là _bank card_ hoặc _check card_) là loại thẻ thanh toán bằng nhựa cung cấp cho chủ thẻ để thanh toán thay cho tiền mặt. Thẻ
thế=Một phi công của Không quân Hoa Kỳ điều khiển một máy bay F-35A Lightning II được giao cho Phi đội Tiêm kích 58, Phi đoàn Tiêm kích 33 vào vị trí để tiếp nhiên
**Học máy** hay **máy học** (_machine learning_) là một lĩnh vực của trí tuệ nhân tạo liên quan đến việc nghiên cứu và xây dựng các kĩ thuật cho phép các hệ thống "học" tự
**Chiến dịch Guadalcanal**, còn gọi là **Trận Guadalcanal**, tên mã của Đồng Minh là **Chiến dịch Watchtower**, diễn ra từ ngày 7 tháng 8 năm 1942 đến ngày 9 tháng 2 năm 1943 trên đảo
thumb|right|[[Hunter Biden năm 2014]] Vào tháng 10 năm 2020, một cuộc tranh cãi nổ ra liên quan đến một chiếc máy tính xách tay được cho là thuộc về Hunter Biden. Chủ một cửa hàng
**Chiến dịch Biên giới Thu đông 1950**, còn gọi là **_Chiến dịch Lê Hồng Phong 2_**, là một chiến dịch trong Chiến tranh Đông Dương do Quân đội nhân dân Việt Nam (được phía Pháp
**Cục Điều tra Liên bang Mỹ** (tên gốc viết tắt là _FBI_) là cơ quan tình báo và an ninh nội địa của Hoa Kỳ và là cơ quan thực thi pháp luật liên bang
Mind Energy là thực phẩm chức năng hỗ trợ tái tạo tế bào não, bổ sung năng lượng thường xuyên cho não, xử lý các triệu trứng suy giảm trí nhớ, đau đầu và mất
Tinh dầu Xá Xị Hon Farm chính hãng | Sarsi Essential Oil 100% Organic 10ml+ Công dụng: Tinh dầu xá xị được chiết xuất từ nhựa cây. Loại dầu này khá được yêu thích trong
**Chiến dịch Bobruysk** là một trong ba chiến dịch mở màn cho các hoạt động tấn công lớn nhất năm 1944 của Quân đội Liên Xô trên chiến trường Byelorussia, diễn ra từ ngày 23
**Sở giao dịch chứng khoán Úc** (ASX) là sở giao dịch chứng khoán sơ cấp của Úc. Nó được tạo thành bởi sự sáp nhập của Sở giao dịch cổ phiếu Úc và Sở giao
**Giải vô địch bóng đá thế giới 2014** (hay **Cúp bóng đá thế giới 2014**, tiếng Anh: _2014 FIFA World Cup,_ tiếng Bồ Đào Nha Brasil: _Copa do Mundo da FIFA Brasil 2014_) là lần
**Chiến dịch Donets** hay **Trận Kharkov lần thứ ba** là một chuỗi những chiến dịch phản công của quân đội Đức quốc xã nhằm vào Hồng quân Liên Xô tại gần khu vực Kharkov trong
**_Người đẹp tóc mây_** () là một bộ phim điện ảnh hoạt hình máy tính 3D thuộc thể loại nhạc kịch và phiêu lưu của Mỹ năm 2010 cốt truyện phim kể về một nàng
**Trận chung kết giải vô địch bóng đá châu Âu 2020** là một trận đấu bóng đá được diễn ra vào ngày 11 tháng 7 năm 2021 trên sân vận động Wembley ở Luân Đôn,
nhỏ|Sơ đồ của một máy Boltzmann hạn chế với ba đơn vị nhìn thấy và bốn đơn vị ẩn (không có đơn vị thiên vị) **Máy Boltzmann hạn chế** (**restricted Boltzmann machine**, hoặc **RBM**) là
**Máy ảnh Game Boy** (Game Boy Camera - GBC), được phát hành với tên tại Nhật Bản, là một phụ kiện của Nintendo dành cho máy chơi trò chơi điện tử cầm tay Game Boy.
**Trí tuệ nhân tạo tạo sinh** hoặc **AI tạo sinh** là một loại hệ thống AI có khả năng tạo ra văn bản, hình ảnh hoặc các phương tiện truyền thông khác dựa trên các
, là một dòng dōjin soft sound novel giết người bí ẩn sản xuất bởi 07th Expansion. Trò chơi được xây dựng trên game engine NScripter và có thể chơi được trên hệ điều hành
**Xa lộ Liên tiểu bang 35** (tiếng Anh: _Interstate 35_ hay viết tắt là **I-35**) là một xa lộ liên tiểu bang bắc-nam tại miền Trung Hoa Kỳ. I-35 kéo dài từ thành phố Laredo
Thương hiệu truyền thông âm nhạc Nhật Bản _BanG Dream!_ có số lượng lớn nhân vật, với dàn nhân vật chính được chia thành chín ban nhạc toàn nữ gồm có năm thành viên. Ban
**Ronald Bilius Weasley** là một nhân vật hư cấu trong bộ truyện _Harry Potter_ của nữ nhà văn J. K. Rowling. Là một trong các nhân vật chính của loạt truyện này, cậu xuất hiện
**Mô-đun chỉ huy và dịch vụ Apollo** (tiếng Anh: **Apollo command and service module**, viết ngắn gọn là **Apollo CSM**) là một trong hai thành phần chính cấu tạo nên tàu vũ trụ Apollo của
**Trí tuệ nhân tạo** (**TTNT**) (tiếng Anh: **_Artificial intelligence_**, viết tắt: **_AI_**) là khả năng của các hệ thống máy tính thực hiện các nhiệm vụ liên quan đến trí thông minh của con người,
MÔ TẢ SẢN PHẨMHOT rần mấy ngày nay. Em Nhàn cũng đem về phục vụ chị em đây. Yêu lắm ý♥️ SERUM NHAU THAI CUỐNG RỐN ROYAL PRICE: #10 gói #30 gói #90 gói (
MÔ TẢ SẢN PHẨMHOT rần mấy ngày nay. Em Nhàn cũng đem về phục vụ chị em đây. Yêu lắm ý♥️ SERUM NHAU THAI CUỐNG RỐN ROYAL PRICE: #10 gói #30 gói #90 gói (
MÔ TẢ SẢN PHẨMHOT rần mấy ngày nay. Em Nhàn cũng đem về phục vụ chị em đây. Yêu lắm ý♥️ SERUM NHAU THAI CUỐNG RỐN ROYAL PRICE: #10 gói #30 gói #90 gói (
MÔ TẢ SẢN PHẨMHOT rần mấy ngày nay. Em Nhàn cũng đem về phục vụ chị em đây. Yêu lắm ý♥️ SERUM NHAU THAI CUỐNG RỐN ROYAL PRICE: #10 gói #30 gói #90 gói (
nhỏ|Tổng hợp giọng nói Trên máy tính, **tổng hợp giọng nói** là việc tạo ra giọng nói của người từ đầu vào là văn bản hay các mã hóa việc phát âm. Hệ thống này
**_Kẻ hủy diệt: Thời đại Genisys_** (tựa gốc tiếng Anh: **_Terminator Genisys_**) là phim điện ảnh hành động khoa học viễn tưởng của Mỹ năm 2015 do Alan Taylor đạo diễn và Laeta Kalogridis cùng
phải|nhỏ|[[Lưu đồ thuật toán (thuật toán Euclid) để tính ước số chung lớn nhất (ưcln) của hai số _a_ và _b_ ở các vị trí có tên A và B. Thuật toán tiến hành bằng
**Chiến dịch tranh cử tổng thống năm 2024 của Donald Trump** là chiến dịch tranh cử tổng thống cho cuộc bầu cử tổng thống Hoa Kỳ 2024 đang diễn ra của cựu tổng thống thứ
**Trí tuệ nhân tạo tổng quát** (**Artificial general intelligence**, hay **AGI**) là một loại trí tuệ nhân tạo (AI) trong lý thuyết, nằm giữa cận dưới và cận trên của năng lực nhận thức con
nhỏ|phải|Trải nghiệm công nghệ thực tế ảo tại Hà Nội, Việt Nam **Thực tế ảo** ( - _VR_) là một trải nghiệm mô phỏng có thể giống hoặc khác hoàn toàn với thế giới thực.
**William Wilberforce** (24 tháng 8 năm 1759 – 29 tháng 7 năm 1833), là một chính khách, nhà hoạt động từ thiện người Anh, người lãnh đạo phong trào bãi bỏ chế độ nô lệ.
**Ronald M. "Ron" Popeil** (; sinh ngày 03 tháng 5 năm 1935) là một nhà phát minh người Mỹ và tiếp thị cá tính, nổi tiếng nhất cho mình tiếp thị phản ứng trực tiếp
QUY ĐỊNH CHUNG CỦA LAZADA LÀ KHÔNG ĐƯỢC XEM HÀNG KHI NHẬNNHƯNG HỖ TRỢ ĐỔI TRẢ SAU KHI NHẬN NẾU SP KHÔNG ĐÚNG NHƯ MÔ TẢ SHOP BẢO ĐẢM 1️⃣ 0️⃣ 0️⃣% ▶️ HÀNG GIỐNG
QUY ĐỊNH CHUNG CỦA LAZADA LÀ KHÔNG ĐƯỢC XEM HÀNG KHI NHẬNNHƯNG HỖ TRỢ ĐỔI TRẢ SAU KHI NHẬN NẾU SP KHÔNG ĐÚNG NHƯ MÔ TẢ SHOP BẢO ĐẢM 1️⃣ 0️⃣ 0️⃣% ▶️ HÀNG GIỐNG
là một phim điện ảnh hoạt hình kỳ ảo của Nhật Bản, do Studio Ghibli thực hiện với kịch bản, sản xuất và đạo diễn bởi Miyazaki Hayao. Truyện phim xoay quanh một nữ phù
**_Q_ -learning** là một thuật toán học tăng cường không mô hình. Mục tiêu của Q-learning là học một chính sách, chính sách cho biết máy sẽ thực hiện hành động nào trong hoàn cảnh
phải|nhỏ|Bản đồ vị trí vịnh Con Lợn. **Sự kiện Vịnh Con Lợn** (còn có tên là **La Batalla de Girón**, hoặc **Playa Girón** ở Cuba) hay **Trận chiến Girón** (đọc là _Hi-rôn_), là một chiến
Đôi chân là trái tim thứ hai của cơ thể giúp điều hòa và bảovệ trạng thái cân bằng của cơ thể. Với cuộc sống bận rộn như hiện nay bắt buộcđôi chân phải vận
Đôi chân là trái tim thứ hai của cơ thể giúp điều hòa và bảovệ trạng thái cân bằng của cơ thể. Với cuộc sống bận rộn như hiện nay bắt buộcđôi chân phải vận
Đôi chân là trái tim thứ hai của cơ thể giúp điều hòa và bảovệ trạng thái cân bằng của cơ thể. Với cuộc sống bận rộn như hiện nay bắt buộcđôi chân phải vận
**Thượng Hải** (chữ Hán: 上海, bính âm: _Shànghǎi_) là thành phố đông dân nhất Trung Quốc, và là thành phố không bao gồm vùng ngoại ô lớn nhất thế giới. Thượng Hải nằm ở bờ
**Mậu dịch Nanban** (tiếng Nhật: 南蛮貿易, _nanban-bōeki_, "Nam Man mậu dịch") hay "thời kỳ thương mại Nanban" (tiếng Nhật: 南蛮貿易時代, _nanban-bōeki-jidai_, "Nam Man mậu dịch thời đại") là một giai đoạn trong lịch sử Nhật
**Chiến dịch Mole Cricket 19** (, _Mivtza Artzav Tsha-Esreh_) là một chiến dịch nhằm dập tắt hệ thống phòng không đối phương do Không quân Israel tiến hành chống các mục tiêu của Syria vào
**Neuralink Corporation** là một công ty công nghệ thần kinh của Mỹ được thành lập bởi Elon Musk và những người khác, phát triển giao diện não–máy tính cấy ghép (BMI). Trụ sở chính của