✨Lịch sử dịch máy

Lịch sử dịch máy

Dịch máy nói chung bắt đầu từ thập niên 50, mặc dù một số công việc có thể tìm thấy ở thời kỳ trước đó. Thí nghiệm Georgetown-IBM năm 1954 liên quan hoàn toàn đến quá trình dịch máy của hơn 60 câu tiếng Nga sang tiếng Anh. Thí nghiệm là một thành công lớn và mở ra kỷ nguyên với kinh phí ấn tượng cho nghiên cứu dịch máy ở Hoa Kỳ. Các tác giả tuyên bố rằng trong vòng 3 hay 5 năm, dịch máy có thể giải quyết được vấn đề. Ở Liên Xô, một số thí nghiệm tương tự cũng được thực hiện sau đó.

Thời kì sơ khai

Con người đã mong ước dùng máy móc để dịch từ rất lâu. Vào thế kỷ mười bảy, các nhà triết học Leibniz và Descartes đã đề xuất những hệ mã có thể kết nối các ngôn ngữ khác nhau, mặc dù với mục đích nghiên cứu triết học.

Những bằng sáng chế đầu tiên cho "máy dịch tự động" được cấp vào giữa những năm 1930. Một đề xuất, của Georges Artsrouni đơn giản là một từ điển song ngữ tự động sử dụng bìa đục lỗ. Một đề xuất khác, của Peter Troyanskii, bao gồm từ điển song ngữ kết hợp với một phương pháp xử lý các vai trò ngữ pháp của các ngôn ngữ, dựa trên tiếng Esperanto.

Những năm đầu tiên

Sang kỷ nguyên máy tính, dịch máy trở thành một lĩnh vực được đầu tư lớn và nghiên cứu sôi nổi. Những đề xuất đầu tiên của chương trình dịch tự động bằng máy tính được đưa ra bởi Warren Weaver vào tháng 7 năm 1949. Những đề xuất ban đầu này dựa trên lý thuyết thông tin và các phán đoán về nguyên lý cơ bản của mọi ngôn ngữ tự nhiên.

Một vài năm sau những đề xuất này, các nghiên cứu nghiêm chỉnh bắt đầu ở nhiều trường đại học trong nước Mỹ. Ngày 7 tháng 1 năm 1954, thử nghiệm Georgetown-IBM, lần trình diễn công khai đầu tiên của một hệ thống dịch máy, được tổ chức ở văn phòng của IBM ở New York. Thử nghiệm đã được giới truyền thông đón nhận và thu hút nhiều sự quan tâm của công chúng. Mặc dù còn rất đơn giản, nó động viên khuyến khích những dự cảm tốt đẹp về dịch máy và kích thích dòng tiền đổ vào nghiên cứu, không chỉ trong nước Mỹ mà trên toàn thế giới. Kết quả là trong những năm 1950 và 1960, nhiều hệ thống đã được cài đặt và hoạt động.

Những năm 1960, bản báo cáo ALPAC và những năm 70

Một đòn giáng mạnh vào các nghiên cứu dịch máy dịch máy trong năm 1966 là bản báo cáo ALPAC. Bản báo cáo được chính quyền Hoa Kỳ ủy nhiệm cho ALPAC (Automatic Language Processing Advisory Committee - Hội đồng tư vấn về xử lý ngôn ngữ tự động) thực hiện. Nó kết luận rằng máy dịch tốn kém hơn, không chính xác và chậm hơn con người và mặc dù đắt đỏ, chất lượng bản dịch không có vẻ gì sẽ đạt đến chất lượng của bản dịch của con người trong tương lai gần.

Tuy nhiên bản báo cáo khuyến nghị rằng nên phát triển các công cụ trợ giúp người dịch—ví dụ như từ điển tự động—và một số nghiên cứu về ngôn ngữ học tính toán nên tiếp tục được hỗ trợ.

Sự xuất hiện của bản báo cáo ngay lập tức ảnh hưởng nghiêm trọng đến các nghiên cứu về dịch máy trong Hoa Kỳ và ít hơn đối với Liên Xô và Anh Quốc. Ở Mỹ, các nghiên cứu hầu như hoàn toàn bị bỏ rơi trong một thập kỷ. Tuy nhiên ở Canada, Pháp và Đức, nghiên cứu vẫn tiếp diễn. Trong những năm 1970, một số hệ thống dịch máy đáng chú ý đã ra đời và đi vào hoạt động như Systran, Logos và METEO.

Trong khi các nghiên cứu trong những năm 1960 tập trung vào các cặp ngôn ngữ và đầu vào giới hạn thì trong những năm 1970 là các hệ thống giá rẻ có thể dịch một số tài liệu kỹ thuật và thương mại.

Những năm 1980 và đầu 1990

Sang đến thập niên 80 và đầu 90 của thế kỷ trước, cùng với sự phát triển mạnh mẽ của máy tính lớn và sau đó là vi tính, các hệ thống dịch máy ngày càng phát triển đa dạng. Các nghiên cứu được diễn ra ở nhiều nước khắp nơi trên thế giới, đặc biệt là Nhật Bản với dự án máy tính thế hệ thứ năm.

Nghiên cứu trong những năm 1980 thường dựa vào dạng biểu diễn ngôn ngữ trung gian đa dạng bao gồm hình thái, ngữ pháp và ngữ nghĩa. Cuối thập kỷ này, một làn sóng các phương pháp mới đã nổi lên. Một hệ thống được phát triển ở IBM dựa trên các phương pháp thống kê. Makoto Nagao và nhóm của ông sử dụng lượng lớn các bản dịch ví dụ, phương pháp này hiện nay được gọi là dịch dựa trên ví dụ. Đặc điểm chung của cả hai cách tiếp cận là sự thiếu vắng các luật ngữ pháp và ngữ nghĩa mà thay vào đó là việc xử lý những bộ ngữ liệu lớn.

Cũng trong thời gian này, được khích lệ bởi những thành công trong nhận dạng và tổng hợp tiếng nói, các nghiên cứu bắt đầu thâm nhập lãnh địa dịch tiếng nói với dự án Verbmobil của Đức.

Hiện nay

Lĩnh vực dịch máy đã chứng kiến những thay đổi căn bản trong vài năm lại đây. Hiện nay một lượng lớn nghiên cứu được tiến hành về dịch máy thống kê và dịch máy dựa trên ví dụ. Trong lĩnh vực dịch tiếng nói, các nghiên cứu tập trung vào việc chuyển từ các hệ thống giới hạn lĩnh vực sang không giới hạn lĩnh vực. Trong các dự án nghiên cứu khác nhau của châu Âu (như TC-Star) và Hoa Kỳ (như STR-DUST và U.S.-DARPA-GALE), các giải pháp dịch tự động các bài phát biểu trước quốc hội và bản tin đã được phát triển. Trong những tình huống này, nội dung không còn bị giới hạn trong bất cứ lĩnh vực cụ thể nào nữa mà các bài phát biểu bao trùm những chủ đề đa dạng. Mới đây, dự án kết hợp Pháp-Đức Quaero khảo sát khả năng sử dụng dịch máy cho một mạng internet đa ngôn ngữ. Dự án mong muốn dịch không chỉ các trang mạng mà còn cả các tệp phim, âm thanh có trên mạng internet.

Ngày nay, chỉ một vài công ty sử dụng hệ dịch máy thống kê thương mại, ví dụ như Asia Online, SDL international / Language Weaver (bán các sản phẩm và dịch vụ dịch thuật), Google (sử dụng hệ thống dịch máy độc quyền cho một số sự kết hợp ngôn ngữ trong Google's language tools), Microsoft (sử dụng hệ dịch máy thống kê độc quyền để dịch các bài viết cơ sở tri thức) và Ta with you (cung cấp giải pháp dịch máy thích ứng với phạm vi sử dụng với một số tri thức về ngôn ngữ). Người ta đang quan tâm trở lại đến sự lai hóa khi các nhà nghiên cứu kết hợp tri thức ngữ pháp và hình thái học (nghĩa là tri thức ngôn ngữ) với các hệ thống thống kê cũng như kết hợp thống kê với các hệ thống dựa trên luật hiện có.

👁️ 2 | 🔗 | 💖 | ✨ | 🌍 | ⌚
Dịch máy nói chung bắt đầu từ thập niên 50, mặc dù một số công việc có thể tìm thấy ở thời kỳ trước đó. Thí nghiệm Georgetown-IBM năm 1954 liên quan hoàn toàn đến
[[Phần cứng|Phần cứng máy tính là nền tảng cho xử lý thông tin (sơ đồ khối). ]] **Lịch sử phần cứng máy tính** bao quát lịch sử của phần cứng máy tính, kiến trúc của
_Cuốn [[The Compendious Book on Calculation by Completion and Balancing_]] Từ _toán học_ có nghĩa là "khoa học, tri thức hoặc học tập". Ngày nay, thuật ngữ "toán học" chỉ một bộ phận cụ thể
Quân kỳ của Quân đội Đức quốc xã**Lịch sử quân sự Đức trong Chiến tranh thế giới thứ hai** bắt đầu từ quân số 100.000 do Hòa ước Versailles hạn chế, không được quyền có
Đặc trưng giai đoạn này của Liên xô là sự lãnh đạo của **Joseph Stalin**, người đang tìm cách tái định hình xã hội Xô viết với nền kinh tế kế hoạch nhiều tham vọng,
Các hệ điều hành máy tính cung cấp một tập chức năng cần thiết và được dùng ở hầu hết các chương trình trên máy tính, và các liên kết cần để kiểm soát và
thumb|right|348x348px|Bìa của bài thơ có chủ đề tiến hóa của [[Erasmus Darwin, _Temple of Nature_ cho thấy một nữ thần vén bức màn bí ẩn của thiên nhiên (bên trong là Artemis). Tượng trưng và
Phần mềm là các lệnh được lập trình mà được lưu trữ trong bộ nhớ được lưu trữ của các máy tính kỹ thuật số để bộ xử lý thực hiện. Phần mềm là một
**Lịch sử của Linux** bắt đầu vào năm 1991 với sự bắt đầu của một dự án cá nhân của sinh viên Phần Lan Linus Torvalds để tạo ra một hạt nhân hệ điều hành
Lịch sử của nước Nga, bắt đầu từ việc người Slav phương Đông tái định cư ở Đồng bằng Đông Âu vào thế kỷ thứ 6-7, những người sau đó được chia thành người Nga,
Bài **Lịch sử Israel** này viết về lịch sử quốc gia Israel hiện đại, từ khi được tuyên bố thành lập năm 1948 cho tới tới hiện tại. Nền độc lập của Nhà nước Israel
**Mật mã học** là một ngành có lịch sử từ hàng nghìn năm nay. Trong phần lớn thời gian phát triển của mình (ngoại trừ vài thập kỷ trở lại đây), **lịch sử mật mã
**Lịch sử Bỉ** có từ trước khi thành lập nước Bỉ hiện đại năm 1830. Lịch sử Bỉ đan xen với lịch sử các nước láng giềng là Hà Lan, Đức, Pháp và Luxembourg. Trong
**Lịch sử Ấn Độ độc lập** bắt đầu khi Ấn Độ trở thành quốc gia độc lập trong Khối Thịnh vượng chung Anh vào ngày 15 tháng 8 năm 1947. Kể từ năm 1858, người
**Lịch sử Hoa Kỳ**, như được giảng dạy tại các trường học và các đại học Mỹ, thông thường được bắt đầu với chuyến đi thám hiểm đến châu Mỹ của Cristoforo Colombo năm 1492
Đây là bài con của **Trí tuệ nhân tạo**, nội dung chú trọng vào sự phát triển và **lịch sử ngành trí tuệ nhân tạo**. ## Sự phát triển của lý thuyết trí tuệ nhân
**Lịch sử thế giới** (còn gọi là **lịch sử loài người** và **lịch sử nhân loại**) là ghi chép về hành trình phát triển của nhân loại từ thời tiền sử cho đến hiện tại.
Ngày 30 tháng 6 năm 1989, Quốc hội ra Nghị quyết chia tỉnh Phú Khánh thành hai tỉnh Phú Yên và Khánh Hòa. ## Thời tiền sử và Vương quốc Chăm Pa trái|nhỏ|Tháp Po Nagar,
phải|Biên lai bia Alulu – một biên lai chứng nhận việc mua bia "tốt nhất" vào năm 2050 TCN từ thành phố cổ [[Ur của người Sumer, Iraq cổ đại.]] **Bia** là một trong những
Phi cơ [[B-17 Flying Fortress đang bay trên bầu trời châu Âu]] Các giới chức quân sự quan trọng của Mỹ tại châu Âu năm 1945 **Lịch sử quân sự Hoa Kỳ trong Chiến tranh
nhỏ|Lính Úc dùng súng máy tại trận địa gần [[Wewak tháng 6 năm 1945]] Sau khi Đức Quốc xã xâm lăng Ba Lan, chính phủ Úc tuyên chiến với Đức ngày 3 tháng 9 năm
**Câu lạc bộ bóng đá Manchester United** không có được những thành công lớn như vậy cho đến thập niên 1990 và những năm đầu 2000, khi Sir Alex Ferguson dẫn dắt đội đoạt 8
**Câu lạc bộ bóng đá Manchester United** có một lịch sử gắn liền với ngành đường sắt nước Anh, được ra đời từ một đội bóng thuộc ngành đường sắt với tên gọi ban đầu
**Lịch sử Ba Lan giữa hai cuộc Thế chiến** bao gồm giai đoạn từ tái lập quốc gia độc lập Ba Lan năm 1918, tới Cuộc xâm lược Ba Lan từ phía tây bởi Đức
phải|Giấy chứng nhận thay đổi tên thành Liverpool F.C. Lịch sử của Câu lạc bộ Bóng đá Liverpool từ 1892 tới 1959 đề cập tới thời kỳ bắt đầu từ lúc câu lạc bộ thành
_[[Nhà thiên văn học (Vermeer)|Nhà thiên văn_, họa phẩm của Johannes Vermeer, hiện vật bảo tàng Louvre, Paris]] **Thiên văn học** là một trong những môn khoa học ra đời sớm nhất trong lịch sử
**Lịch sử châu Âu** mô tả những sự kiện của con người đã diễn ra trên lục địa châu Âu. Từ thời tiền sử tới thời hiện đại. Châu Âu có một lịch sử dài,
Với sự giải tán Liên bang Xô viết ngày 25 tháng 12 năm 1991, Liên bang Nga trở thành một quốc gia độc lập. Nga là nước cộng hòa lớn nhất trong số 15 nước
**Lịch sử tư tưởng kinh tế** là lịch sử của các nhà tư tưởng và học thuyết kinh tế chính trị và kinh tế học từ thời cổ đại đến ngày nay. Lịch sử tư
Bằng chứng về sự hiện diện của con người ở các vùng cao nguyên phía bắc và trung tâm bán đảo Đông Dương đã tạo nên lãnh thổ của dân tộc Lào hiện đại từ
Lịch sử của quốc gia Liban. ### Lịch sử Liban từ buổi đầu tới khi độc lập năm 1943 Liban là quê hương của người Phoenicia, một dân tộc đã di cư tới đây bằng
**Lịch sử Hải quân Nhật Bản** bắt đầu với sự tương tác với các quốc gia trên lục địa châu Á thiên niên kỷ 1, đạt đỉnh cao hoạt động hiện đại vào thế kỷ
**Lịch sử của lịch** được xem xét từ những phương pháp có nguồn gốc cổ xưa, khi mà con người tạo ra và sử dụng các phương pháp khác nhau để theo dõi các ngày
Lịch sử văn minh của Bangladesh bắt đầu từ hơn bốn thiên niên kỷ, từ Thời đại đồ đồng đá. Lịch sử được ghi chép lại ban đầu của đất nước thể hiện sự kế
**Lịch sử Iran** hay còn được gọi là **lịch sử Ba Tư**, là lịch sử bao gồm nhiều đế quốc khác nhau trong suốt nhiều thiên niên kỷ qua tại Cao nguyên Iran và các
**Trung Hoa Dân Quốc** () là một chính thể tiếp nối sau triều đình nhà Thanh năm 1912, chấm dứt hơn 2000 năm phong kiến Trung Quốc. Đây là chính thể cộng hòa hiện đại
**Thành phố Đà Lạt** được ghi nhận hình thành từ năm 1893, thời điểm bác sĩ Alexandre Yersin lần đầu tiên đặt chân đến cao nguyên Lâm Viên. Mặc dù vậy, trước thời kỳ này
**Quá trình sụp đổ của Liên Xô** thành các quốc gia độc lập bắt đầu ngay từ năm 1985. Sau nhiều năm xây dựng quân đội Liên Xô và các chi phí phát triển trong
**Lịch sử Quân đội nhân dân Việt Nam** là quá trình hình thành, phát triển của lực lượng Quân đội nhân dân Việt Nam. Nhà nước Việt Nam xem đây là đội quân từ nhân
**Lịch sử Tây Tạng từ năm 1950 đến nay** bắt đầu từ sau trận Qamdo năm 1950. Trước đó, Tây Tạng đã tuyên bố độc lập khỏi Trung Quốc vào năm 1913. Năm 1951, người
nhỏ|400x400px|Một người đàn ông nói chuyện trên điện thoại di động của mình khi đứng gần hộp điện thoại thông thường đang còn trống. Công nghệ kích hoạt cho điện thoại di động được phát
**Lịch sử kinh tế Nhật Bản** được quan tâm nghiên cứu chính là vì sự phát triển kinh tế mạnh mẽ của nước này và bởi vì Nhật Bản là nền kinh tế quốc gia
Giai đoạn từ năm 1431 đến năm 1863 trong lịch sử Campuchia được gọi là **thời kỳ Hậu Angkor** hoặc **thời kỳ Đen Tối, thời kỳ Trung Đại****.** Năm 1431, quân Ayutthaya của người Thái
Những ghi chép đầu tiên về **lịch sử nước Pháp đã** xuất hiện từ thời đại đồ sắt. Ngày nay, nước Pháp chiếm phần lớn khu vực được người La Mã cổ đại gọi là
nhỏ|300x300px| Bản đồ Madagascar (1616) **Lịch sử Madagascar** bắt đầu từ khi con người bắt đầu đặt chân đến Madagascar, một quốc đảo nằm trên Ấn Độ Dương ngoài khơi bờ biển phía đông nam
**Lịch sử New Zealand** truy nguyên từ ít nhất 700 năm trước khi người Polynesia khám phá và định cư tại đây, họ phát triển một văn hóa Maori đặc trưng. Nhà thám hiểm người
nhỏ|300x300px| Sự phát triển của phân vùng hành chính Brasil **Lịch sử của Brasil** bắt đầu với người bản địa ở Brasil. Người châu Âu đến Brasil vào đầu thế kỷ XVI. Người châu Âu
Bài viết này trình bày chi tiết về **lịch sử của Lào kể từ sau năm 1945**. ## Thế chiến 2 Xứ ủy Ai Lao, phân bộ của Đảng Cộng sản Đông Dương được thành
**Lịch sử Việt Nam** nếu tính từ lúc có mặt con người sinh sống thì đã có hàng vạn năm trước Công Nguyên, còn tính từ khi cơ cấu nhà nước được hình thành thì
[[Auguste và Louis Lumière, "cha đẻ" của nền điện ảnh]] **Lịch sử điện ảnh** là quá trình ra đời và phát triển của điện ảnh từ cuối thế kỉ 19 cho đến nay. Sau hơn