✨AlphaGo đấu với Lee Sedol

AlphaGo đấu với Lee Sedol

AlphaGo đấu với Lee Sedol, hoặc Trận thách đấu của Google DeepMind (Google DeepMind Challenge Match), là một trận đấu cờ vây gồm 5 ván giữa Lee Sedol - người từng 18 lần vô địch thế giới - và AlphaGo, một phần mềm cờ vây máy tính được phát triển bởi Google DeepMind, được tổ chức tại Seoul, Hàn Quốc, từ ngày 9 đến ngày 15 tháng 3 năm 2016. AlphaGo thắng tất cả trừ ván thứ tư; tất cả các ván đều kết thúc bằng việc nhận thua. Trận đấu này được so sánh với trận đấu cờ vua lịch sử giữa Deep Blue và Garry Kasparov vào năm 1997.

Người thắng trận đấu dự kiến sẽ nhận được số tiền thưởng 1 triệu USD. Từ khi AlphaGo giành chiến thắng, Google DeepMind tuyên bố giải thưởng sẽ được trao tặng cho các tổ chức từ thiện, bao gồm UNICEF và các tổ chức về cờ vây. Lee nhận được 170.000 USD (150.000 dành cho việc tham gia trận đấu năm ván và khoản thưởng 20.000 USD cho một ván thắng).

Sau trận đấu, Hiệp hội cờ vây Hàn Quốc đã phong cho AlphaGo danh hiệu cao nhất của kì thủ cờ vây – một danh hiệu "9 dan danh dự". Danh hiệu này được đưa ra như một sự công nhận những "nỗ lực chân thành" của AlphaGo để đạt tới mức độ bậc thầy trong cờ vây. Trận đấu này được chọn bởi tạp chí Science là một trong những á quân của giải thưởng Đột phá của Năm được công bố vào ngày 22 tháng 12 năm 2016.

Bối cảnh

Thử thách khó khăn với trí tuệ nhân tạo

Cờ vây là một trò chơi phức tạp, với việc đòi hỏi trực giác, sự sáng tạo và tư duy chiến lược. Môn thể thao này từ lâu đã được coi là một thách thức khó khăn trong lĩnh vực trí tuệ nhân tạo (AI), và nó tỏ ra khó khăn để giải quyết hơn một cách đáng kể so với cờ vua. Nhiều chuyên gia trong lĩnh vực trí tuệ nhân tạo cho rằng cờ vây đòi hỏi nhiều yếu tố bắt chước suy nghĩ của con người hơn cờ vua. Nhà toán học I. J. Good viết trong năm 1965:

Trước năm 2015, các chương trình chơi cờ vây tốt nhất chỉ đạt đến mức độ dan nghiệp dư. Trên cỡ bàn nhỏ 9×9, máy tính ở tình trạng tốt hơn, và một vài phần mềm đã giành chiến thắng một phần nhỏ của các ván đấu 9×9 trước các kì thủ chuyên nghiệp. Trước AlphaGo, một số nhà nghiên cứu đã khẳng định rằng máy tính sẽ không bao giờ đánh bại được những người hàng đầu trong cờ vây. Elon Musk, một nhà đầu tư ngay từ ban đầu của Deepmind, đã phát biểu vào năm 2016 rằng những người giỏi nhất trong lĩnh vực này nghĩ rằng AI sẽ phải mất 10 năm nữa mới đạt được một chiến thắng với một kì thủ cờ vây chuyên nghiệp hàng đầu.

Trận đấu giữa AlphaGo và Lee Sedol được so sánh với trận đấu cờ vua năm 1997 giữa Deep Blue đấu với Garry Kasparov. Chiến thắng của máy tính Deep Blue của IBM trước đương kim vô địch Kasparov được xem là điểm nhấn mang tính biểu tượng, nơi mà máy tính trở nên tốt hơn con người trong cờ vua.

AlphaGo là chương trình có sự khác biệt đáng kể nhất so với những nỗ lực AI trước đó ở chỗ nó được áp dụng mạng thần kinh nhân tạo, trong đó phương pháp tự giải quyết vấn đề bằng cách đánh giá, thử nghiệm và rút kinh nghiệm (evaluation heuristics) không bị mã hóa cứng bởi con người, mà thay vào đó là sự tự học ở mức độ lớn bởi bản thân chương trình, thông qua hàng chục triệu ván cờ vây cũng như những ván cờ tự chơi của chính nó. Thậm chí đội ngũ phát triển AlphaGo còn không thể chỉ ra được cách mà AlphaGo đánh giá các vị trí quân cờ và chọn bước đi tiếp theo. Phương pháp duyệt cây Monte Carlo cũng được dùng như phương pháp chính để nâng cao hiệu quả lý luận của chương trình.

Các kết quả nghiên cứu có liên quan đang được áp dụng cho các lĩnh vực như khoa học nhận thức, nhận dạng mẫu và học máy.

Trận đấu với Phiền Huy

thumb|Phiền Huy đấu với AlphaGo – Ván thứ 5 AlphaGo đánh bại nhà vô địch châu Âu Phiền Huy (Fan Hui), một kì thủ chuyên nghiệp 2 dan, với tỉ số 5–0 vào tháng 10 năm 2015, đây là lần đấu tiên một thực thể AI đánh thắng một kì thủ con người chuyên nghiệp trong một ván cờ với cỡ bàn lớn nhất và không sử dụng lợi thế. Một số nhà bình luận nhấn mạnh khoảng cách lớn về thực lực giữa Phiền và Lee, người được xếp hạng 9 dan chuyên nghiệp. Chuyên gia về AI người Canada Jonathan Schaeffer, cho ý kiến ​​sau chiến thắng trước Phiền, so sánh AlphaGo với một "thần đồng" vẫn còn thiếu kinh nghiệm, và cho rằng, "thành tích thực sự sẽ là khi chương trình chơi với một kì thủ trong loạt những người cao cấp thực sự." Ông sau đó tin rằng Lee sẽ chiến thằng trận đấu vào tháng 3 năm 2016.

Sự chuẩn bị

Các chuyên gia cờ vây đã tìm ra những lỗi trong các nước đi của AlphaGo trước Phiền, đặc biệt chú ý đế sự thiếu nhận thức trên toàn bàn cờ, nhưng trước ván đấu mở màn trước Lee, người ta không biết chương trình đã cải thiện các ván đấu được bao nhiêu từ trận đấu vào tháng 10. AlphaGo không được thiết kế để đấu với Lee Sedol, điều khó có thể thực hiện được trong bất kì trường hợp nào, bởi việc huấn luyện AlphaGo cần tới hàng chục triệu ván đấu, và một vài trăm hoặc vài nghìn ván đấu từ một kì thủ cụ thể sẽ không đủ để thay thế lối chơi của AlphaGo. Thay vào đó, việc huấn luyện của AlphaGo được bắt đầu với những ván đấu của những người chơi mạnh thuộc cấp độ nghiệp dư từ các máy chủ cờ vây trên internet, sau những ván mà AlphaGo luyện tập bằng cách tự đấu với chính mình; không có ván cờ nào của Lee Sedol có trong dữ liệu huấn luyện của AlphaGo.

Người chơi

AlphaGo

thumb|Logo của AlphaGo AlphaGo là một chương trình máy tính được phát triển bởi Google DeepMind để có thể chơi môn thể thao cờ vây. Thuật toán của AlphaGo sử dụng một sự kết hợp của các kỹ thuật máy học và duyệt cây, kết hợp với đào tạo mở rộng, cả từ nước đi của con người và máy tính. Hệ thống mạng thần kinh nhân tạo ban đầu được nạp chương trình mồi (bootstrapping) từ sự tinh thông cách chơi trong một ván cờ của con người. AlphaGo ban đầu được huấn luyện bắt chước cách chơi của con người bằng cách cố gắng đi những nước đi giống với những kì thủ xuất sắc trong lịch sử trò chơi được ghi chép lại, sử dụng một cơ sở dữ liệu của KGS Go Server chứa khoảng 30 triệu nước cờ từ 160.000 ván cờ của những người chơi có trình độ từ 6 đến 9 dan KGS. Một khi đã đạt đến một mức độ nhất định về trình độ, nó được tiếp tục đào tạo bằng cách thiết lập để chơi một số lượng lớn các ván cờ đối đầu với các phiên bản khác của bản thân, sử dụng học tăng cường để cải thiện cách chơi của nó. Hệ thống này không sử dụng một "cơ sở dữ liệu" các bước đi để chơi. Như mộtr trong những người sáng tạo nên AlphaGo giải thích:

Phiên bản AlphaGo đấu với Lee sử dụng một số lượng tương tự của sức mạnh tính toán như trong trận đấu với Phiền Huy, trận mà chúng sử dụng tới 1.202 CPU và 176 GPU. Google cũng đã tuyên bố rằng các bộ xử lý tensor (tensor processing unit) độc quyền của nó đã được sử dụng trong trận đấu với Lee Sedol.

Lee Sedol

thumb|Lee Sedol năm 2012 Lee Sedol là một kì thủ cờ vây chuyên nghiệp 9 dan và là một trong những kì thủ mạnh nhất trong lịch sử cờ vây. Anh bắt đầu sự nghiệp vào năm 1996 (thăng cấp bậc dan chuyên nghiệp ở tuổi 12), thắng 18 giải đấu quốc tế kể từ đó. Anh là một "anh hùng dân tộc" tại quê hương Hàn Quốc của mình, được biết đến với lối đánh khác thường và sáng tạo. Lee Sedol ban đầu dự đoán sẽ đánh bại AlphaGo trong một trận đấu "long trời lở đất".

Các ván

Trận đấu được tổ chức theo thể thức đấu 5 ván với giải thưởng lớn là 1 triệu USD,

Trận đấu được tổ chức tại Four Seasons Hotel ở Seoul, Hàn Quốc vào tháng 3 năm 2016 và được quay truyền hình trực tiếp với phần bình luận của Michael Redmond (9-dan chuyên nghiệp) và Chris Garlock. Aja Huang, một thành viên của đội ngũ DeepMind và là một kì thủ cờ vây nghiệp dư 6-dan, phụ trách việc đặt quân cờ bàn cờ vây cho AlphaGo, được chạy thông qua nền tảng điện toán đám mây Google Cloud Platform với máy chủ đặt tại Mỹ.

Tổng kết

Ván thứ nhất

AlphaGo (trắng) thắng ván đầu tiên. Lee giành quyền kiểm soát trong hầu hết ván đấu, nhưng AlphaGo đạt được lợi thế trong 20 phút cuối cùng và Lee chịu thua. David Ormerod, nhận xét về ván đấu trên Go Game Guru, mô tả nước đi thứ bảy của Lee như "một nước lạ để kiểm tra sức mạnh của AlphaGo trong giai đoạn khai cuộc", biểu thị đặc trưng của nước đi này như một lỗi sai và phản ứng của AlphaGo là "chính xác và hiệu quả". Ông mô tả vị trí quân cờ của AlphaGo tỏ ra thuận lợi trong phần đầu của trận đấu, xem xét rằng Lee bắt đầu quay trở lại với nước thứ 81, trước khi thực hiện những nước "có vấn đề" tại nước thứ 119 và 123, tiếp nối với một nước "thua cuộc" ở nước thứ 129. Kì thủ cờ vây chuyên nghiệp Cho Hanseung nhận xét rằng ván đấu của AlphaGo đã được cải thiện đáng kể từ khi nó đánh bại Phiền Huy vào tháng 10 năm 2015.

Theo kì thủ cờ vây kì cựu 9-dan Kim Seong-ryong, Lee dường như bị kinh ngạc bởi nước đi mạnh mẽ của AlphaGo ở nước thứ 102. Sau khi AlphaGo đi nước thứ 102 của ván đấu, Lee đã nghiền ngẫm những lựa chọn của mình trong hơn 10 phút. "ngay từ những nước đầu của ván đấu, tôi đã không cảm thấy có một thời điểm nào mà tôi đang dẫn trước". Một trong những người sáng tạo ra AlphaGo, Demis Hassabis, nói rằng hệ thống đã tự tin vào một chiến thắng từ nửa sau của ván đấu, mặc dù các nhà bình luận chuyên nghiệp không thể cho biết được ai đang dẫn trước.

AlphaGo cho thấy những sự dị thường và các nước đi từ một góc nhìn rộng hơn, mà các kì thủ cờ vây chuyên nghiệp mô tả là trông như nước đi sai lầm ở cái nhìn đầu tiên, nhưng là một chiến lược có chủ định trong nhận thức. Như một trong những người sáng tạo của hệ thống giải thích, AlphaGo không cố gắng tối đa hóa điểm hoặc số đất chiến thắng của mình, nhưng sẽ cố gắng phát huy tối đa khả năng chiến thắng của mình.

Sau ván thứ hai, vẫn còn có những nghi ngờ mạnh mẽ giữa các kì thủ nếu như AlphaGo thật sự là một kì thủ con người mạnh mẽ trong ý nghĩ rằng một con người có thể đạt tới trình độ đó. Ván đấu thứ ba được mô tả là đã loại bỏ hoàn toàn nghi ngờ này; với nhận xét của các nhà phân tích:

Theo An Younggil (8p) và David Ormerod, ván đấu cho thấy rằng "AlphaGo đơn thuần mạnh hơn bất kì người chơi cờ vây là con người nào từng được biết đến." AlphaGo đã cho thấy việc có thể điều hướng các tình huống phức tạp được gọi là mà không xuất hiện trong hai ván đấu trước. An và Ormerod xem xét nước thứ 148 đặc biệt đáng chú ý: ở giữa một cuộc chiến ko phức tạp, AlphaGo biểu thị sự "tự tin" vừa đủ rằng nó đã chiến thắng cuộc chiến để đi một nước lớn ở vị trí khác. AlphaGo đã giành quyền kiểm soát ván đấu bằng nước thứ 48, và buộc Lee vào thế phòng thủ. Lee phản công tại nước thứ 77/79, nhưng phản ứng của AlphaGo tỏ ra hiệu quả và nước thứ 90 của nó đã thành công trong việc đơn giản hóa vị trí này. Sau đó nó đã giành được một vùng chiếm đóng rộng lớn ở phía dưới bàn cờ, củng cố vị thế của mình với những nước từ 102 tới 112, được mô tả bởi An bẳng cụm từ "phức tạp". David Ormerod mô tả đặc trưng của các nước đi từ 87 tới 101 như điển hình của những lỗi của các phần mềm dựa trên Monte Carlo. Bằng cách này, mục đích rõ ràng của anh là để buộc ván đấu bước vào một dạng tình huống "được ăn cả ngã về không" đặc trưng — một điểm yếu khả thi đối với một đối thủ mạnh ở các cách chơi đổi quân, và một trong số đó có thể khiến năng lực quyết định lợi thế ít ỏi của AlphaGo không thích hợp nếu xét trên tổng thể. Phản ứng ban đầu của AlphaGo ở các nước thứ 83 tới 85 là thích hợp, nhưng tình hình sau đó khiêu khích AlphaGo thực hiện các nước đi rất tệ để đáp trả từ nước thứ 87 tới 101. Lee vượt lên dẫn trước với nước thứ 92, và An Younggil mô tả nước thứ 105 của quân đen như nước thua cuộc cuối cùng. Mặc dù có chiến thuật tốt trong quá trình thực hiện các nước đi từ 131 tới 141, AlphaGo cho thấy việc không thể cứu vãn trong thu quan và chịu thua. Vì lý do này, anh yêu cầu được cầm quân đen trong ván thứ năm, việc được coi là rủi ro hơn.

David Ormerod của Go Game Guru nói rằng mặc dù vẫn chưa có một phân tích nào về cách chơi của AlphaGo trong khoảng nước đi từ 79–87 tại thời điểm đó, ông tin rằng đó là một kết quả của một điểm yếu được biết đến trong các thuật toán chơi cờ sử dụng phương pháp duyệt cây Monte Carlo. Về bản chất, phương pháp tìm kiếm này cố gắng để tỉa các trình tự ít có liên quan. Trong một vài trường hợp, một nước đi có thể dẫn đến một chuỗi các nước đi vô cùng cụ thể đóng vai trò quan trọng, nhưng được bỏ qua khi cây được tỉa, và do đó kết quả này đã "tắt radar tìm kiếm".

Ván thứ năm

AlphaGo (trắng) thắng ván thứ năm.

Lee, cầm quân đen, khai cuộc với một hình cờ tương tự với ván đầu tiên và sau đó bắt đầu khoanh vùng lãnh thổ ở biên phải và góc trên bên trái – một chiến thuật tương tự với chiến thuật mà anh đã sử dụng thành công trong ván thứ tư – trong khi AlphaGo đạt được ảnh hưởng tại trung tâm bàn cờ. Ván đấu tiếp tục kể cả cho đến khi quân trắng thực hiện các nước đi từ 48 tới 58, khi mà AlphaGo chơi ở góc dưới bên phải. Những nước đi này khiến quân trắng thất thế một cách không cần thiết trong các cuộc đấu kiếp và aji, cho phép Lee vươn lên dẫn trước.

Đưa tin

Video trực tiếp của các ván đấu và phần bình luận đồng hành được phát sóng ở Hàn Quốc, Trung Quốc, Nhật Bản và Vương quốc Anh. Phần đưa tin tiếng Hàn được thực hiện sẵn thông qua Baduk TV. Phần đưa tin tiếng Trung của ván thứ nhất với phần bình luận của hai kì thủ 9-dan Cổ Lực và Kha Khiết được cung cấp tương ứng bởi Tencent và LeTV, đạt khoảng 60,000,000 lượt xem. Phần đưa tin trực tuyến tiếng Anh trình bày bởi kì thủ 9-dan người Mỹ Michael Redmond và Chris Garlock, một phó chủ tịch của Hiệp hội cờ vây Hoa Kỳ, đạt trung bình 80,000 lượt xem với số lượng cao nhất là 100,000 lượt xem vào gần cuối ván thứ nhất.

Phản ứng

Cộng đồng nghiên cứu trí tuệ nhân tạo

Chiến thắng của AlphaGo là một cột mốc quan trọng trong nghiên cứu trí tuệ nhân tạo. Cờ vây trước đây đã được coi là một vấn đề khó khăn trong học máy, được dự kiến ​​sẽ vượt ra khỏi tầm với của công nghệ trong thời đại này. Hầu hết các chuyên gia cho rằng một chương trình cờ vây mạnh như AlphaGo phải ít nhất năm năm nữa mới có thể đạt được; một số chuyên gia cho rằng sẽ tốn ít nhất một thập kỷ trước khi máy tính đánh bại các nhà vô địch trong bộ môn cờ vây. Hầu hết các nhà quan sát tại ​​thời điểm bắt đầu trận đấu năm 2016 đã dự đoán một chiến thắng cho Lee trước AlphaGo. Một số nhà bình luận tin rằng chiến thắng của AlphaGo tạo ra một cơ hội tốt cho xã hội để bắt đầu thảo luận về việc chuẩn bị cho các tác động trong tương lai có thể có của máy móc với trí tuệ có mục đích tổng quát. Tháng 3 năm 2016, nhà nghiên cứu trí tuệ nhân tạo Stuart Russell nói rằng "Các phương thức trí tuệ nhân tạo đang tiến triển nhanh hơn mong đợi, (mà) làm cho câu hỏi về kết quả dài hạn trở nên cấp bách hơn," nói thêm rằng "để đảm bảo việc những hệ thống trí tuệ nhân tạo ngày càng mạnh mẽ vẫn hoàn toàn nằm dưới sự kiểm soát của con người... có rất nhiều việc phải làm." Một số học giả, chẳng hạn như nhà vật lý Stephen Hawking, cảnh báo rằng một số trí tuệ nhân tạo tự hoàn thiện được phát triển trong tương lai có thể đạt được trí tuệ tổng quát thực tế, dẫn tới một sự tiếp quản của trí tuệ nhân tạo không mong đợi;<!-- và nói rằng "Tôi không hiểu tại sao chúng ta lại nói về những sự sợ hãi. Ở phía ngược lại, điều này làm tăng hy vọng trong nhiều lĩnh vực như sức khỏe và thăm dò không gian."

Cộng đồng chơi cờ vây

Cờ vây là một trò chơi phổ biến ở Hàn Quốc, Trung Quốc và Nhật Bản, và trận đấu này được theo dõi hoặc phân tích bởi hàng trăm triệu người trên toàn thế giới. nơi mà một máy tính đã lần đầu tiên đánh bại một kì thủ cờ vây chuyên nghiệp kể cả không có lợi thế chấp quân. Khi trận đấu diễn ra, Kha Khiết đi tới đi lui, nói rằng "rất có thể tôi (có thể) thua" sau khi đánh giá ba ván đấu đầu tiên, nhưng lấy lại sự tự tin sau ván đấu thứ tư.

Toby Manning, trọng tài trận đấu của AlphaGo trước Fan Hui, và Hajin Lee, tổng thư ký Liên đoàn cờ vây quốc tế, cả hai đều suy đoán rằng trong tương lai, người chơi cờ vây sẽ nhờ sự giúp sức từ máy tính để học được những gì mà họ đã thực hiện sai trong các ván đấu và cải thiện kĩ năng của họ.

Lee đã xin lỗi vì thất bại của mình, và nói sau ván thứ ba rằng "Tôi đã đánh giá sai khả năng của AlphaGo và cảm thấy bất lực." Lee cho biết sự thua cuộc cuối cùng của anh trước một cỗ máy là "không thể tránh khỏi" nhưng nói rằng "robot sẽ không bao giờ hiểu được vẻ đẹp của ván đấu theo cùng cách mà chúng ta, những con người, có thể hiểu được."

👁️ 4 | 🔗 | 💖 | ✨ | 🌍 | ⌚
**AlphaGo đấu với Lee Sedol**, hoặc **Trận thách đấu của Google DeepMind** (_Google DeepMind Challenge Match_), là một trận đấu cờ vây gồm 5 ván giữa Lee Sedol - người từng 18 lần vô địch
**AlphaGo đấu với Kha Khiết (Ke Jie)** là một trận đấu cờ vây ba ván giữa phần mềm máy tính chơi cờ vây AlphaGo và nhà vô địch cờ vây thế giới Kha Khiết trong
**Lee Sedol** (; sinh ngày 2 tháng 3 năm 1983) hay **Lee Se-dol**, là cựu kỳ thủ cờ vây cửu đẳng chuyên nghiệp người Hàn Quốc. Tính đến tháng 2 năm 2016, anh đứng thứ
**Hội nghị Tương lai Cờ vây** (, ) là một hội nghị được tổ chức bởi Hiệp hội cờ vây Trung Quốc, Cục Thể thao tỉnh Chiết Giang và Google ở Ô Trấn, Chiết Giang,
**Cờ vây** là một trò chơi dạng chiến lược trừu tượng cho hai người chơi, trong đó mục tiêu là bao vây nhiều lãnh thổ hơn đối thủ. Trò chơi được phát minh ở Trung
**Master** là một phiên bản của phần mềm cờ vây AlphaGo của Google DeepMind, được đặt tên theo tên tài khoản (tên ban đầu là **Magister**/**Magist**) được sử dụng trực tuyến, đã thắng tuyệt đối
**Jo Chihun**, _Bản nhân phường thứ 25_, _Danh nhân Danh dự_ (; (_Triệu Trị Huân_); (_Cho Chikun_); sinh ngày 20 tháng 6 năm 1956 tại Busan, Hàn Quốc) là một kỳ thủ cờ vây chuyên
**_Holo, tình yêu của tôi_** () là bộ phim giới hạn năm 2020 của Hàn Quốc với sự tham gia của Yoon Hyun-min và Ko Sung-hee. Bộ phim được phát hành trên Netflix vào ngày
Đây là bài con của **Trí tuệ nhân tạo**, nội dung chú trọng vào sự phát triển và **lịch sử ngành trí tuệ nhân tạo**. ## Sự phát triển của lý thuyết trí tuệ nhân