✨Học tự giám sát

Học tự giám sát

Học tự giám sát (self-supervised learning hay SSL) là một kỹ thuật trong học máy mà trong đó, một mô hình được huấn luyện trên một tác vụ bằng cách sử dụng chính dữ liệu để tạo ra các tín hiệu giám sát, thay vì dựa vào các nhãn bên ngoài do con người cung cấp. Trong bối cảnh của mạng thần kinh nhân tạo, học tự giám sát hướng tới việc khai thác các cấu trúc hoặc mối quan hệ nội tại trong dữ liệu đầu vào để tạo ra các tín hiệu huấn luyện có ý nghĩa. Các nhiệm vụ trong SSL được thiết kế sao cho việc giải quyết yêu cầu nắm bắt được các đặc điểm hoặc mối quan hệ quan trọng trong dữ liệu. Dữ liệu đầu vào thường được tăng cường hoặc biến đổi để tạo ra các cặp mẫu liên quan. Một mẫu sẽ đóng vai trò làm đầu vào, và mẫu còn lại được dùng để hình thành tín hiệu giám sát. Việc tăng cường này có thể bao gồm thêm nhiễu, cắt, xoay, hoặc các biến đổi khác. Học tự giám sát mô phỏng cách con người học cách phân loại các đối tượng.

Phương pháp học tự giám sát thông thường dựa trên mạng thần kinh nhân tạo hoặc các mô hình khác như danh sách quyết định (decision list). Mô hình học theo hai bước. Đầu tiên, tác vụ được giải quyết dựa trên một nhiệm vụ phân loại phụ hoặc tiền đề, sử dụng các nhãn giả để giúp khởi tạo các tham số của mô hình. Sau đó, tác vụ chính được thực hiện bằng học có giám sát hoặc không giám sát. Các nhiệm vụ phụ khác liên quan đến việc hoàn thành các mẫu từ các mẫu đầu vào bị che (khoảng dừng trong lời nói hoặc các phần hình ảnh bị che đen).

Học tự giám sát đã cho thấy những kết quả hứa hẹn trong những năm gần đây và đã được ứng dụng thực tiễn trong xử lý âm thanh và đang được Facebook cùng các bên khác sử dụng cho nhận dạng tiếng nói.

Các loại

Học tự giám sát liên kết tự động

Học tự giám sát liên kết tự động là một loại học của học tự giám sát, trong đó mạng thần kinh được huấn luyện để tái tạo hoặc tái cấu trúc chính dữ liệu đầu vào của nó. Nói cách khác, mô hình có nhiệm vụ học một biểu diễn của dữ liệu mà nắm bắt được các đặc điểm hoặc cấu trúc cốt lõi, giúp nó tái tạo lại đầu vào ban đầu.

Thuật ngữ "liên kết tự động" xuất phát từ thực tế rằng mô hình về cơ bản là liên kết dữ liệu đầu vào với chính nó. Điều này thường được thực hiện bằng cách sử dụng bộ tự mã hóa, một loại kiến trúc mạng thần kinh được sử dụng để học biểu diễn. Bộ tự mã hóa bao gồm một mạng mã hóa ánh xạ dữ liệu đầu vào thành một không gian biểu diễn có chiều thấp hơn (không gian tiềm ẩn), và một mạng giải mã tái tạo lại dữ liệu đầu vào từ biểu diễn này.

Quá trình huấn luyện bao gồm việc trình bày mô hình với dữ liệu đầu vào và yêu cầu nó tái tạo lại dữ liệu đó một cách gần nhất có thể. Hàm mất mát được sử dụng trong quá trình huấn luyện thường phạt sự khác biệt giữa dữ liệu đầu vào gốc và đầu ra tái tạo. Bằng cách giảm thiểu lỗi tái tạo này, bộ tự mã hóa học được một biểu diễn có ý nghĩa của dữ liệu trong không gian tiềm ẩn của nó.

Học tự giám sát tương phản

Đối với một tác vụ phân loại nhị phân, dữ liệu huấn luyện có thể được chia thành ví dụ tích cực và ví dụ tiêu cực. Các ví dụ tích cực là những ví dụ phù hợp với mục tiêu. Ví dụ, nếu bạn đang học để nhận diện chim, dữ liệu huấn luyện tích cực là những bức ảnh chứa chim. Các ví dụ tiêu cực là những bức ảnh không chứa chim. Học tự giám sát tương phản sử dụng cả ví dụ tích cực và tiêu cực. Hàm mất mát của học tương phản tối thiểu hóa khoảng cách giữa các cặp mẫu tích cực trong khi tối đa hóa khoảng cách giữa các cặp mẫu tiêu cực.

Huấn luyện một bộ tự mã hóa vốn dĩ là một quá trình tự giám sát, vì mẫu đầu ra cần phải trở thành một tái tạo tối ưu của mẫu đầu vào chính nó. Tuy nhiên, trong ngôn ngữ hiện đại, thuật ngữ "tự giám sát" đã trở nên liên quan đến các nhiệm vụ phân loại dựa trên việc huấn luyện bằng các nhiệm vụ giả định. Điều này đòi hỏi (con người) thiết kế các nhiệm vụ giả định, khác với trường hợp huấn luyện bộ tự mã hóa hoàn toàn tự động.

Ví dụ

Học tự giám sát đặc biệt phù hợp với nhận dạng tiếng nói. Ví dụ, Facebook đã phát triển wav2vec, một thuật toán tự giám sát, để thực hiện nhận dạng tiếng nói bằng cách sử dụng hai mạng thần kinh tích chập sâu liên kết với nhau.

OpenAI đã phát triển GPT-3, một mô hình ngôn ngữ tự hồi quy có thể được sử dụng trong xử lý ngôn ngữ. Nó có thể được dùng để dịch văn bản hoặc trả lời câu hỏi, cùng nhiều tác vụ khác.

Bootstrap Your Own Latent (BYOL) là một phương pháp học tự giám sát không tương phản (NCSSL) đã mang lại kết quả xuất sắc trên ImageNet và các bài kiểm tra truyền tải và bán giám sát.

Thuật toán Yarowsky là một ví dụ về học tự giám sát trong xử lý ngôn ngữ tự nhiên. Từ một số lượng nhỏ các ví dụ được gán nhãn, nó học cách dự đoán nghĩa của một từ đa nghĩa sử dụng tại một điểm trong văn bản.

DirectPred là một phương pháp học tự giám sát không tương phản (NCSSL) đặt trực tiếp các "trọng số dự báo" (predictor weight) thay vì học nó thông qua suy giảm độ dốc.

👁️ 158 | 🔗 | 💖 | ✨ | 🌍 | ⌚

💫 Học tự giám sát

**Học tự giám sát** (**self-supervised learning** hay **SSL**) là một kỹ thuật trong học máy mà trong đó, một mô hình được huấn luyện trên một tác vụ bằng cách sử dụng chính dữ liệu

💫 Học có giám sát

**Học có giám sát** là một kĩ thuật của ngành học máy để xây dựng một hàm (_function_) từ dữ liệu huấn luyện. Dữ liệu huấn luyện bao gồm các cặp gồm đối tượng đầu

💫 Giám sát môi trường

**Giám sát môi trường** mô tả các quá trình và các hoạt động cần được thực hiện để giám sát chất lượng môi trường. Giám sát môi trường là một bước chuẩn bị để đánh

💫 Học viện Cảnh sát nhân dân

**Học viện Cảnh sát nhân dân** còn được gọi là **T02**, **T18** hoặc **T32** (tiếng Anh: _the Vietnam People's Police Academy - VPPA_) là cơ sở đào tạo đại học, sau đại học hệ công

💫 Mạng lưới giám sát Không gian Sâu NASA

**_Mạng lưới giám sát Không gian Sâu** (**DSN**)_ hoặc _**Mạng lưới giám sát Sâu trong Không gian**_ là một mạng lưới các cơ sở giám sát thông tin liên lạc toàn cầu về các chương

💫 Giám sát COVID-19

**Giám sát COVID-19** liên quan đến việc theo dõi sự lây lan của dịch bệnh virus corona để thiết lập các mô hình tiến triển bệnh. Tổ chức Y tế Thế giới (WHO) khuyến nghị

💫 Giám sát hàng loạt ở Trung Quốc

nhỏ| Camera giám sát tại [[Quảng trường Thiên An Môn năm 2009. Năm 2019, _Comparitech_ đã báo cáo rằng 8 trong số 10 thành phố được giám sát nhiều nhất trên thế giới là ở

💫 Camera giám sát ảnh nhiệt HIKVISION – Hàng chính hãng 100% – Mã HIKVISION DS-2TD2617B-3/PAB-SDSSET Cực nhanh – An toàn – Chính xác – Dễ truy vết

Camera giám sát ảnh nhiệt HIKVISION DS-2TD2617B-3/PAB-SDSSET là máy đo thân nhiệt ứng dụng cảm biến nhiệt bằng camera, giúp kiểm soát thân nhiệt một cách an toàn từ khoảng cách trên 1m một cách

💫 Học đặc trưng

thumb|354x354px|Sơ đồ mô hình học đặc trưng trong học máy, được áp dụng cho các nhiệm vụ hạ nguồn, có thể được áp dụng cho dữ liệu thô như hình ảnh hoặc văn bản, hoặc

💫 Giám sát tình trạng

**Giám sát tình trạng** (tiếng Anh là Condition monitoring) là quá trình theo dõi một tham số điều kiện làm việc của máy móc (độ rung, nhiệt độ, vv), để xác định một thay đổi

💫 Văn Miếu – Quốc Tử Giám

nhỏ|289x289px|_Khuê Văn Các_ - biểu tượng của Thủ đô [[Hà Nội. Đây là nơi học sinh thường hay chụp ảnh trong những lễ tốt nghiệp]]**Văn Miếu – Quốc Tử Giám** là quần thể di tích

💫 Ủy ban Giám sát Nhà nước Trung Quốc

**Uỷ ban Giám sát Nhà nước của nước Cộng hoà Nhân dân Trung Hoa** (chữ Anh: _National Supervisory Commission of the People's Republic of China_, chữ Trung phồn thể: 中華人民共和國國家監察委員會, chữ Trung giản thể: 中华人民共和国国家监察委员会, bính âm:

💫 Vectơ từ

Trong xử lý ngôn ngữ tự nhiên (NLP), **vectơ từ** (còn được gọi là **biểu diễn từ**, **nhúng từ**, hay **word embedding**) là một cách biểu diễn từ ngữ. Vectơ từ được sử dụng trong

💫 Ủy ban Giám sát và Quản lý Tài sản Nhà nước Trung Quốc

**Ủy ban Giám sát và Quản lý Tài sản thuộc Sở hữu Nhà nước của Quốc vụ viện** (**SASAC**) là một ủy ban đặc biệt của nước Cộng hòa Nhân dân Trung Hoa, trực thuộc

💫 Giám sát dịch bệnh

**Giám sát dịch bệnh** là một thực hành dịch tễ học theo đó sự lan truyền bệnh tật được theo dõi để thiết lập các mô hình tiến triển. Vai trò chính của giám sát

💫 Hỏi - đáp về công tác kiểm tra, giám sát và kỷ luật của Đảng (bản in 2023)

Cuốn sách gồm 130 câu hỏi - trả lời, chia làm 2 phần: Phần thứ nhất gồm những câu hỏi và trả lời về nghiệp vụ công tác kiểm tra, giám sát và kỷ luật

💫 THUẬT ỦY QUYỀN VÀ GIÁM SÁT (Delegation & Supervision) - Brian Tracy (tái bản, bìa mềm)

THUẬT ỦY QUYỀN VÀ GIÁM SÁT (Delegation & Supervision) - Brian Tracy (tái bản, bìa mềm) - Giá bìa: 99.000đ Những nhà lãnh đạo tài ba luôn biết cách đạt đến thành công nhờ vào

💫 Sách - Ngọn Cờ Cách Mạng Công Khai Cắm Tại Sài Gòn (1955-1958) - Hồi Ký Về Phái Đoàn Liên Lạc Quân Đội Nhân Dân Việt Nam Bên Cạnh Ủy Ban Quốc Tế Giám Sát Và Kiểm Soát Thi Hành Hiệp Định Giơnevơ

Ngọn Cờ Cách Mạng Công Khai Cắm Tại Sài Gòn (1955-1958) - Hồi Ký Về Phái Đoàn Liên Lạc Quân Đội Nhân Dân Việt Nam Bên Cạnh Ủy Ban Quốc Tế Giám Sát Và Kiểm

💫 Đại học Tự do Berlin

**Đại học Tự do Berlin** (, thường được viết tắt là **FU Berlin** hoặc đơn giản là **FU**) là một trường đại học nghiên cứu công lập ở Berlin, Đức. Trường được thành lập vào

💫 Học sâu

**Học sâu** (tiếng Anh: **deep learning**, còn gọi là **học cấu trúc sâu**) là một phần trong một nhánh rộng hơn các phương pháp học máy dựa trên mạng thần kinh nhân tạo kết hợp

💫 Quang học

thumb|right|Quang học nghiên cứu hiện tượng [[tán sắc của ánh sáng.]] **Quang học** là một ngành của vật lý học nghiên cứu các tính chất và hoạt động của ánh sáng, bao gồm tương tác

💫 Camera quan sát

thumb|Camera quan sát trên nóc một tòa nhà. thumb|Camera quan sát. liên_kết=https://vi.wikipedia.org/wiki/T%E1%BA%ADp tin:CCTV_dome_camera_subway_Rotterdam.jpg|nhỏ|Camera mái vòm trong nhà ga: [[Nhà ga Rotterdam Centraal|Ga tàu điện ngầm trung tâm Rotterdam]] **Camera quan sát**, **camera giám sát** hay

💫 Thí nghiệm nhà tù Stanford

nhỏ| Biển lưu niệm tại địa điểm thí nghiệm nhà tù Stanford
(_Nơi diễn ra
THÍ NGHIỆM NHÀ TÙ STANFORD
Tiến hành bởi
Tiến sĩ [[Philip Zimbardo|Philip G. Zimbardo_)]]**Thí nghiệm nhà tù Stanford** là một thí nghiệm tâm lý

💫 Địa mạo học

thumb|upright=1.4|[[Đất xấu khắc vào đá phiến sét dưới chân cao nguyên Bắc Caineville, Utah, trong đèo được khắc bởi sông Fremont và được gọi là the Blue Gate. Grove Karl Gilbert đã nghiên cứu các

💫 Hoạt Động Giám Sát Và Phản Biện Xã Hội Của MTTQ Việt Nam, Các Đoàn Thể Chính Trị - Xã Hội Về Thực Thi Nguyên Tắc Tập Trung Dân Chủ Trong Đảng

Giám sát, phản biện xã hội của Mặt trận Tổ quốc Việt Nam và các đoàn thể chính trị - xã hội có vai trò, ý nghĩa rất quan trọng đối với việc thực hiện

💫 Công Đoàn Tiếp Tục Quan Tâm Công Tác Giám Sát Và Phản Biện Xã Hội

Liên đoàn Lao động huyện Vĩnh Thuận thành lập Đoàn giám sát do đồng chí Lê Kim Thoa - Huyện ủy viên, Chủ tịch LĐLĐ huyện làm Trưởng đoàn. Cùng tham gia với Đoàn gồm có

💫 Học máy

**Học máy** hay **máy học** (_machine learning_) là một lĩnh vực của trí tuệ nhân tạo liên quan đến việc nghiên cứu và xây dựng các kĩ thuật cho phép các hệ thống "học" tự

💫 TS. Ngô Đức Lập - Hệ thống cơ quan giám sát triều Nguyễn (1802 - 1885): Từ thiết chế, định chế đến thực tiễn

HỆ THỐNG CƠ QUAN GIÁM SÁT TRIỀU NGUYỄN (1802–1885) ️ Một khảo cứu công phu về cách vận hành quyền lực, kiểm tra và kiểm soát trong bộ máy chính trị phong kiến. Giám sát

💫 Đại học Yale

**Viện Đại học Yale** (tiếng Anh: _Yale University_), còn gọi là **Đại học Yale**, là viện đại học tư thục ở New Haven, Connecticut. Thành lập năm 1701 ở Khu định cư Connecticut, Yale là

💫 Giám sát trực tuyến

**Giám sát trực tuyến** là giám sát hoạt động máy tính hoặc dữ liệu được truyền tải qua mạng máy tính như Internet. Việc theo dõi thường được thực hiện một cách bí mật và

💫 Hibiki (lớp tàu giám sát đại dương)

**Tàu giám sát đại dương lớp Hibiki** (Tiếng Nhật: **ひびき型音響測定艦**) là một lớp tàu giám sát thuộc Lực lượng Phòng vệ trên biển Nhật Bản (JMSDF). Các tàu lớp Hibiki sở hữu hai đáy và

💫 Qua Hơn 190 Cuộc Giám Sát, Cử Tri An Giang Chỉ Ra Nhiều Điểm Nghẽn

Sau hơn 190 cuộc giám sát do Mặt trận Tổ quốc các cấp triển khai, cử tri An Giang ghi nhận nhiều chuyển biến tích cực trong điều hành phát triển kinh tế - xã

💫 Ủy ban Dân nguyện và Giám sát của Quốc hội (Việt Nam)

**Ủy ban Dân nguyện và Giám sát của Quốc hội** là một trong những ủy ban của Quốc hội Việt Nam, phụ trách các vấn đề về hoạt động dân nguyện và giám sát. Ủy

💫 Người giám sát (phim)

**Người giám sát** (tiếng ; tiếng Anh: **_Watcher_** ; cách điệu là **_WATCHER_**) là một bộ phim truyền hình Hàn Quốc năm 2019 với sự tham gia của Han Suk-kyu, Seo Kang-joon và Kim Hyun-joo.

💫 HỆ THỐNG CƠ QUAN GIÁM SÁT TRIỀU NGUYỄN (1802 – 1885) TỪ THIẾT CHẾ, ĐỊNH CHẾ ĐẾN THỰC TIẾN

HỆ THỐNG CƠ QUAN GIÁM SÁT TRIỀU NGUYỄN (1802 – 1885) TỪ THIẾT CHẾ, ĐỊNH CHẾ ĐẾN THỰC TIẾN Năm 1802 Nguyễn Ánh giành được chiến thắng trước nhà Tây Sơn lập ra vương triều

💫 Trường Đại học Văn Lang

**Trường Đại học Văn Lang** (English:**_Van Lang University**,_ Latin: _Universitas Vanlangensis_), thường được gọi tắt là **VLU** là một trường đại học tư thục đa ngành ở Thành phố Hồ Chí Minh, Việt Nam. Thành

💫 Sinh trắc học

Nhận dạng dấu vân tay tại Mỹ **Sinh trắc học** là môn khoa học ứng dụng phân tích toán học thống kê xác suất để nghiên cứu các hiện tượng sinh học hoặc các chỉ

💫 Camera thông minh Wifi, giám sát an ninh ngoài trời 365 Selection OC2, độ phân giải 3K 5MP, quan sát toàn cảnh 360°, chống nước IP65 - Hàng chính hãng

CAMERA THÔNG MINH WIFI, GIÁM SÁT AN NINH NGOÀI TRỜI 365 SELECTION OC2, ĐỘ PHÂN GIẢI 3K 5MP, CHỐNG NƯỚC IP65, BH CHÍNH HÃNG Thương hiệu: 365 Selection - Thiết bị nhà thông minh số

💫 Sách - Hướng Dẫn Học Tốt Toán + Ngữ Văn + Khoa Học Tự Nhiên Lớp 6 - Bám Sát SGK Cánh Diều - Hồng Ân

Combo Bộ Sách Tham Khảo Toán - Văn - Khoa Học Tự Nhiên Lớp 6 (Bám Sát SGK Cánh Diều) (Bộ 5 Cuốn) 1. Hướng Dẫn Học Tốt Toán 6 - Tập 1 (Bám Sát

💫 Combo Bộ Sách Tham Khảo Toán - Văn - Khoa Học Tự Nhiên Lớp 6 (Bám Sát SGK Cánh Diều) (Bộ 5 Cuốn) _HA

Combo Bộ Sách Tham Khảo Toán - Văn - Khoa Học Tự Nhiên Lớp 6 (Bám Sát SGK Cánh Diều) (Bộ 5 Cuốn) 1. Hướng Dẫn Học Tốt Toán 6 - Tập 1 (Bám Sát SGK

💫 Sách - Combo 5 cuốn Tham Khảo Toán - Văn - Khoa Học Tự Nhiên Lớp 6 (Bám Sát SGK Cánh Diều)

Công ty Học Liệu Sư Phạm giới thiệu: Combo Bộ Sách Tham Khảo Toán - Văn - Khoa Học Tự Nhiên Lớp 6 (Bám Sát SGK Cánh Diều) (Bộ 5 Cuốn) 1. Hướng Dẫn Học

💫 Sách - Combo Bộ Sách Tham Khảo Toán - Văn - Khoa Học Tự Nhiên Lớp 6 (Bám Sát SGK Cánh Diều) (Bộ 5 Cuốn)

Công ty Học Liệu Sư Phạm giới thiệu: Combo Bộ Sách Tham Khảo Toán - Văn - Khoa Học Tự Nhiên Lớp 6 (Bám Sát SGK Cánh Diều) (Bộ 5 Cuốn) 1. Hướng Dẫn Học

💫 Học viện cảnh sát

**_Học viện cảnh sát_** (Hangul: 경찰수업; Romanja: _Kyeongchalsueob;_ tiếng Anh: **_Police University_**) là một bộ phim truyền hình Hàn Quốc năm 2021 với sự tham gia của Cha Tae-hyun, Jung Jin-young và Krystal Jung. Bộ

💫 Sách - Combo Khoa Học Dữ Liệu Với Các Kỹ Thuật Học Máy (Cơ Bản) + Phân Tích Dữ Liệu Và Các Kỹ Thuật Học Máy (Bộ 2 Cuốn)

Combo Khoa Học Dữ Liệu Với Các Kỹ Thuật Học Máy (Cơ Bản) + Phân Tích Dữ Liệu Và Các Kỹ Thuật Học Máy (Bộ 2 Cuốn) 1. Khoa Học Dữ Liệu Với Các Kỹ

💫 Sách Phân tích dữ liệu và các kỹ thuật học máy ( STK)

PHÂN TÍCH DỮ LIỆU VÀ CÁC KỸ THUẬT HỌC MÁY Có thể xem đây là tập tiếp theo sách KHOA HỌC DỮ LIỆU VỚI CÁC KỸ THUẬT HỌC MÁY (CƠ BẢN) ở mức độ

💫 Học tăng cường

Trong ngành khoa học máy tính, **học tăng cường** (tiếng Anh: _reinforcement learning_) là một lĩnh vực con của học máy, nghiên cứu cách thức một _agent_ trong một _môi trường_ nên chọn thực hiện

💫 COMBO BỘ SÁCH THAM KHẢO TOÁN - VĂN - KHOA HỌC TỰ NHIÊN LỚP 6 (BÁM SÁT SGK CHÂN TRỜI SÁNG TẠO) (BỘ 5 CUỐN)

Combo Bộ Sách Tham Khảo Toán - Văn - Khoa Học Tự Nhiên Lớp 6 (Bám Sát SGK Chân Trời Sáng Tạo) (Bộ 5 Cuốn) Các tác giả cũng đặt ra nhiệm vụ phân chia

💫 Bộ tự mã hóa

**Bộ tự mã hóa** (tiếng Anh: **autoencoder**) là một dạng mạng thần kinh nhân tạo được dùng để học các mã hóa dữ liệu hiệu quả theo cách học không có giám sát. Mục tiêu

💫 Sách Combo Khám phá toán 11 để học giỏi - Bám Sát SGK Kết Nối Tri Thức - Tập 1 + Tập 2-HA-MK

Khám phá toán 11 để học giỏi - Bám Sát SGK Kết Nối Tri Thức - Tập 1+ tập 2 gồm Khám phá toán 11 để học giỏi - Bám Sát SGK Kết Nối Tri

💫 Bản đồ tự tổ chức

**Bản đồ tự tổ chức** (tiếng Anh: **self-organizing map** (**SOM**) hay **self-organizing feature map** (**SOFM**) là một dạng mạng thần kinh nhân tạo (ANN) được huấn luyện sử dụng học không có giám sát để