Mô hình phân biệt (tiếng Anh: discriminative model, conditional model) là lớp các mô hình logistic dùng cho phân loại bằng thống kê hay hồi quy. Chúng phân biệt ranh giới quyết định thông qua dữ liệu quan sát được, chẳng hạn như đạt/không đạt, thắng/thua, sống/chết hoặc khỏe mạnh/bệnh tật.
Các mô hình phân biệt điển hình bao gồm hồi quy logistic (LR), hàng xóm gần nhất, SVM, các trường điều kiện ngẫu nhiên (CRF) (được chỉ định trên một biểu đồ vô hướng), cây quyết định, và nhiều thứ khác.
Có một loại mô hình khác, đó là mô hình sinh (generative models). Các cách tiếp cận mô hình tạo sinh điển hình bao gồm các phân lớp Naive Bayes, các mô hình hỗn hợp Gauss, bộ mã hóa biến phân (variational autoencoders) và nhiều cái khác.
Định nghĩa
Khác với mô hình hóa tạo sinh, nghiên cứu phân phối xác suất đồng thời , mô hình phân biệt nghiên cứu hoặc các ánh xạ trực tiếp biến không được quan sát đã cho (mục tiêu) đến một lớp nhãn tùy theo các biến quan sát (các mẫu huấn luyện). Ví dụ, trong nhận diện đối tượng ngoại lai (outline of object recognition), giống như là một véctơ các pixel thô (hoặc các đặc tính được trích xuất từ các pixel thô của hình ảnh). Bên trong một khung xác suất, điều này được thực hiện bằng cách mô hình hóa phân phối xác suất có điều kiện (conditional probability distribution) , có thể được sử dụng để dự đoán từ . Chú ý rằng vẫn có sự khác biệt giữa mô hình có điều kiện và mô hình phân biệt, mặc dù chúng thường được phân loại một cách đơn giản là mô hình phân biệt.
Mô hình phân biệt thuần túy so với mô hình có điều kiện
Một mô hình điều kiện mô hình phân phối xác suất điều kiện, trong khi đó mô hình phân biệt truyền thống nhắm đến việc tối ưu ánh xạ đầu vào xung quanh các mẫu được đào tạo gần giống nhất.
Một số cách tiếp cận mô hình phân biệt đối xử điển hình
Cách tiếp cận sau dựa trên giả định rằng nó được cung cấp tập dữ liệu huấn luyện , theo đó là đầu ra tương ứng với đầu vào .
Bộ phân loại tuyến tính
Hàm được dùng để mô phỏng hành vi quan sát được từ tập huấn luyện theo phương pháp bộ phân loại tuyến tính (linear classifier). Sử dụng vectơ đặc tính hợp nhất , hàm quyết định được định nghĩa:
:
Theo diễn dịch Memisevic, , hay là , tính toán một điểm số đo lường khả năng tính toán của đầu vào với đầu ra tiềm năng . Sau đó, xác định một lớp với điểm số cao nhất.
Hồi quy logistic (LR)
Từ lúc hàm mất mát 0-1 (0-1 loss function) thường được sử dụng trong lý thuyết quyết định, phân phối xác suất có điều kiện , với là tham số véctơ để tối ưu hóa dữ liệu huấn luyện, có thể được cân nhắc lại như sau đối với mô hình hồi quy logistic:
:
, với
:
Phương trình trên thể hiện hồi quy logistic (logistic regression). Lưu ý, sự khác biệt chủ yếu giữa các mô hình là cách chúng đưa ra xác suất hậu nghiệm, được suy ra từ mô hình tham số. Sau đó, có thể tối đa hóa tham số bằng phương trình sau:
:
Nó cũng có thể được thay thế bằng phương trình mất mát log (log loss) như sau:
:
Khi mất mát log có thể phân biệt được (hay có tính khả vi), một phương pháp dựa trên gradient có thể được sử dụng để tối ưu hóa mô hình. Mức tối ưu toàn cục được đảm bảo vì hàm mục tiêu là hàm lồi. Độ dốc của log likelihood được thể hiện:
:
với là kỳ vọng của .
Phương pháp trên sẽ cung cấp sự tính toán hiệu quả cho sự phân loại với số lượng tương đối nhỏ.
👁️
1 | 🔗 | 💖 | ✨ | 🌍 | ⌚
**Mô hình phân biệt** (tiếng Anh: **_discriminative model_**, **conditional model**) là lớp các mô hình logistic dùng cho phân loại bằng thống kê hay hồi quy. Chúng phân biệt ranh giới quyết định thông qua
Trong phân loại bằng thống kê, có hai cách tiếp cận chính là tiếp cận **tạo sinh** (sinh mẫu) và tiếp cận **phân biệt**. Hai cách này tính toán các bộ phân lớp (classifier) bằng
Một **mô hình toán học** là một mô hình trừu tượng sử dụng ngôn ngữ toán để mô tả về một hệ thống. Mô hình toán được sử dụng nhiều trong các ngành khoa học
liên_kết=https://en.wikipedia.org/wiki/File:%22Colored%22_drinking_fountain_from_mid-20th_century_with_african-american_drinking.jpg|thế=|nhỏ|272x272px|Một người Mỹ gốc Phi uống nước từ một bình nước tách riêng theo chủng tộc dán nhãn "[cho người] Da màu", ở [[Thành phố Oklahoma, .]] **Phân biệt đối xử** là quá trình tạo
phải|nhỏ|Vivian Malone, [[sinh viên đại học người Mỹ gốc Phi vào Đại học Alabama ở Mỹ để đăng ký lớp học với tư cách là một trong những sinh viên không da trắng đầu tiên
**Mô hình cơ sở dữ liệu phân cấp** (tiếng Anh: hierarchical database model) là một loại mô hình dữ liệu, trong đó dữ liệu được tổ chức thành cấu trúc dạng cây. Dữ liệu được
**Mô hình kinh doanh** là một khái niệm trừu tượng của một tổ chức, nó có thể là một khái niệm, văn bản và/hoặc đồ hoạ của cấu tạo tương quan, hợp tác, sự sắp
**Mô hình Chuẩn** của vật lý hạt là một thuyết bàn về các tương tác hạt nhân mạnh, yếu, và điện từ cũng như xác định tất cả những hạt hạ nguyên tử đã biết.
**Phân biệt chủng tộc ở châu Á** bắt nguồn từ những sự kiện đã xảy ra ở khắp nơi từ hàng ngàn năm trước cho đến nay. ## Bangladesh Vào năm 2015, Elias Mollah, thành
**Mô hình Solow–Swan** hay **mô hình tăng trưởng ngoại sinh** là một mô hình kinh tế về tăng trưởng kinh tế dài hạn được thiết lập dựa trên nền tảng và khuôn khổ của kinh
**Mô hình OSI** (_Open Systems Interconnection Reference Model_, viết ngắn là _OSI Model_ hoặc _OSI Reference Model_) - tạm dịch là **Mô hình tham chiếu kết nối các hệ thống mở ** - là một
**_Werewolf by Night_** (tạm dịch tiếng Việt: **_Ma sói trong đêm_**) là một bộ phim truyền hình đặc biệt của Mỹ do Michael Giacchino đạo diễn và soạn nhạc, Heather Quinn và Peter Cameron viết
Biểu ngữ treo tại trụ sở Hiệp hội Quốc gia Mỹ phản đối việc trao cho phụ nữ quyền bầu cử. **Phân biệt giới tính** hay **kỳ thị giới tính** (tiếng Anh: _sexism_), là một
**Mô hình dao cạo và lưỡi dao** là một mô hình kinh doanh trong đó một mặt hàng được bán với giá thấp (hoặc được tặng miễn phí) để tăng doanh số củahàng hóa bổ
nhỏ|Một cửa hàng thể thao Direct Direct quảng cáo cánh tay web của doanh nghiệp. Sports Direct bắt đầu giao dịch vào năm 1982 với một cửa hàng bán gạch duy nhất nhưng gần đây
Mô hình tổng quan xương cơ thể người 45cm mô phỏng đầy đủ các chi tiết tổng quan của bộ xương người, nhỏ gọn và giá cả vô cùng hợp lý, thích hợp cho việc
thumb|Mô hình của một phân tử, với các quả bóng màu đại diện cho các nguyên tử khác nhau Một **mô hình** () là một đại diện thông tin của một đối tượng, người hoặc
thumb|Người Do Thái Ashkenazi ở Israel **Phân biệt chủng tộc ở Israel** đề cập đến tất cả các hình thức, các biểu hiện, các trải nghiệm, và các sắc thái của chủ nghĩa phân biệt
**Mô hình khái niệm** là một đại diện của một hệ thống, được tạo thành từ các thành phần của các khái niệm được sử dụng để giúp mọi người biết, hiểu hoặc mô phỏng
**Model-Driven Architecture** (MDA) hay còn gọi là kiến trúc định hướng mô hình, là một phương thức trong việc thiết kế và phát triển phần mềm, được Object Management Group (OMG) giới thiệu lần đầu
nhỏ| Sơ đồ [[Mô hình IS-LM|mô hình IS / LM]] Trong kinh tế học, **mô hình** là một cấu trúc lý thuyết đại diện cho các quá trình kinh tế bằng một tập hợp các
**Mô hình Markov ẩn** (tiếng Anh là _Hidden Markov Model_ - **HMM**) là mô hình thống kê trong đó hệ thống được mô hình hóa được cho là một quá trình Markov với các tham
**Mô hình hoạt động mục tiêu** (**TOM**) là một mô tả về trạng thái mong muốn của mô hình hoạt động của một tổ chức. Khi làm việc trên mô hình hoạt động, việc xác
Một nghiên cứu về thái độ xã hội được thực hiện tại Đại học Harvard từ năm 2002-15 đã lập bản đồ các quốc gia ở châu Âu với các sự cố phân biệt chủng
thumb| Bản đồ cấu trúc của mỏ Erath, [[Louisiana, Hoa Kỳ trong mô hình với các đường đẳng sâu được hiển thị bằng các màu sắc khác nhau.]] **Mô hình địa chất** là sản phẩm
nhỏ|Lưới cho tâm thất trái, ở ba độ phân giải lưới khác nhau và phân phối sợi/tấm Trong khoa học máy tính, và đặc biệt hơn trong lý thuyết tính toán và lý thuyết độ
Một **mô hình xác suất đồ thị** là một mô hình xác suất sử dụng đồ thị để biểu diễn phụ thuộc có điều kiện giữa các biến ngẫu nhiên một cách trực quan. Mô
**Mô hình Bell-La Padula** (viết tắt là BLP) là một mô hình máy được sử dụng để thực thi kiểm soát truy cập vào các ứng dụng của chính phủ và quân sự. Nó được
**Phân biệt dân tộc ở Việt Nam** là thái độ phân biệt của người Kinh chiếm đa số đối với các dân tộc thiểu số như người Thượng, người Chăm, người Khmer Krom và người
nhỏ|Một cuộc thí nghiệm với sinh vật mô hình là chuột **Sinh vật mô hình** là các loài không phải con người được sử dụng rộng rãi trong nghiên cứu khoa học, nhằm tìm hiểu
**Mô hình không gian véctơ** hay **mô hình thuật ngữ véctơ** (tiếng Anh: **vector space model**) là một mô hình đại số dùng để thể hiện các tài liệu văn bản (và bất cứ đối
**Phân tích độ nhạy (SA)** là kỹ thuật làm thế nào để phân chia _sự không chắc chắn_ trong kết quả đầu ra của một _mô hình toán học_ hoặc _một hệ thống_ (hệ thống
Trong đồ họa máy tính 3D, **mô hình hóa 3D** là quá trình phát triển biểu diễn toán học của bất kỳ _bề mặt_ nào của vật thể (vô tri hoặc sống) theo ba chiều
**Mô hình xoắn ốc** (tiếng Anh: _spiral model_) là quy trình phát triển định hướng rủi ro cho các dự án phần mềm. Kết hợp của thế mạnh của các mô hình khác và giải
Canvas khởi động tinh gọn là bản phóng tác của Ash Maurya trong khung mô hình kinh doanh của Alexander Osterwalder, trong đó tập trung vào các vấn đề, giải pháp, số liệu chính ,
Canvas khởi động tinh gọn là bản phóng tác của Ash Maurya trong khung mô hình kinh doanh của Alexander Osterwalder, trong đó tập trung vào các vấn đề, giải pháp, số liệu chính ,
**Mô hình hóa và chế tạo kỹ thuật số** và là một quá trình thiết kế và sản xuất kết hợp mô hình hóa 3D hoặc thiết kế có sự hỗ trợ tính toán (CAD)
**_Entergalactic_** (cách điệu bằng cách viết hoa tất cả các chữ cái) là một chương trình hoạt hình dành cho người lớn đặc biệt do nhạc sĩ kiêm diễn viên người Mỹ Kid Cudi sáng
Trong công ty chỉ có một ông chủ duy nhất đó làkhách hàng. Khách hàng có thể đuổi việc từ giám đốc cho đến nhân viên, chỉ với một hành động duy nhất đó làmua
**Biểu diễn Thể hiện Mã hóa Hai chiều từ Transformer** (tiếng Anh: **Bidirectional Encoder Representations from Transformers** hay viết tắt là **BERT**) là một kỹ thuật học máy dựa trên các transformer được dùng cho
nhỏ|Phối trộn màu bổ sung: thêm đỏ vào xanh lá cây tạo ra vàng; thêm vàng vào xanh lam tạo ra trắng. **Mô hình màu RGB** sử dụng mô hình bổ sung trong đó ánh
Mục từ "Computer-generated imagery" dẫn đến bài này.
Một ví dụ về bức ảnh phong cảnh tĩnh, giống tự nhiên được mô phỏng bằng máy tính **Công nghệ mô phỏng hình ảnh bằng máy
**Mô hình tài chính **là nhiệm vụ xây dựng một mô hình trừu tượng (một mô hình) về tình hình tài chính trong thế giới thực. Đây là một mô hình toán học được thiết
**Phân tích tính toán** (Analytics) là phân tích tính toán có hệ thống của dữ liệu hoặc thống kê. Đây là quá trình phát hiện, giải thích và truyền đạt các mô hình có ý
**Mô hình siêu cá nhân** là một mô hình của hình thức giao tiếp giữa các cá nhân với nhau, khi hình thức giao tiếp qua trung gian máy tính (CMC) vượt qua được sự
thế=Membership of the Convention on the Elimination of All Forms of Racial Discrimination|phải|nhỏ|400x400px| Tư cách thành viên của Công ước về xóa bỏ mọi hình thức phân biệt chủng tộc: **Công ước quốc tế về
Xây dựng và Phát triển các mô hình Doanh nghiệp số là điều cần thiết để tồn tại đối với mọi công ty ngày nay. Bạn may mắn vì không phải phát minh lại bánh
Trong Lý thuyết xác suất và thống kê, **phân phối mũ** là một lớp của các phân bố xác suất liên tục. Chúng thường được dùng để mô hình thời gian giữa các biến cố
thumb|Năm 1920 ảnh chụp [[Charles Ponzi, với mô hình cùng tên, khi vẫn đang làm việc với tư cách là một doanh nhân tại văn phòng của ông ở Boston]] **Mô hình Ponzi** (, ,
Mô hình PASTA được phát triển bởi Theo Zweers, MSc Business Economics (Thạc sĩ khoa học kinh tế) , Erasmus University, Rotterdam vào tháng 6 năm 2015. PASTA là mô hình hỗ trợ xác lập