✨ISO 639-3

ISO 639-3

ISO 639-3:2007 - Codes for the representation of names of languages — Part 3: Alpha-3 code for comprehensive coverage of languages - là tiêu chuẩn nằm trong chuỗi tiêu chuẩn quốc tế ISO 639 do Tổ chức Tiêu chuẩn hóa Quốc tế ban hành dành cho mã ngôn ngữ. Mỗi mã ISO 639-3 gồm ba chữ cái dùng để nhận diện ngôn ngữ. ISO 639-3 mở rộng các mã alpha-3 của ISO 639-2 nhằm mục đích bao quát toàn bộ các ngôn ngữ tự nhiên đã biết trên thế giới. Tiêu chuẩn này được ban hành vào ngày 5 tháng 2 năm 2007.

ISO 639-3 hướng đến nhiều đối tượng sử dụng, cụ thể là các hệ thống máy tính có nhu cầu hỗ trợ nhiều ngôn ngữ. Tiêu chuẩn này cung cấp một bảng liệt kê ngôn ngữ hoàn chỉnh nhất có thể được, bao gồm các ngôn ngữ cả sống lẫn chết, cả cổ lẫn được xây dựng, cả lớn và nhỏ, cả ngôn ngữ có chữ viết lẫn không có chữ viết.

ISO 639-3 là một siêu tập hợp (superset) của ISO 639-1 và của các ngôn ngữ đơn lẻ trong ISO 639-2. ISO 639-1 và ISO 639-2 tập trung vào các ngôn ngữ lớn thường xuyên có mặt trong tổng thể kho tài liệu của thế giới. Do ISO 639-2 bao gồm các tập hợp ngôn ngữ trong khi ISO 639-3 lại không có nên ISO 639-3 không phải là một siêu tập hợp của ISO 639-2. Ngoài ra, ISO 639-3 chỉ dùng mã "thuật ngữ" (xem thêm ISO 639-2) so với ISO 639-2 dùng cả mã "thư mục" và mã "thuật ngữ".

Tính đến tháng 4 năm 2012, tiêu chuẩn ISO 639-3 có 7.776 mục. Con số này đạt được là nhờ dựa trên nhiều nguồn khác nhau, bao gồm: các ngôn ngữ đơn lẻ trong ISO 639-2, các ngôn ngữ hiện đại trích từ xuất bản phẩm Ethnologue, các biến thể mang tính lịch sử, các ngôn ngữ cổ và các ngôn ngữ được xây dựng rút từ cơ sở dữ liệu Linguist List của nhà ngôn ngữ học Anthony Aristar cũng như các ngôn ngữ do công chúng đề xuất trong các buổi thu thập ý kiến phản hồi.

Không gian mã

Do mã ISO 639-3 gồm ba mẫu tự trong bảng chữ cái tiếng Anh nên tổng số kết hợp khác nhau là 26 × 26 × 26 = 17576. Do ISO 639-2 định nghĩa có bốn mã đặc biệt, 520 mã dự trữ, 23 mã chỉ dành cho mã "thư mục" nên có 4 + 520 + 23 = 547 mã mà ISO 639-3 không được sử dụng. Điều này nghĩa là kho mã của ISO 639-3 chỉ có thể có tối đa gần 17030 mã. Con số này sẽ càng nhỏ đi nếu trừ đi các mã đại diện cho các tập hợp ngôn ngữ mà ISO 639-2 đã định nghĩa và các mã chưa được định nghĩa trong ISO 639-5.

Ngôn ngữ vĩ mô

Có 56 ngôn ngữ trong ISO 639-2 được ISO 639-3 gọi là ngôn ngữ vĩ mô ().

Một số ngôn ngữ chẳng hạn arb (tiếng Ả Rập chuẩn) được ISO 639-2 xem là phương ngữ của một ngôn ngữ (trong trường hợp này ara), nhưng trong một số ngữ cảnh nhất định thì lại được xem là ngôn ngữ riêng theo cách hiểu của ISO 639-3.

Ngôn ngữ tập thể

"Một mã ngôn ngữ tập thể là một định danh đại diện cho một nhóm các ngôn ngữ đơn không được xem là một ngôn ngữ trong bất kỳ ngữ cảnh nào". Các mã này không đại diện một cách chính xác cho một ngôn ngữ hoặc một ngôn ngữ vĩ mô nhất định.

Trong khi ISO 639-2 dùng các định danh ba chữ cái để đại diện cho các ngôn ngữ tập thể thì ISO 639-3 lại bỏ số mã này.

Sử dụng

ISO 639-3 được dùng trong:

  • Ethnologue, Linguist List
  • Thẻ ngôn ngữ IETF
  • Lexical Markup Framework, một tiêu chuẩn đại diện cho các từ điển mà máy đọc được

Mã đặc biệt

Có bốn mã được dùng trong các trường hợp không thể dùng một mã cụ thể nào được. Các mã đặc biệt này là nhằm đáp ứng chủ yếu cho các ứng dụng, chẳng hạn các cơ sở dữ liệu yêu cầu cung cấp mã ngôn ngữ theo ISO mặc cho có tồn tại mã dành cho ngôn ngữ hay là không.

mis (viết tắt của từ miscellaneous) nhắm đến các ngôn ngữ (chưa) được đưa vào tiêu chuẩn ISO.

mul dùng trong các trường hợp ứng dụng mà trong đó sử dụng từ hai ngôn ngữ trở lên, trong khi lại yêu cầu chỉ cung cấp một mã ngôn ngữ duy nhất.

und dùng trong các trường hợp chưa nhận diện được ngôn ngữ, chẳng hạn do nhãn bị ghi sai hoặc chưa bao giờ được đặt nhãn. Chú ý mã này không dùng cho các trường hợp khai báo các ngôn ngữ không được chứng nhận.

zxx dùng cho dữ liệu không phải ngôn ngữ [của con người], chẳng hạn tiếng động vật kêu.

👁️ 0 | 🔗 | 💖 | ✨ | 🌍 | ⌚
**ISO 639-3:2007** - _Codes for the representation of names of languages — Part 3: Alpha-3 code for comprehensive coverage of languages_ - là tiêu chuẩn nằm trong chuỗi tiêu chuẩn quốc tế ISO 639 do
**ISO 639-2:1998** - _Codes for the representation of names of languages — Part 2: Alpha-3 code_ - là phần hai của chuỗi tiêu chuẩn quốc tế ISO 639 do Tổ chức tiêu chuẩn hóa quốc
**ISO 639** là hệ thống tiêu chuẩn quốc tế về mã của các tên ngôn ngữ. ISO 639 gồm các phần khác nhau, trong đó bốn phần đã được thông qua (phần 1, 2, 3
Đây là một danh sách chưa đầy đủ của các tiêu chuẩn ISO. Một số tiêu chuẩn được ISO/IEC JTC1 công bố, đã được đăng cho mọi người [http://isotc.iso.org/livelink/livelink/fetch/2000/2489/Ittf_Home/PubliclyAvailableStandards.htm tự do truy cập] ## ISO
**_Ethnologue: Languages of the World_** là một xuất bản phẩm điện tử với nội dung là các số liệu thống kê về ngôn ngữ và phương ngữ trên thế giới. Nó cung cấp thông tin
**Tiếng Provençal** (, , ; hoặc ) là một phương ngữ tiếng Occitan được nói bởi một nhóm người thiểu số ở miền Nam nước Pháp, chủ yếu ở Provence. Trong cộng đồng nói tiếng
**Khiết Đan** hay **Khất Đan** (chữ Hán: _契丹_) là âm Hán-Việt tên gọi của một dân tộc du mục **Khitan** () (còn được phiên âm là **Khitai** hay **Kidan**), từng tồn tại ở Trung Á
**Busuu**.com là một mạng xã hội trực tuyến được sử dụng như 1 phương pháp học ngoại ngữ cho cộng đồng. Người dùng có thể giúp đỡ nhau để tăng cường vốn ngoại ngữ. Trang
**Tiếng Tokelau** là một ngôn ngữ thuộc họ ngôn ngữ Polynesia và có quan hệ gân gũi với tiếng Samoa và là tiếng Tuvalu. Có khoảng 1.500 người sử dụng ngôn ngữ này trên các
**Tiếng Bạch** (chữ Latinh: , chữ Hán-Bạch: 白語子, âm Hán-Việt: Bạch ngữ tử; ) là ngôn ngữ của người Bạch, với phần đông người nói tụ ở Vân Nam, Trung Quốc. Ngôn ngữ này có
**Tiếng Adnyamathanha** (_yura ngarwala_) là một ngôn ngữ bản địa Úc. Đây là ngôn ngữ dân tộc của người Adnyamathanha. Các ước tính số người nói tiếng Adnyamathanha không nhất quán, dù ngôn ngữ này
**Tiếng Dukha** (тyъһа тыл, _Tuha tıl_) là một ngôn ngữ Turk có nguy cơ tuyệt chủng được nói bởi khoảng 500 người Dukha (hay còn gọi là Tsaatan) ở huyện Tsagaannuur thuộc tỉnh Khövsgöl, miền
**Tiếng Tráng Tả Giang** ( ) là một nhóm phương ngữ thuộc nhóm tiếng Tráng được nói dọc theo sông Tả Giang, bao gồm các huyện Tiandeng, Daxin, Chongzuo, Ningming, Longzhou và Pingxiang ở Quảng
**Tiếng Lahnda** () hay còn gọi là **Lahndi** hoặc **Tây Punjab** (), là một ngôn ngữ Ấn-Aryan Tây Bắc nói ở Punjab, Pakistan và một số nơi ở Azad Kashmir và Khyber Pakhtunkhwa lân cận.
**Tiếng Swabia** () là một trong những nhóm phương ngữ của tiếng Đức Alemanni thuộc cụm phương ngữ Đức cao địa. Nó chủ yếu được nói ở Swabia, nằm ở trung tâm và đông nam
**Tiếng Rusyn** (tiếng Rusyn Carpathia: (), (); tiếng Rusyn Pannonia: (), còn được gọi trong tiếng Anh là **Ruthene** (đôi khi là **Ruthenia**), là một ngôn ngữ Đông Slav được nói bởi người Rusyn ở
**Tiếng Ná-Meo** (hay còn gọi là _tiếng Na Miểu_, _tiếng Na Miẻo_) là một ngôn ngữ của miền bắc Việt Nam, được nói bởi nhóm người Na Miẻo thuộc dân tộc H'Mông. Nguyễn Văn Thắng
Các thành phố lớn ở Hàn Quốc thường có một số khu chợ truyền thống, mỗi nhà cung cấp bán nhiều loại hàng hoá bao gồm trái cây, rau, thịt, cá, bánh mì, quần áo,
**Talossa**, tên chính thức **Vương quốc Talossa** (tiếng Anh: _Kingdom of Talossa_, tiếng Talossa: _Regipäts Talossan_, ) là một trong những vi quốc gia đầu tiên. Nó được thành lập vào năm 1979 bởi Robert
**Trường Đại học Tôn Đức Thắng** (TDTU) là một trường đại học công lập của Việt Nam. Trường trực thuộc Tổng Liên đoàn Lao động Việt Nam. Trường hoạt động theo cơ chế tự chủ
**Việt Nam**, quốc hiệu đầy đủ là **Cộng hòa xã hội chủ nghĩa Việt Nam**, là một quốc gia nằm ở cực Đông của bán đảo Đông Dương thuộc khu vực Đông Nam Á, giáp