Common Voice là một dự án crowdsourcing bắt đầu bởi Mozilla để tạo ra một cơ sở dữ liệu miễn phí cho phần mềm nhận dạng giọng nói. Dự án được hỗ trợ bởi các tình nguyện viên ghi lại các câu mẫu bằng micrô và duyệt lại các bản ghi âm của những người dùng khác. Các câu chép lại sẽ được thu thập trong một cơ sở dữ liệu bằng giọng nói phát hành theo giấy phép phạm vi công cộng CC0. Giấy phép này đảm bảo rằng các nhà phát triển có thể sử dụng cơ sở dữ liệu cho các ứng dụng thoại thành văn bản mà không bị hạn chế hoặc mất phí.
Common Voice xuất hiện như là sự đáp lại cho các trợ lý ngôn ngữ của các công ty lớn như Amazon Echo, Siri hoặc Trợ lý Google.
Mục đích
Common Voice nhằm mục đích cung cấp các mẫu giọng nói đa dạng. Theo Katharina Borchert của Mozilla, nhiều dự án hiện có đã lấy các bộ dữ liệu từ đài phát thanh công cộng hoặc nói cách khác là có các bộ dữ liệu không có nhiều giọng nói của phụ nữ hay của những người có giọng nói không chuẩn.
Cơ sở dữ liệu giọng nói
Cơ sở dữ liệu Common Voice tiếng Anh là cơ sở dữ liệu giọng nói có thể truy cập tự do lớn thứ hai sau LibriSpeech. Vào thời điểm dữ liệu đầu tiên được công bố vào ngày 29 tháng 11 năm 2017, hơn 20.000 người dùng trên toàn thế giới đã đăng ký 400.000 câu được xác thực, với tổng thời lượng 500 giờ.
Tháng 2 năm 2019, loạt ngôn ngữ đầu tiên được phát hành để sử dụng. Nó bao gồm 18 ngôn ngữ: tiếng Anh, tiếng Pháp, tiếng Đức và tiếng Quan thoại, nhưng cũng có các ngôn ngữ ít phổ biến hơn như tiếng Wales và tiếng Kabyle. Tổng cộng, nó bao gồm gần 1.400 giờ dữ liệu giọng nói được ghi lại từ hơn 42.000 người đóng góp.
👁️
1 | 🔗 | 💖 | ✨ | 🌍 | ⌚
**Common Voice** là một dự án crowdsourcing bắt đầu bởi Mozilla để tạo ra một cơ sở dữ liệu miễn phí cho phần mềm nhận dạng giọng nói. Dự án được hỗ trợ bởi các
thumb|Sáu [[Âm vị học tiếng Việt#Thanh điệu|thanh điệu tiếng Việt]] **Thanh điệu** () là việc sử dụng cao độ trong ngôn ngữ để phân biệt nghĩa từ vựng hoặc ngữ pháp—đó là, để phân biệt
**_808s & Heartbreak_** là album phòng thu thứ tư của rapper người Mỹ Kanye West, ra mắt vào ngày 24 tháng 11 năm 2008 bởi hãng Roc-A-Fella Records. Các phiên thu âm cho album diễn
**Tứ tấu đàn dây, Op. 50** (Hob. III/44–49, L. 36–41), là một tác phẩm sáng tác năm 1787 của nhà soạn nhạc Joseph Haydn. Bộ sáu tác phẩm tứ tấu này được sáng tác dành
**Mary Jane Blige** ( / b l aɪ ʒ / _BLYZHE_ ; sinh ngày 11 tháng 1 năm 1971) là một ca sĩ, nhạc sĩ và diễn viên người Mỹ. Thường được gọi là "
Đây là bài nhằm phân loại, sắp xếp theo chủ đề các bài trong lĩnh vực mật mã học. ## Các thuật toán mã hóa cổ điển * Mật mã khóa tự động [http://en.wikipedia.org/wiki/Autokey_cipher] *
Họ **Đồng (同)** là một họ của người Việt Nam. Biểu tượng của dòng họ Đồng tại Việt Nam ## Nguồn gốc họ Đồng Việt Nam Các triều đại phong kiến ở Việt Nam có
**Meghan Elizabeth Trainor** (sinh ngày 22 tháng 12 năm 1993) là một nữ ca sĩ và người viết bài hát người Mỹ. Nỗ lực của Trainor đã được công nhận với một vài giải thưởng
Đây là danh sách **Phần mềm mã nguồn mở**: là phần mềm máy tính được cấp phép giấy phép mã nguồn mở. Bài viết này không có tham vọng liệt kê tất cả những phần
**Belle** là một nhân vật hư cấu xuất hiện trong bộ phim hoạt hình chiếu rạp thứ 30 của Walt Disney Pictures, _Người đẹp và quái thú_ (1991). Nàng sau đó cũng xuất hiện trong
**_Faster, Pussycat! Kill! Kill!_** là một phim Mỹ thể loại phim khai thác, ra mắt năm 1965 của đạo diễn Russ Meyer, kịch bản viết bởi Meyer và Jack Moran. Cốt truyện xoay quanh 3
**_Nguyện vinh quang quy Hương Cảng_** (tiếng Trung: 願榮光歸香港, tiếng Anh: _Glory to Hong Kong_, dịch nghĩa: "Cầu vinh quang được trả về cho Hồng Kông") là một bài hát tiếng Quảng Đông được sáng