✨Biểu diễn dữ liệu
Thông tin và dữ liệu mà con người hiểu được tồn tại dưới nhiều dạng khác nhau, ví dụ như các số, các ký tự văn bản, âm thanh, hình ảnh... nhưng trong máy tính mọi thông tin và dữ liệu được biểu diễn bằng số nhị phân (chuỗi bit).
Nguyên tắc chung
Để đưa dữ liệu vào cho máy tính, cần phải mã hóa nó về dạng nhị phân. Với các kiểu dữ liệu khác nhau cần có cách mã hóa khác nhau. Cụ thể:
- Các dữ liệu dạng số (số nguyên hay số thực) sẽ được chuyển đổi trực tiếp thành các chuỗi nhị phân theo các chuẩn xác định.
- Các ký tự được mã hóa theo một bộ mã cụ thể, có nghĩa là mỗi ký tự sẽ tương ứng với một chuỗi số nhị phân.
- Các dữ liệu phi số khác như âm thanh, hình ảnh và nhiều đại lượng vật lý khác muốn đưa vào máy tinh phải số hóa (digitalizing)
Phân loại và biểu diễn
Tuy nhiên, mọi dữ liệu trong máy tính đều ở dạng nhị phân, song do bản chất của dữ liệu, người ta thường phân dữ liệu thành 2 dạng:
- Dạng cơ bản: gồm dạng số (số nguyên hay số thực) và dạng ký tự. :Số nguyên không dấu được biểu diễn theo dạng nhị phân thông thường. :Số nguyên có dấu theo mã bù hai :Số thực theo dạng dấu phẩy động.
Để biểu diễn một dữ liệu cơ bản, người ta sử dụng một số bit. Các bit này ghép lại với nhau để tạo thành từ: từ 8 bit, từ 16 bit...
- Dạng có cấu trúc: Trên cơ sở dữ liệu cơ bản, trong máy tính, người ta xây dựng nên các dữ liệu có cấu trúc phục vụ cho các mục đích sử dụng khác nhau.
Tùy theo cách "ghép" chúng ta có mảng, tập hợp, xâu (chuỗi), bản ghi...
👁️ 0 | 🔗 | 💖 | ✨ | 🌍 | ⌚
Thông tin và dữ liệu mà con người hiểu được tồn tại dưới nhiều dạng khác nhau, ví dụ như các số, các ký tự văn bản, âm thanh, hình ảnh... nhưng trong máy tính
Nói ban hành ngày 29 tháng 11 năm 2005, _Dữ liệu_ là thông tin dưới dạng ký hiệu, chữ viết, chữ số, hình ảnh, âm thanh hoặc dạng tương tự. Theo nghĩa rộng, _dữ liệu
**Dữ liệu nửa cấu trúc** (tiếng Anh: _Semi-structured data_) là loại dữ liệu tự mô tả và không có giản đồ (_schema_), nghĩa là không có mô tả riêng biệt về kiểu và cấu trúc
thumb|Một ví dụ về lấy dữ liệu đầu ra từ truy vấn cơ sở dữ liệu SQL. **Cơ sở dữ liệu** () là một tập hợp các dữ liệu có tổ chức liên quan đến
Trong viễn thông, tốc độ truyền dữ liệu là số bit trung bình (bitrate), ký tự hoặc ký hiệu (baudrate) hoặc khối dữ liệu trên mỗi đơn vị thời gian đi qua một liên kết
**Biểu diễn tri thức và suy luận** (**Knowledge representation and reasoning**, **KRR**, **KR&R**, **KR²**) là lĩnh vực của trí tuệ nhân tạo (AI) tập trung vào việc biểu diễn thông tin về thế giới dưới
nhỏ|Ví dụ về một cây nhị phân Trong khoa học máy tính, **cây** là một cấu trúc dữ liệu được sử dụng rộng rãi gồm một tập hợp các nút (tiếng Anh: _node_) được liên
thumb|Sự tăng trưởng và số hóa các khả năng lưu trữ thông tin trên toàn cầu **Dữ liệu lớn** (Tiếng Anh: **Big data**) là một thuật ngữ cho việc xử lý một tập hợp dữ
**Máy truy tìm dữ liệu trực tuyến** hay **máy tìm kiếm** hay **cỗ máy tìm kiếm** (tiếng Anh: _search engine_), hay còn được gọi với nghĩa rộng hơn là **công cụ tìm kiếm** (_search tool_),
nhỏ|Các loại dữ liệu có thể được hình dung thông qua một thiết bị máy tính **Dữ liệu **là chuỗi bất kỳ của một hoặc nhiều ký hiệu có ý nghĩa thông qua việc giải
nhỏ|Chân dung nhà toán học George Boole Trong khoa học máy tính, **kiểu dữ liệu Boolean** (tiếng Anh: _Boolean data type_) là một kiểu dữ liệu có một trong hai giá trị cụ thể (thường
thế=Sơ đồ luồng dữ liệu bao gồm lưu trữ dữ liệu, luồng dữ liệu, chức năng và giao diện.|nhỏ|387x387px|Sơ đồ luồng dữ liệu bao gồm lưu trữ dữ liệu, luồng dữ liệu, chức năng và
Trong khoa học máy tính, **cấu trúc dữ liệu mảng** hoặc **mảng** là một cấu trúc dữ liệu bao gồm một nhóm các phần tử giá trị hoặc biến, mỗi phần tử được xác định
**Mô hình cơ sở dữ liệu phân cấp** (tiếng Anh: hierarchical database model) là một loại mô hình dữ liệu, trong đó dữ liệu được tổ chức thành cấu trúc dạng cây. Dữ liệu được
**Siêu dữ liệu** (**_metadata_**) là dạng dữ liệu mô tả thông tin chi tiết về dữ liệu. Trong cơ sở dữ liệu, metadata là các sửa đổi dạng biểu diễn khác nhau của các đối
Trong khoa học máy tính, **cấu trúc dữ liệu cho các tập hợp không giao nhau** là một cấu trúc dữ liệu để lưu trữ một tập hợp các phần tử được phân chia thành
**Giảm chiều dữ liệu** (tiếng Anh: **dimensionality reduction**, hay **dimension reduction**), là sự biến đổi dữ liệu từ không gian chiều-cao thành không gian chiều-thấp để biểu diễn ở dạng chiều-thấp đồng thời giữ lại
**Kho dữ liệu** (tiếng Anh: _data warehouse_) là kho lưu trữ dữ liệu lưu trữ bằng thiết bị điện tử của một tổ chức. Các kho dữ liệu được thiết kế để hỗ trợ việc
phải|[[Isadora Duncan, một trong những người phát triển bộ môn múa tự do.]] **Nghệ thuật biểu diễn** là những hình thức nghệ thuật sử dụng cơ thể, tiếng nói và sự có mặt của chính
Một số ngôn ngữ lập trình cung cấp **kiểu dữ liệu phức** để lưu và thực hiện các phép toán số học số phức dưới dạng một kiểu dữ liệu có sẵn (cơ bản). Trong
**Ứng dụng cơ sở dữ liệu** là một chương trình máy tính có mục đích chính là nhập và truy xuất thông tin từ cơ sở dữ liệu được máy tính hóa. Ví dụ ban
**Truyền dữ liệu** hay **truyền dữ liệu số** hay **truyền thông số** là sự chuyển giao dữ liệu (một bit stream dữ liệu số hoặc một tín hiệu analog đã được số hóa) qua một
nhỏ| Trung tâm dữ liệu [[ARSAT (2014) ]] **Trung tâm dữ liệu** (tiếng Anh Mỹ: data center, hoặc tiếng Anh Anh: data centre), là một tòa nhà, không gian dành riêng trong tòa nhà hoặc
nhỏ|Xử lý dữ liệu **Xử lý dữ liệu** nói chung là việc thu thập dữ liệu và xử lý các mục dữ liệu để tạo thông tin có ý nghĩa." Theo khía cạnh này, có
nhỏ|Một ví dụ về cây phân loại CART **Khai phá dữ liệu** (_data mining_) Là quá trình tính toán để tìm ra các mẫu trong các bộ dữ liệu lớn liên quan đến các phương
**Đồng bộ hóa dữ liệu** là quá trình trao đổi giữa các thông tin với nhau và đồng bộ hóa thông tin giữa hai nguồn dữ liệu theo thời gian. Ứng dụng của đồng bộ
Đây là danh sách các cấu trúc dữ liệu. Bạn có thể xem danh sách thuật ngữ rộng hơn tại danh sách các thuật ngữ liên quan đến cấu trúc dữ liệu và giải thuật.
**Vụ bê bối dữ liệu Facebook–Cambridge Analytica** liên quan đến việc thu thập thông tin nhận dạng cá nhân của 87 triệu người sử dụng Facebook mà Cambridge Analytica bắt đầu thu thập vào năm
nhỏ|320x320px| Ví dụ về cơ sở dữ liệu hướng đối tượng **Cơ sở dữ liệu hướng đối** **tượng** (tiếng Anh: _object-oriented database_) là một hệ quản trị cơ sở dữ liệu mà ở đó dữ
Trong nhiều ngôn ngữ lập trình bắt nguồn từ C và Algol68, **kiểu void** (tiếng Anh: _void type_) là một kiểu kết quả của hàm nếu hàm này không trả về bất kì kết quả
**Nhà biểu diễn nhạc Walt Disney** (tiếng Anh: _Walt Disnney Concert Hall_) là một sảnh hòa nhạc ở số 111 Nam Grand Avenue Los Angeles, California, Hoa Kỳ. Công trình này là sảnh thứ tư
Trong trí tuệ nhân tạo, **khung** là một dạng cấu trúc dữ liệu, tức là cách mà thông tin được tổ chức, lưu trữ và truy cập. Ý tưởng của khung là chia nhỏ tri
Trong tin học, **dấu phẩy động** được dùng để chỉ một hệ thống biểu diễn số mà trong đó sử dụng một chuỗi chữ số (hay bit) để biểu diễn một số hữu tỉ. Thuật
**Tầng trình diễn** là tầng thứ sáu trong bảy tầng cấp của mô hình OSI. Tầng này đáp ứng những nhu cầu dịch vụ mà tầng ứng dụng đòi hỏi, đồng thời phát hành những
**Ủy ban Dữ liệu Khoa học và Công nghệ**, viết tắt theo tiếng Anh là **CODATA** (Committee on Data for Science and Technology) là một ủy ban liên kết đa ngành do Hội đồng Quốc
Mọi tổ chức cung cấp dịch vụ dữ liệu hiện nay đều chấp nhận thực tế rằng việc có thể quản lý dữ liệu tốt cùng với việc cho phép khách hàng quản lý dữ
Phân tích dữ liệu kinh doanh không còn là lựa chọn phụ trợ mà đã trở thành yếu tố cốt lõi trong vận hành và ra quyết định của doanh nghiệp hiện đại. Khi thông
Mọi tổ chức cung cấp dịch vụ dữ liệu hiện nay đều chấp nhận thực tế rằng việc có thể quản lý dữ liệu tốt cùng với việc cho phép khách hàng quản lý dữ
Mọi tổ chức cung cấp dịch vụ dữ liệu hiện nay đều chấp nhận thực tế rằng việc có thể quản lý dữ liệu tốt cùng với việc cho phép khách hàng quản lý dữ
nhỏ|phải|Quyết định bản chất nó là sự lựa chọn Trong lý thuyết quyết định (chẳng hạn quản lý rủi ro), một **cây quyết định** (tiếng Anh: _decision tree_) là một đồ thị của các quyết
**Tái tạo và thu thập dữ liệu 3D** là việc tạo ra các mô hình ba chiều hoặc không gian từ dữ liệu cảm biến. Các kỹ thuật và lý thuyết, nói chung, hoạt động
Ca sĩ người Mỹ Katy Perry đã phát hành sáu album phòng thu cũng như một album acoustic và hai album trực tiếp kể từ khi cô được ra mắt vào năm 2001. Những điều
Ô dù múa Nhật Bản tua rua retro, Ô dù trang trí, biểu diễn, chụp ảnh phong cách Nhật Bản - Màu đỏ- Văn hóa Nhật Bản là một nền văn hóa đáng ngưỡng mộ
Ô dù múa Nhật Bản tua rua retro, Ô dù trang trí, biểu diễn, chụp ảnh phong cách Nhật Bản- Văn hóa Nhật Bản là một nền văn hóa đáng ngưỡng mộ vì ở đây
**Tài liệu Panama** hay **Hồ sơ Panama** () là một bộ 11,5 triệu tài liệu mật được tạo ra bởi nhà cung cấp dịch vụ của công ty Panama Mossack Fonseca cung cấp thông tin
**Điền Dự** (chữ Hán: 田豫, 170-253), tự **Quốc Nhượng**, là tướng nhà Tào Ngụy thời Tam Quốc trong lịch sử Trung Quốc. ## Dưới quyền Lưu Bị Điền Dự có là người huyện Ung Nô,
nhỏ **Dù lượn**, tiếng Anh gọi là **Paragliding**, gọi theo tiếng Bồ Đào Nha, Tây Ban Nha và tiếng Pháp là **Parapent**, là một môn thể thao hàng không giải trí nhưng cũng không kém
Ngày nay, Big Data đã trở thành một thuật ngữ quen thuộc trong thế giới kinh doanh. Các doanh nghiệp đang không ngừng cải tiến, tìm kiếm cách khai thác và phân tích khối lượng
Ngày 13/8, tại xã Nghĩa Trụ (Hưng Yên), Hiệp hội Dữ liệu Quốc gia phối hợp với Đảng ủy, UBND xã khai giảng “Khóa đào tạo bình dân học vụ dữ liệu về AI và
Trong kiến trúc máy tính, **64-bit** là việc sử dụng bộ xử lý có chiều rộng đường dẫn, kích thước số nguyên, và độ rộng địa chỉ bộ nhớ là 64 bit (tám octet). Ngoài