Nói ban hành ngày 29 tháng 11 năm 2005, Dữ liệu là thông tin dưới dạng ký hiệu, chữ viết, chữ số, hình ảnh, âm thanh hoặc dạng tương tự.
Theo nghĩa rộng, dữ liệu thô là các số, ký tự, hình ảnh hay các kết quả khác của các thiết bị chuyển đổi các lượng vật lý thành các ký hiệu. Các dữ liệu thuộc loại này thường được xử lý tiếp bởi người hoặc đưa vào máy tính. Trong máy tính, dữ liệu được lưu trữ và xử lý tại đó hoặc được chuyển (output) cho một người hoặc một máy tính khác. Dữ liệu thô là một thuật ngữ tương đối; việc xử lý dữ liệu thường được thực hiện theo từng bước, và "dữ liệu đã được xử lý" tại bước này có thể được coi là "dữ liệu thô" cho bước tiếp theo.
Các thiết bị tính toán được phân loại theo phương tiện mà chúng sử dụng để biểu diễn dữ liệu. Một máy tính tương tự (analog computer) biểu diễn dữ liệu bằng hiệu điện thế, khoảng cách, vị trí hoặc các định lượng vật lý khác. Một máy tính số (digital computer) biểu diễn dữ liệu bằng chuỗi các ký hiệu rút ra từ một bảng chữ cái cố định. Các máy tính số phổ biến nhất sử dụng bảng chữ cái nhị phân, nghĩa là, một bảng chữ cái gồm hai chữ cái, thường được ký hiệu là "0" và "1". Các biểu diễn quen thuộc hơn, chẳng hạn các số và chữ, sẽ được xây dựng từ bảng chữ cái nhị phân.
Có một số dạng dữ liệu đặc biệt. Một chương trình máy tính là một tập hợp dữ liệu được hiểu là các lệnh. Hầu hết các ngôn ngữ máy tính phân biệt giữa các chương trình và các dữ liệu khác mà chương trình đó làm việc với. Nhưng trong một số ngôn ngữ, chẳng hạn LISP và các ngôn ngữ tương tự, các chương trình về bản chất là không thể phân biệt với các dữ liệu khác. Ngoài ra, còn có một dạng dữ liệu đặc biệt khác là metadata dữ liệu mêta, nghĩa là một mô tả về dữ liệu khác. Một ví dụ về dữ liệu meta là danh mục tài liệu tại thư viện, đây là một mô tả về nội dung của các cuốn sách.
👁️
1 | 🔗 | 💖 | ✨ | 🌍 | ⌚
thumb|Một ví dụ về lấy dữ liệu đầu ra từ truy vấn cơ sở dữ liệu SQL. **Cơ sở dữ liệu** () là một tập hợp các dữ liệu có tổ chức liên quan đến
thumb|Sự tăng trưởng và số hóa các khả năng lưu trữ thông tin trên toàn cầu **Dữ liệu lớn** (Tiếng Anh: **Big data**) là một thuật ngữ cho việc xử lý một tập hợp dữ
**Bảo vệ dữ liệu cá nhân** khởi đầu dùng để chỉ việc bảo vệ dữ liệu có liên quan đến cá nhân trước sự lạm dụng. Trong vùng nói tiếng Anh người ta gọi đó
**Siêu dữ liệu không gian địa lý** () là các dữ liệu nhằm mô tả dữ liệu GIS. Thông thường trước khi sử dụng một loại dữ liệu GIS nào đó để thực hiện một
**Kho dữ liệu** (tiếng Anh: _data warehouse_) là kho lưu trữ dữ liệu lưu trữ bằng thiết bị điện tử của một tổ chức. Các kho dữ liệu được thiết kế để hỗ trợ việc
nhỏ|Các loại dữ liệu có thể được hình dung thông qua một thiết bị máy tính **Dữ liệu **là chuỗi bất kỳ của một hoặc nhiều ký hiệu có ý nghĩa thông qua việc giải
**Xóa dữ liệu** (còn được gọi là **hủy dữ liệu**, ) là phương pháp của phần mềm xóa dữ liệu nhằm mục đích xóa hoàn toàn tất cả dữ liệu trên ổ đĩa cứng hoặc
**Rò rỉ dữ liệu** hay **vi phạm dữ liệu**, **lộ dữ liệu** là "việc tiết lộ, công khai hoặc làm mất thông tin cá nhân một cách trái phép". Kẻ tấn công có nhiều động
Trong lĩnh vực điện toán**, Khôi phục dữ liệu** (hay **Phục hồi dữ liệu**) là quá trình sử dụng các thiết bị, phần mềm lấy lại dữ liệu từ bị hư hỏng, lỗi hoặc bị
## Khái niệm dữ liệu thứ cấp Dữ liệu thứ cấp là dữ liệu đã có sẵn, không phải do mình thu thập, đã công bố nên dễ thu thập, ít tốn thời gian, tiền
**Hệ thống quản lý cơ sở dữ liệu hoạt động** (còn gọi là OLTP Trên cơ sở dữ liệu Transaction Processing Line), được sử dụng để quản lý Dữ liệu động trong thời gian thực.
**Tập dữ liệu COVID-19** là các cơ sở dữ liệu công khai nhằm chia sẻ dữ liệu các ca bệnh và thông tin y tế liên quan đến đại dịch COVID-19. ## Dữ liệu tổng
nhỏ|Một ví dụ về cây phân loại CART **Khai phá dữ liệu** (_data mining_) Là quá trình tính toán để tìm ra các mẫu trong các bộ dữ liệu lớn liên quan đến các phương
**Siêu dữ liệu** (**_metadata_**) là dạng dữ liệu mô tả thông tin chi tiết về dữ liệu. Trong cơ sở dữ liệu, metadata là các sửa đổi dạng biểu diễn khác nhau của các đối
**Máy truy tìm dữ liệu trực tuyến** hay **máy tìm kiếm** hay **cỗ máy tìm kiếm** (tiếng Anh: _search engine_), hay còn được gọi với nghĩa rộng hơn là **công cụ tìm kiếm** (_search tool_),
phải|192|[[Cây nhị phân, một kiểu đơn giản của cấu trúc dữ liệu liên kết rẽ nhánh.]] thumb|right|Bảng băm Trong khoa học máy tính, **cấu trúc dữ liệu** là một cách lưu dữ liệu trong máy
Trong hoạt động tính toán máy tính, **dữ liệu liên kết** mô tả một phương thức tạo ra dữ liệu có cấu trúc để có thể liên kết được với nhau và trở nên có
nhỏ|phải|Mô hình dữ liệu đám mây **Dữ liệu đám mây** hay **Cơ sở dữ liệu đám mây** (_Cloud database_) là một cơ sở dữ liệu thường được chạy vận hành trên nền tảng điện toán
**Cơ sở dữ liệu quan hệ** () là một cơ sở dữ liệu (phổ biến nhất là kỹ thuật số) dựa trên mô hình quan hệ dữ liệu, theo đề xuất của Edgar F. Codd
nhỏ|Xử lý dữ liệu **Xử lý dữ liệu** nói chung là việc thu thập dữ liệu và xử lý các mục dữ liệu để tạo thông tin có ý nghĩa." Theo khía cạnh này, có
**Trao đổi dữ liệu điện tử** (Electronic Data Interchange - EDI) là sự truyền thông tin từ máy tính gửi đến máy tính nhận bằng phương tiện điện tử, trong đó có sử dụng một
**Tích hợp dữ liệu** liên quan đến việc kết hợp dữ liệu cư trú trong các nguồn khác nhau và cung cấp cho người dùng một cái nhìn thống nhất về chúng. Quá trình này
nhỏ| Ví dụ về thu thập dữ liệu trong khoa học sinh học: [[Chim cánh cụt Adélie được xác định và được cân mỗi khi chúng đi qua cầu cân tự động trên đường đến
**Máy chủ cơ sở dữ liệu** (_database server_) là một máy chủ sử dụng ứng dụng cơ sở dữ liệu cung cấp các dịch vụ cơ sở dữ liệu cho các chương trình máy tính
**Giao dịch cơ sở dữ liệu** (_database transaction_) là đơn vị tương tác của một hệ quản lý cơ sở dữ liệu hoặc các hệ tương tự, mỗi giao dịch được xử lý một cách
**Đồng bộ hóa dữ liệu** là quá trình trao đổi giữa các thông tin với nhau và đồng bộ hóa thông tin giữa hai nguồn dữ liệu theo thời gian. Ứng dụng của đồng bộ
Trong công nghệ thông tin, **Nén dữ liệu** (tiếng Anh: _Data compression_) là việc chuyển định dạng thông tin sử dụng ít bit hơn cách thể hiện ở dữ liệu gốc. Tùy theo dữ liệu
Nói ban hành ngày 29 tháng 11 năm 2005, _Dữ liệu_ là thông tin dưới dạng ký hiệu, chữ viết, chữ số, hình ảnh, âm thanh hoặc dạng tương tự. Theo nghĩa rộng, _dữ liệu
nhỏ|phải|Bảo mật dữ liệu **Bảo mật dữ liệu** (_Data security_) hay còn gọi là **An ninh dữ liệu** có nghĩa là bảo vệ dữ liệu kỹ thuật số (chẳng hạn như dữ liệu nằm trong
thumb|Quy trình mô hình hóa dữ liệu. Hình ảnh minh họa cách mô hình dữ liệu được phát triển và sử dụng ngày nay. Một [[sơ đồ khái niệm|mô hình dữ liệu khái niệm được
**Dữ liệu sơ cấp** là những dữ liệu chưa có sẵn, được thu thập lần đầu, do chính người nghiên cứu thu thập. Trong thực tế, khi dữ liệu thứ cấp không đáp ứng được
**Quy định bảo vệ dữ liệu chung** (GDPR) (EU) 2016/679 là quy định của luật EU về bảo vệ dữ liệu và quyền riêng tư cho tất cả các cá nhân trong Liên minh châu
**Xử lý dữ liệu điện tử** có thể đề cập đến việc sử dụng các phương pháp tự động để xử lý dữ liệu thương mại. Thông thường, điều này sử dụng các hoạt động
thế=Sơ đồ luồng dữ liệu bao gồm lưu trữ dữ liệu, luồng dữ liệu, chức năng và giao diện.|nhỏ|387x387px|Sơ đồ luồng dữ liệu bao gồm lưu trữ dữ liệu, luồng dữ liệu, chức năng và
**Mô hình cơ sở dữ liệu phân cấp** (tiếng Anh: hierarchical database model) là một loại mô hình dữ liệu, trong đó dữ liệu được tổ chức thành cấu trúc dạng cây. Dữ liệu được
**Phân tích dữ liệu** là một quá trình kiểm tra, làm sạch, chuyển đổi và mô hình hóa dữ liệu với mục tiêu khám phá thông tin hữu ích, thông báo kết luận và hỗ
nhỏ| [[RNA là một phương tiện lưu trữ trong sinh học. ]] nhỏ|Các thiết bị lưu trữ điện tử khác nhau nhỏ|Máy ghi âm xi lanh Edison, khoảng năm 1899. Các xi lanh ghi âm
**Quản lý dữ liệu** bao gồm tất cả các ngành liên quan đến quản lý dữ liệu như một tài nguyên có giá trị. ## Khái niệm Khái niệm quản lý dữ liệu xuất hiện
nhỏ| Trung tâm dữ liệu [[ARSAT (2014) ]] **Trung tâm dữ liệu** (tiếng Anh Mỹ: data center, hoặc tiếng Anh Anh: data centre), là một tòa nhà, không gian dành riêng trong tòa nhà hoặc
**Ứng dụng cơ sở dữ liệu** là một chương trình máy tính có mục đích chính là nhập và truy xuất thông tin từ cơ sở dữ liệu được máy tính hóa. Ví dụ ban
**Giảm chiều dữ liệu** (tiếng Anh: **dimensionality reduction**, hay **dimension reduction**), là sự biến đổi dữ liệu từ không gian chiều-cao thành không gian chiều-thấp để biểu diễn ở dạng chiều-thấp đồng thời giữ lại
**Bộ nhớ máy tính** (tiếng Anh: Computer data storage), thường được gọi là ổ nhớ (_storage_) hoặc bộ nhớ (_memory_), là một thiết bị công nghệ bao gồm các phần tử máy tính và lưu
Chuẩn hóa cơ sở dữ liệu là một phương pháp khoa học để phân tách (scientific method of breaking down) một bảng có cấu trúc phức tạp (complex table structures) thành những bảng có cấu
nhỏ|Ví dụ về một cây nhị phân Trong khoa học máy tính, **cây** là một cấu trúc dữ liệu được sử dụng rộng rãi gồm một tập hợp các nút (tiếng Anh: _node_) được liên
Thông tin và dữ liệu mà con người hiểu được tồn tại dưới nhiều dạng khác nhau, ví dụ như các số, các ký tự văn bản, âm thanh, hình ảnh... nhưng trong máy tính
**Dữ liệu nửa cấu trúc** (tiếng Anh: _Semi-structured data_) là loại dữ liệu tự mô tả và không có giản đồ (_schema_), nghĩa là không có mô tả riêng biệt về kiểu và cấu trúc
Đây là danh sách các cấu trúc dữ liệu. Bạn có thể xem danh sách thuật ngữ rộng hơn tại danh sách các thuật ngữ liên quan đến cấu trúc dữ liệu và giải thuật.
**Vụ bê bối dữ liệu Facebook–Cambridge Analytica** liên quan đến việc thu thập thông tin nhận dạng cá nhân của 87 triệu người sử dụng Facebook mà Cambridge Analytica bắt đầu thu thập vào năm
Một **hệ thống xử lý dữ liệu** là sự kết hợp giữa máy móc, con người và các quá trình cho một bộ đầu vào tạo ra một tập các kết quả xác định. Các
**Tính nhất quán** (tiếng Anh: consistency) trong hệ thống cơ sở dữ liệu là yêu cầu rằng giao dịch cơ sở dữ liệu đã cho bất kỳ chỉ có thể thay đổi dữ liệu theo