✨Cơ sở dữ liệu thư mục

Cơ sở dữ liệu thư mục

Cơ sở dữ liệu thư mục (tiếng Anh: bibliographic database) là cơ sở dữ liệu chứa các biểu ghi thư mục, được tổ chức như một bộ sưu tập kỹ thuật số các tài liệu đã xuất bản, bao gồm các bài báo đăng trên tạp chí học thuật và báo viết, kỷ yếu hội thảo, báo cáo, xuất bản phẩm của chính phủ và xuất bản phẩm về pháp luật, bằng sáng chế, sách, vân vân. Trái với các mục trong biên mục thư viện, một lượng lớn biểu ghi thư mục trong cơ sở dữ liệu thư mục là để mô tả các bài viết hay tài liệu hội nghị,...thay vì mô tả các chuyên khảo đầy đủ; các biểu ghi này nhìn chung mô tả rất kỹ chủ thể dưới dạng chỉ mục hoặc tóm tắt nội dung (abstract).

Cơ sở dữ liệu thư mục có thể mang nội dung chung chung hoặc dành riêng cho một môn khoa học nào đó. Một số lượng đáng kể cơ sở dữ liệu thư mục hiện vẫn mang tính độc quyền, phải thông qua thỏa thuận cấp phép với bên cung cấp hoặc trực tiếp từ bên cung cấp dịch vụ indexing and abstracting tạo ra các cơ sở dữ liệu này.

Nhiều cơ sở dữ liệu thư mục đã phát triển thành các thư viện số, cung cấp toàn văn các nội dung được liệt kê trên đó. Số khác lại hợp với các cơ sở dữ liệu học thuật phi thư mục để trở thành các hệ thống truy tìm dữ liệu phức tạp, chẳng hạn Chemical Abstracts hoặc Entrez.

Lịch sử

Trước giữa thế kỷ 20, các cá nhân muốn tìm tài liệu đã xuất bản đều phải dựa vào các mục lục thư mục dạng in. Đầu thập niên 1960, máy tính lần đầu được dùng để số hóa văn bản nhằm giảm chi phí và thời gian để xuất bản hai tạp chí tóm tắt bài báo của Mỹ là Index Medicus (của Thư viện Quốc gia về Y học) và Scientific and Technical Aerospace Reports (của NASA). Từ đầu thập niên 1970, người ta bắt đầu thương mại hóa hoạt động truy cập. Tuy nhiên, truy cập còn đắt đỏ và phải được thực hiện thông qua nhân viên thư viện.

👁️ 1 | 🔗 | 💖 | ✨ | 🌍 | ⌚
**Cơ sở dữ liệu thư mục** (tiếng Anh: _bibliographic database_) là cơ sở dữ liệu chứa các biểu ghi thư mục, được tổ chức như một bộ sưu tập kỹ thuật số các tài liệu
**Danh sách cơ sở dữ liệu học thuật và công cụ tìm kiếm** chứa danh sách đại diện các cơ sở dữ liệu và công cụ tìm kiếm chính hữu ích trong môi trường học
thumb|Một ví dụ về lấy dữ liệu đầu ra từ truy vấn cơ sở dữ liệu SQL. **Cơ sở dữ liệu** () là một tập hợp các dữ liệu có tổ chức liên quan đến
Bảng sau đây so sánh các thông tin chung và chi tiết về kỹ thuật của các hệ thống quản trị cơ sở dữ liệu quan hệ. Nhắp chuột vào tên hệ thống để xem
**Cơ sở dữ liệu quan hệ** () là một cơ sở dữ liệu (phổ biến nhất là kỹ thuật số) dựa trên mô hình quan hệ dữ liệu, theo đề xuất của Edgar F. Codd
alt=MNIST sample images|thumb|Các ảnh mẫu từ tập thử nghiệm MNIST|320x320px **Cơ sở dữ liệu MNIST** (tiếng Anh: **MNIST database**, viết tắt từ _Modified National Institute of Standards and Technology database_) là một cơ sở dữ
thumb|Sự tăng trưởng và số hóa các khả năng lưu trữ thông tin trên toàn cầu **Dữ liệu lớn** (Tiếng Anh: **Big data**) là một thuật ngữ cho việc xử lý một tập hợp dữ
**Scopus** là một cơ sở dữ liệu thư mục chứa bản tóm tắt và trích dẫn các bài báo khoa học. Scopus có chứa hơn 82 triệu đầu mục từ hơn 11.000 nhà xuất bản,
nhỏ|Một ví dụ về cây phân loại CART **Khai phá dữ liệu** (_data mining_) Là quá trình tính toán để tìm ra các mẫu trong các bộ dữ liệu lớn liên quan đến các phương
**WorldCat** là một danh mục liên hợp trực tuyến, liệt kê các sưu tập của hàng chục ngàn thư viện ở nhiều quốc gia và vùng lãnh thổ tham gia vào hợp tác xã hội
**CiNii** () là một dịch vụ cơ sở dữ liệu thư mục cho tài liệu trong các thư viện học thuật Nhật Bản, đặc biệt tập trung vào các ấn phẩm tiếng Nhật và tiếng
**Quản trị tiếp thị bằng cơ sở dữ liệu** (tiếng Anh: **Database Marketing**) là một hình thức tiếp thị trực tiếp dến khách hàng (tiếng Anh: direct marketing). Cách tiếp thị này sử dụng các
**PubMed Central** là cơ sở dữ liệu thư mục chứa các tài liệu khoa học toàn văn viết về y sinh và khoa học sự sống. Cơ sở dữ liệu này phát triển dựa trên
**Cơ sở Thông tin Đa dạng Sinh học Toàn cầu**, viết tắt theo tiếng Anh là **GBIF**, là một tổ chức quốc tế có nhiệm vụ thu thập và tổng hợp thông tin về đa
## Khái niệm dữ liệu thứ cấp Dữ liệu thứ cấp là dữ liệu đã có sẵn, không phải do mình thu thập, đã công bố nên dễ thu thập, ít tốn thời gian, tiền
**Bảng tra cứu dãy số nguyên trực tuyến** (_The On-Line Encyclopedia of Integer Sequences_), hay đơn giản là **Sloane's**, là cơ sở dữ liệu chuỗi số nguyên trực tuyến. Bảng được tạo ra và bảo
**Rò rỉ dữ liệu** hay **vi phạm dữ liệu**, **lộ dữ liệu** là "việc tiết lộ, công khai hoặc làm mất thông tin cá nhân một cách trái phép". Kẻ tấn công có nhiều động
**Máy truy tìm dữ liệu trực tuyến** hay **máy tìm kiếm** hay **cỗ máy tìm kiếm** (tiếng Anh: _search engine_), hay còn được gọi với nghĩa rộng hơn là **công cụ tìm kiếm** (_search tool_),
**Cục Chuyển đổi số và Thông tin dữ liệu tài nguyên môi trường** là cơ quan trực thuộc Bộ Tài nguyên và Môi trường, có chức năng tham mưu, giúp Bộ trưởng thống nhất quản
**MEDLINE** (hay **Medline**, viết tắt tiếng Anh của _Medical Literature Analysis and Retrieval System Online_) là một cơ sở dữ liệu hỗn hợp của các ngành khoa học sự sống và y sinh học. Các
phải|192|[[Cây nhị phân, một kiểu đơn giản của cấu trúc dữ liệu liên kết rẽ nhánh.]] thumb|right|Bảng băm Trong khoa học máy tính, **cấu trúc dữ liệu** là một cách lưu dữ liệu trong máy
**Xử lý dữ liệu điện tử** có thể đề cập đến việc sử dụng các phương pháp tự động để xử lý dữ liệu thương mại. Thông thường, điều này sử dụng các hoạt động
Ngày nay, Big Data đã trở thành một thuật ngữ quen thuộc trong thế giới kinh doanh. Các doanh nghiệp đang không ngừng cải tiến, tìm kiếm cách khai thác và phân tích khối lượng
**Viện Thông tin Khoa học** (Institute for Scientific Information, viết tắt: **ISI**) được thành lập bởi Eugene Garfield vào năm 1960. ISI được Thomson Scientific & Healthcare mua lại vào năm 1992, được biết đến
**Tập dữ liệu COVID-19** là các cơ sở dữ liệu công khai nhằm chia sẻ dữ liệu các ca bệnh và thông tin y tế liên quan đến đại dịch COVID-19. ## Dữ liệu tổng
**Siêu dữ liệu** (**_metadata_**) là dạng dữ liệu mô tả thông tin chi tiết về dữ liệu. Trong cơ sở dữ liệu, metadata là các sửa đổi dạng biểu diễn khác nhau của các đối
**Danh mục Trích dẫn Khoa học** (**Science Citation Index**, viết tắt: **SCI**) là một danh mục trích dẫn do Viện Thông tin Khoa học (Institute for Scientific Information, viết tắt: ISI) xuất bản lần đầu
**Web of Science** (trước đây gọi là **Web of Knowledge**) là một dịch vụ lập chỉ mục trích dẫn khoa học đăng ký trực tuyến do Viện Thông tin Khoa học (ISI, Institute for Scientific
**PubMed** là một cơ sở dữ liệu miễn phí truy cập chủ yếu qua cơ sở dữ liệu MEDLINE về các tài liệu tham khảo và tóm tắt về các chủ đề khoa học đời
**Zentralblatt MATH** (tiếng Đức có nghĩa "tạp chí toán học trung ương") là một dịch vụ cung cấp các ý kiến và tóm tắt các bài báo trong toán học cơ bản và toán học
**Truy cập dữ liệu** là một thuật ngữ chung đề cập đến một quy trình có cả ý nghĩa cụ thể về CNTT và các ý nghĩa khác liên quan đến quyền truy cập theo
**Dự án Phả hệ Toán học** (**Mathematics Genealogy Project**) là một cơ sở dữ liệu nền tảng web dành cho mối liên hệ giữa các thế hệ các nhà toán học. Đến tháng 10 năm
**Ủy ban HUGO về danh mục gen** viết tắt là HGNC (HUGO Gene Nomenclature Committee) là một _ủy ban của HUGO_, một _tổ chức phi chính phủ và phi lợi nhuận quốc tế_, đảm nhận
**Bảo vệ dữ liệu cá nhân** khởi đầu dùng để chỉ việc bảo vệ dữ liệu có liên quan đến cá nhân trước sự lạm dụng. Trong vùng nói tiếng Anh người ta gọi đó
**EBSCO Information Services**, có trụ sở tại Ipswich, Massachusetts, là một phần của EBSCO Industries Inc., một công ty tư nhân có trụ sở tại Birmingham, Alabama. EBSCO cung cấp sản phẩm và dịch vụ
nhỏ|Xử lý dữ liệu **Xử lý dữ liệu** nói chung là việc thu thập dữ liệu và xử lý các mục dữ liệu để tạo thông tin có ý nghĩa." Theo khía cạnh này, có
**Xóa dữ liệu** (còn được gọi là **hủy dữ liệu**, ) là phương pháp của phần mềm xóa dữ liệu nhằm mục đích xóa hoàn toàn tất cả dữ liệu trên ổ đĩa cứng hoặc
**ADOdb** là một thư viện ở mức trừu tượng dành cho PHP và Python dựa trên cùng khái niệm với ActiveX Data Objects của Microsoft. Nó cho phép nhà phát triển (developer) viết các ứng
Trong hoạt động tính toán máy tính, **dữ liệu liên kết** mô tả một phương thức tạo ra dữ liệu có cấu trúc để có thể liên kết được với nhau và trở nên có
Trong công nghệ thông tin, **Nén dữ liệu** (tiếng Anh: _Data compression_) là việc chuyển định dạng thông tin sử dụng ít bit hơn cách thể hiện ở dữ liệu gốc. Tùy theo dữ liệu
PaaS là một dịch vụ trong điện toán đám mây cung cấp nền tảng phát triển ứng dụng, gồm hệ điều hành, phần mềm trung gian, cơ sở dữ liệu...Bạn là nhà phát triển hay
nhỏ| [[Ổ đĩa cứng|Ổ cứng lưu trữ thông tin ở dạng nhị phân và do đó được coi là một loại phương tiện kỹ thuật số vật lý. ]] **Phương tiện truyền thông kỹ thuật
**GameFAQs** là một website chứa đựng những câu hỏi đáp thường gặp (FAQ) và hướng dẫn dành cho video game. Website do Jeff Veasey tạo ra vào tháng 11 năm 1995 và được CNET Networks
nhỏ|Ví dụ về một cây nhị phân Trong khoa học máy tính, **cây** là một cấu trúc dữ liệu được sử dụng rộng rãi gồm một tập hợp các nút (tiếng Anh: _node_) được liên
**Internet Movie Database** (**IMDb** - cơ sở dữ liệu điện ảnh trên Internet) là một trang cơ sở dữ liệu trực tuyến về điện ảnh thế giới. Nó cung cấp thông tin về phim, diễn
Cơ sở dữ liệu **NoSQL** (tên gốc là "Non SQL" (phi SQL) hoặc "non relational" (phi quan hệ)) cung cấp một cơ chế để lưu trữ và truy xuất dữ liệu được mô hình hóa
Phân tích dữ liệu kinh doanh không còn là lựa chọn phụ trợ mà đã trở thành yếu tố cốt lõi trong vận hành và ra quyết định của doanh nghiệp hiện đại. Khi thông
[[Tập tin:SQL data types.png|nhỏ|Các kiểu dữ liệu trong ngôn ngữ SQL, một trong những ngôn ngữ truy vấn phổ biến nhất với các lập trình viên. ]] **_Ngôn ngữ truy vấn_** () là tên gọi
**Tái tạo và thu thập dữ liệu 3D** là việc tạo ra các mô hình ba chiều hoặc không gian từ dữ liệu cảm biến. Các kỹ thuật và lý thuyết, nói chung, hoạt động
**eBird** là một cơ sở dữ liệu trực tuyến về các quan sát chim, cung cấp cho các nhà khoa học, nhà nghiên cứu và nhà tự nhiên học nghiệp dư dữ liệu thời gian