✨Công cụ truy vấn dữ liệu

Công cụ truy vấn dữ liệu

Công cụ truy vấn dữ liệu, tên ngắn hơn là công cụ tìm kiếm (tiếng Anh: search engine), là một loại chương trình tiện ích được nhiều trang Web hay các phần mềm ứng dụng hỗ trợ nhằm giúp cho người dùng có thể tìm kiếm cụm từ, bài viết, đề tài, tập tin, hay dữ liệu được cung cấp bởi trang Web (hay bởi chính phần mềm ứng dụng) đó một cách nhanh chóng và đầy đủ hơn.

Hình thức

Về hình thức thì thường một công cụ tìm kiếm thường được đặt chung với GUI (giao diện đồ họa) trong một khung riêng hay trong một menu. Phần chính của công cụ này là một khung chữ (hay hộp chữ, tiếng Anh: text box).

Để kiếm một cụm từ, đề tài, bài viết, hay dữ liệu thì người dùng chỉ cần gõ vào đó các từ hay cụm từ liên quan. Cụm từ này được gọi là từ khoá (keyword).

Sau khi nhấn nút ra lệnh (search) thì trang Web sẽ trả về danh sách các trang WEB hay trang mà nội dung có chứa từ khoá. Nếu không tìm ra thì hoặc sẽ báo lỗi hoặc hiển thông báo không tìm thấy và yêu cầu người dùng thực hiện những bước khác.

Công cụ tìm kiếm có thể chỉ đơn giản tìm các cụm từ trong các tựa bài viết hay phức tạp hơn là được hỗ trợ bằng các máy truy tìm mà đa số là dùng Google.

Tuỳ theo sự phát triển về phần mềm của công cụ tìm kiếm, nó có thể có những hỗ trợ đặc biệt. Một số công cụ tìm kiếm có khả năng truy tìm một lần nhiều cụm từ hay tìm các cụm từ thoả mãn các điều kiện khác nhau. Trong trường hợp này thì hỗ trợ thường được tăng cường bởi các phép toán. Chẳng hạn, người ta có thể kiếm các bài viết phải có mặt hai cụm từ cùng một lúc qua phép toán lôgic AND (còn được biết là phép toán lôgic +).

Vài thí dụ

phải|Công cụ tìm kiếm của Microsoft Windows.

  • Công cụ tìm kiếm kiếm của Wikipedia: Chỉ tìm ra tên tựa bài của văn bản nào trùng hợp với từ khoá.
  • Công cụ tìm kiếm của phần mềm ứng dụng Microsoft Word: để mở công cụ tìm kiếm, người dùng có thể nhấp chuột lên menu"Edit"rồi chọn menu con"Find". Công cụ này chỉ cho phép tìm kiếm cụm từ nội bên trong một hồ sơ văn bản.
  • Công cụ tìm kiếm của hệ điều hành Microsoft Windows và Adobe Reader: Cả hai công cụ này cho phép kiếm các hồ sơ có chứa từ khoá trong một hồ sơ, một thư mục hay trong tất cả các ổ đĩa của máy tính.

Cơ chế hoạt động

Do sự khác nhau về chức năng và mụch đích của công cụ truy tìm. cơ chế hoạt động của các công cụ tìm kiếm có thể khác nhau ít nhiều. Tuy nhiên, nguyên tắc chung vẫn là:

  • Công cụ tìm kiếm sẽ dựa trên một cơ sở dữ liệu.
  • Cơ sở dữ liệu này được thiết lập từ tất cả các từ có mặt trong các tệp hay các bài văn bản bằng cách chỉ số hoá (indexing) các từ đó.
  • Khi có một yêu cầu (request) thì công cụ tìm kiếm sẽ dựa trên các chỉ số tương ứng và truy ngược về văn bản nguồn. Đồng thời máy có thể dùng thêm các thuật toán chuyên biệt để phân định số lần xuất hiện của một từ hay một cụm từ trong các văn bản để dùng cho phân loại, xếp hạng hay hỗ trợ các phép toán.
  • Trường hợp công cụ truy tìm không thể tìm ra đáp án thì nó có thể trả lời bằng cách báo lỗi hay có những phương thức xử lý khác tuỳ theo nhu cầu của người thiết kế phần mềm.

Phân biệt với

  • Máy truy tìm dữ liệu
👁️ 1 | 🔗 | 💖 | ✨ | 🌍 | ⌚
**Công cụ truy vấn dữ liệu**, tên ngắn hơn là **công cụ tìm kiếm** (tiếng Anh: _search engine_), là một loại chương trình tiện ích được nhiều trang Web hay các phần mềm ứng dụng
**Máy truy tìm dữ liệu trực tuyến** hay **máy tìm kiếm** hay **cỗ máy tìm kiếm** (tiếng Anh: _search engine_), hay còn được gọi với nghĩa rộng hơn là **công cụ tìm kiếm** (_search tool_),
thumb|Một ví dụ về lấy dữ liệu đầu ra từ truy vấn cơ sở dữ liệu SQL. **Cơ sở dữ liệu** () là một tập hợp các dữ liệu có tổ chức liên quan đến
thumb|Sự tăng trưởng và số hóa các khả năng lưu trữ thông tin trên toàn cầu **Dữ liệu lớn** (Tiếng Anh: **Big data**) là một thuật ngữ cho việc xử lý một tập hợp dữ
[[Tập tin:SQL data types.png|nhỏ|Các kiểu dữ liệu trong ngôn ngữ SQL, một trong những ngôn ngữ truy vấn phổ biến nhất với các lập trình viên. ]] **_Ngôn ngữ truy vấn_** () là tên gọi
Trong lĩnh vực điện toán**, Khôi phục dữ liệu** (hay **Phục hồi dữ liệu**) là quá trình sử dụng các thiết bị, phần mềm lấy lại dữ liệu từ bị hư hỏng, lỗi hoặc bị
**Search Engine Optimization - Tối ưu hóa công cụ tìm kiếm (SEO)** là quá trình tăng chất lượng và lưu lượng truy cập website bằng cách tăng khả năng hiển thị của website hoặc webpage
**Rò rỉ dữ liệu** hay **vi phạm dữ liệu**, **lộ dữ liệu** là "việc tiết lộ, công khai hoặc làm mất thông tin cá nhân một cách trái phép". Kẻ tấn công có nhiều động
**Cốc Cốc** là công cụ tìm kiếm mặc đị ## Lịch sử ### Những ngày đầu Cốc Cốc khởi đầu là một dự án của ba sinh viên Việt Nam khi đang theo học Đại
**Tích hợp dữ liệu** liên quan đến việc kết hợp dữ liệu cư trú trong các nguồn khác nhau và cung cấp cho người dùng một cái nhìn thống nhất về chúng. Quá trình này
nhỏ|Search Engine Results Pages - SERP **Trang kết quả của công cụ tìm kiếm** (**Search Engine Results Pages -** **SERP**) là các trang được hiển thị bởi các công cụ tìm kiếm để đáp lại
**Bộ nhớ máy tính** (tiếng Anh: Computer data storage), thường được gọi là ổ nhớ (_storage_) hoặc bộ nhớ (_memory_), là một thiết bị công nghệ bao gồm các phần tử máy tính và lưu
**DuckDuckGo** là một công cụ truy vấn dữ liệu Internet đặt trọng tâm vào việc bảo vệ sự riêng tư người tìm kiếm và không cung cấp thông tin người dùng. DuckDuckGo nhấn mạnh lấy
**Xóa dữ liệu** (còn được gọi là **hủy dữ liệu**, ) là phương pháp của phần mềm xóa dữ liệu nhằm mục đích xóa hoàn toàn tất cả dữ liệu trên ổ đĩa cứng hoặc
**Kho dữ liệu** (tiếng Anh: _data warehouse_) là kho lưu trữ dữ liệu lưu trữ bằng thiết bị điện tử của một tổ chức. Các kho dữ liệu được thiết kế để hỗ trợ việc
**Xử lý dữ liệu điện tử** có thể đề cập đến việc sử dụng các phương pháp tự động để xử lý dữ liệu thương mại. Thông thường, điều này sử dụng các hoạt động
Trí tuệ nhân tạo đang dần thay đổi cách chúng ta làm việc, học tập và sáng tạo. Ngoài ChatGPT – công cụ nổi tiếng của OpenAI, còn rất nhiều công cụ khác đang được
**Trao đổi dữ liệu điện tử** (Electronic Data Interchange - EDI) là sự truyền thông tin từ máy tính gửi đến máy tính nhận bằng phương tiện điện tử, trong đó có sử dụng một
Trong thời đại công nghệ số, dữ liệu đã trở thành một trong những tài sản quý giá nhất của doanh nghiệp. Việc quản lý và khai thác hiệu quả dữ liệu không chỉ giúp
**Tập dữ liệu COVID-19** là các cơ sở dữ liệu công khai nhằm chia sẻ dữ liệu các ca bệnh và thông tin y tế liên quan đến đại dịch COVID-19. ## Dữ liệu tổng
**MEDLINE** (hay **Medline**, viết tắt tiếng Anh của _Medical Literature Analysis and Retrieval System Online_) là một cơ sở dữ liệu hỗn hợp của các ngành khoa học sự sống và y sinh học. Các
Trong công nghệ thông tin, **Nén dữ liệu** (tiếng Anh: _Data compression_) là việc chuyển định dạng thông tin sử dụng ít bit hơn cách thể hiện ở dữ liệu gốc. Tùy theo dữ liệu
**Vụ bê bối dữ liệu Facebook–Cambridge Analytica** liên quan đến việc thu thập thông tin nhận dạng cá nhân của 87 triệu người sử dụng Facebook mà Cambridge Analytica bắt đầu thu thập vào năm
nhỏ| Trung tâm dữ liệu [[ARSAT (2014) ]] **Trung tâm dữ liệu** (tiếng Anh Mỹ: data center, hoặc tiếng Anh Anh: data centre), là một tòa nhà, không gian dành riêng trong tòa nhà hoặc
Trong hoạt động tính toán máy tính, **dữ liệu liên kết** mô tả một phương thức tạo ra dữ liệu có cấu trúc để có thể liên kết được với nhau và trở nên có
nhỏ|Một phóng viên đang ghi hình và âm thanh **Ghi dữ liệu** là quá trình ghi lại dữ liệu hoặc biến đổi thông tin sang một định dạng nào đó để lưu trữ trên một
**Tài liệu Panama** hay **Hồ sơ Panama** () là một bộ 11,5 triệu tài liệu mật được tạo ra bởi nhà cung cấp dịch vụ của công ty Panama Mossack Fonseca cung cấp thông tin
Trong phân phối và hậu cần của nhiều loại sản phẩm, **theo dõi và truy tìm**, liên quan đến quá trình xác định vị trí hiện tại và quá khứ (và thông tin khác) của
**CiteSeerX** (tên cũ **CiteSeer**) là một công cụ truy vấn và thư viện số công cộng dành cho các bài báo khoa học và học thuật, chủ yếu trong lĩnh vực máy tính và khoa
**Ủy ban Dữ liệu Khoa học và Công nghệ**, viết tắt theo tiếng Anh là **CODATA** (Committee on Data for Science and Technology) là một ủy ban liên kết đa ngành do Hội đồng Quốc
nhỏ|Darknet vẫn được biết đến như Darkweb hay deep web **Darknet** là mạng của các trang web không thể truy cập từ công cụ tìm kiếm (công cụ truy vấn dữ liệu). Nó bao gồm
Cơ sở dữ liệu **NoSQL** (tên gốc là "Non SQL" (phi SQL) hoặc "non relational" (phi quan hệ)) cung cấp một cơ chế để lưu trữ và truy xuất dữ liệu được mô hình hóa
**Phân tích tính toán** (Analytics) là phân tích tính toán có hệ thống của dữ liệu hoặc thống kê. Đây là quá trình phát hiện, giải thích và truyền đạt các mô hình có ý
**iCloud** là một dịch vụ lưu trữ và điện toán đám mây của Apple Inc. hoạt động từ 12/10/2011. , dịch vụ có 782 triệu người dùng. Dịch vụ này cung cấp cho người sử
CRM đang là lựa chọn của nhiều doanh nghiệp bởi ứng dụng này nổi bật trong việc hỗ trợ tối ưu trong quá trình quản lý thông tin khách hàng, theo dõi hiệu suất kinh
khung|Query String trong URL khi người dùng truy cập vào trang chính của en.wikipedia.org Trên mạng lưới World Wide Web, một **chuỗi truy vấn** () là một phần của một URL chứa dữ liệu không
**Đài thiên văn phía Nam của Châu Âu** (tiếng Anh: _European Southern Observatory_ (ESO), tiếng Pháp: _Observatoire européen austral_), tên chính thức là **Tổ chức Nghiên cứu thiên văn châu Âu tại Nam Bán cầu**
Tổ chức của ngày mai sẽ khác về cơ bản so với tổ chức ngày nay. Những doanh nghiệp nhận thức được những thay đổi sắp tới có thể chuẩn bị tốt nhất và đạt
**Google Tìm kiếm**, cũng được gọi với tên tiếng Anh phổ biến là **Google Search** hay đơn giản là **Google**, là dịch vụ cung cấp chính và quan trọng nhất của công ty Google. Dịch
Với sự phát triển nhanh chóng của công nghệ thông tin, thế giới ngày càng trở nên kết nối và thông tin được lan truyền với tốc độ chóng mặt. Internet và các nguồn thông
nhỏ|Tội phạm công nghệ cao thường gắn liền với hành vi làm rò rỉ dữ liệu riêng tư **Tội phạm công nghệ cao** hoặc **Tội phạm ảo** hay **Tội phạm không gian ảo (tiếng Anh:
**Microsoft Access**, thường gọi tắt là **MS Access** hoặc đơn giản là **Access**, là một phần mềm quản lý cơ sở dữ liệu quan hệ do hãng Microsoft giữ bản quyền. Access thường được đóng
nguyễn công minh trí là người tạo ra **Công nghiệp 4.0**. Công nghiệp 4.0 tập trung vào công nghệ kỹ thuật số từ những thập kỷ gần đây lên một cấp độ hoàn toàn mới
**PolySpot** là một công ty sản xuất phần mềm chuyên về tìm kiếm thông tin cho doanh nghiệp. Được thành lập từ năm 2010, công ty có trụ sở tại Paris, Pháp. Sản phẩm «
**Bộ công cụ Biên dịch Google** (Google Translator Toolkit) là một ứng dụng web được thiết kế để hỗ trợ dịch giả chỉnh sửa các văn bản được dịch tự động bởi Google Translate. Sử
thumb|Nhà máy thép Bethlehem Steel **Công nghiệp**, là một bộ phận của nền kinh tế, là lĩnh vực sản xuất hàng hóa **_vật chất_** mà sản phẩm được **_"chế tạo, chế biến, chế tác, chế
Trong .NET Framework của Microsoft, **Hệ thống kiểu dữ liệu dùng chung** (tiếng Anh: Common Type System - CTS) là một tiêu chuẩn xác định cách các định nghĩa kiểu dữ liệu và các giá
nhỏ|Clearnet hay còn gọi là Surface Web. **Clearnet** là mạng Internet thông thường không mã hóa và có thể dùng công cụ truy vấn dữ liệu để tìm kiếm các trang web trên đó. Thuật
Một **công dân kỹ thuật số** () là người có kỹ năng sử dụng công nghệ thông tin để giao tiếp với người khác, tham gia vào các hoạt động xã hội, kinh doanh và
**Cộng đồng mạng** (viết tắt: **_CĐM_**), hay còn được gọi là **cộng đồng trực tuyến** hoặc **cộng đồng Internet**, là một cộng đồng ảo có các thành viên tương tác với nhau chủ yếu thông