✨Khoảng cách Hamming

Khoảng cách Hamming

nhỏ|Khoảng cách Hamming

Trong lý thuyết thông tin, Khoảng cách Hamming (tiếng Anh: Hamming distance) giữa hai xâu (strings) có chiều dài bằng nhau là số các ký hiệu ở vị trí tương đương có giá trị khác nhau. Nói một cách khác, khoảng cách Hamming đo số lượng thay thế cần phải có để đổi giá trị của một dãy ký tự sang một dãy ký tự khác, hay số lượng lỗi xảy ra biến đổi một dãy ký tự sang một dãy ký tự khác.

Lấy ví dụ:

  • Khoảng cách Hamming giữa 10111011001001 là 2.
  • Khoảng cách Hamming giữa 21438962233796 là 3.
  • Khoảng cách Hamming giữa "toned" và "roses" là 3.

Trọng số Hamming (Hamming weight) của một dãy ký tự là khoảng cách Hamming từ một dãy ký tự toàn số không có cùng chiều dài. Có nghĩa là số phần tử trong dãy ký tự không có giá trị không (0): đối với một dãy ký tự nhị phân (binary string), nó chỉ là số các ký tự có giá trị một (1), lấy ví dụ trọng số Hamming của dãy ký tự 11101 là 4.

Đặc tính

Đối với một chiều dài cố định "n", khoảng cách Hamming là độ đo trên không gian vectơ của các từ có chiều dài đó, vì nó thỏa mãn yêu cầu về tính chất số không âm (non-negativity) (số tuyệt đối), hiện thân của tính bất khả phân định (indiscernibles) và tính đối xứng (symmetry), và nó có thể được chứng minh một cách dễ dàng bằng phép quy nạp toàn phần (complete induction) rằng nó còn thỏa mãn bất đẳng thức tam giác (triangle inequality).

Khoảng cách Hamming giữa hai từ ab còn được gọi là trọng số Hamming (Hamming weight) của phép toán ab, dùng một toán tử thích hợp thay thế cho toán tử "−".

Đối với hai dãy ký tự nhị phân (binary strings) ab, phép toán này tương đương với phép toán a XOR b. Khoảng cách Hamming của các dãy ký tự nhị phân còn tương đương với khoảng cách Manhattan (Manhattan distance) giữa hai giao điểm của một hình siêu lập phương n-chiều (n-dimensional hypercube), trong đó n là chiều dài của các từ.

Lịch sử và ứng dụng

Khoảng cách Hamming là cái tên được đặt theo tên của Richard Hamming, người giới thiệu lý thuyết này trong tài liệu có tính cơ sở của ông về mã phát hiện lỗi và sửa lỗi (error-detecting and error-correcting codes). Nó được sử dụng trong kỹ thuật viễn thông để tính số lượng các bit trong một từ nhị phân (binary word) bị đổi ngược, như một hình thức để ước tính số lỗi xảy ra trong quá trình truyền thông, và vì thế, đôi khi, nó còn được gọi là khoảng cách tín hiệu (signal distance). Việc phân tích trọng số Hamming của các bit còn được sử dụng trong một số ngành, bao gồm lý thuyết tin học, lý thuyết mã hóa, và mật mã học. Tuy vậy, khi so sánh các dãy ký tự có chiều dài khác nhau, hay các dãy ký tự có xu hướng không chỉ bị thay thế không thôi, mà còn bị ảnh hưởng bởi dữ liệu bị lồng thêm vào, hoặc bị xóa đi, phương pháp đo lường phức tạp hơn, như khoảng cách Levenshtein (Levenshtein distance) là một phương pháp có tác dụng và thích hợp hơn.

👁️ 1 | 🔗 | 💖 | ✨ | 🌍 | ⌚
nhỏ|Khoảng cách Hamming Trong lý thuyết thông tin, **Khoảng cách Hamming** (_tiếng Anh: Hamming distance_) giữa hai xâu (_strings_) có chiều dài bằng nhau là số các ký hiệu ở vị trí tương đương có
Trong viễn thông (_telecommunication_), **mã Hamming** là một mã sửa lỗi tuyến tính (_linear error-correcting code_), được đặt tên theo tên của người phát minh ra nó, [./Https://en.wikipedia.org/wiki/Richard_Hamming Richard Hamming]. Mã Hamming có thể phát
Trong lý thuyết mã hóa, **mã tuyến tính** là mã sửa lỗi trong đó mọi tổ hợp tuyến tính của các mã tự cũng là một mã tự. Mã tuyến tính thường được phân loại
Trong toán học, **không gian mêtric** là một tập hợp mà một khái niệm của khoảng cách (được gọi là mêtric) giữa các phần tử của tập hợp đã được định nghĩa. Không gian mêtric
**Lý thuyết mã hóa** là nghiên cứu về các đặc tính của mã và khả năng thích ứng với các ứng dụng cụ thể của chúng. Mã được sử dụng cho nén dữ liệu, mật
Trong lý thuyết mã hóa, **mã BCH** là một lớp các mã sửa lỗi vòng xây dựng bằng trường hữu hạn. Mã BCH được phát minh năm 1959 bởi Hocquenghem, và một cách độc lập
Trong lý thuyết mã hóa, **mã khối** là một tập hợp bao gồm nhiều mã sửa lỗi mã hóa dữ liệu theo từng khối. Có rất nhiều loại mã khối khác nhau, được sử dụng
Trong lý thuyết mã hóa, **giới hạn Singleton**, đặt theo tên của Richard Collom Singleton, là một giới hạn trên cho kích thước của mã khối C với độ dài n, kích thước r, và
Bài này nói về từ điển các chủ đề trong toán học. ## 0-9 * -0 * 0 * 6174 ## A * AES * ARCH * ARMA * Ada Lovelace * Adrien-Marie Legendre *
Trong lý thuyết mã hóa, **chặn Gilbert–Varshamov** (chứng minh bởi Edgar Gilbert và một cách độc lập bởi Rom Varshamov) là một giới hạn của các tham số của một mã (không nhất thiết tuyến
**Mạch đếm vòng** hay _Ring counter_ là mạch được lập ra bằng _thanh ghi dịch_ với phản hồi ngõ ra trở về ngõ vào D đầu tiên. Khoảng cách Hamming của Mạch đếm Overbeck là
Bài viết này là **danh sách các thuật toán** cùng một mô tả ngắn cho mỗi thuật toán. ## Thuật toán tổ hợp ### Thuật toán tổ hợp tổng quát * Thuật toán Brent: tìm
Trong lý thuyết mã hóa, **mã Reed-Solomon (RS)** là một mã vòng sửa lỗi tuyến tính phát minh bởi Irving S. Reed và Gustave Solomon. Bằng cách thêm vào _t_ ký hiệu kiểm tra, mã
**Thời đại Thông tin** (còn gọi là **Thời đại Máy tính**, **Thời đại Kỹ thuật số** hoặc **Thời đại Truyền thông mới**) là một giai đoạn trong lịch sử nhân loại với sự chuyển đổi
Trong toán học, đặc biệt là trong nhánh lý thuyết số, **phương trình Ramanujan–Nagell** là phương trình giữa một số chính phương và một số kém hơn 7 so với lũy thừa của 2. Nó
**Vladimir Iosifovich Levenshtein** (Tiếng Nga: Владимир Иосифович Левенштейн) (20 tháng 3 năm 1935 - 6 tháng 9 năm 2017) là nhà khoa học Nga. Lĩnh vực mà ông quan tâm là Lý Thuyết Thông tin
**Bộ nhớ truy cập ngẫu nhiên động** (**DRAM** hay **RAM động**) là một loại bộ nhớ truy cập ngẫu nhiên lưu mỗi bit dữ liệu trong một tụ điện riêng biệt trên một mạch tích
File:1998 Events Collage 2.0.jpg|Từ bên trái, theo chiều kim đồng hồ: **Thế vận hội Mùa đông 1998** được tổ chức tại Nagano, Nhật Bản; Tổng thống Hoa Kỳ Bill Clinton bị **luận tội** vì vụ
Trong truyền thông liên lạc, một **mã hiệu** - hay còn gọi là **mã số** hoặc chỉ đơn thuần là **mã** - là một công thức để biến đổi một mẩu thông tin (chẳng hạn,