✨Số trung vị

Số trung vị

Trong lý thuyết xác suất và thống kê, số trung vị (tiếng Anh: median) là một số tách giữa nửa lớn hơn và nửa bé hơn của một mẫu, một quần thể, hay một phân bố xác suất. Nó là giá trị giữa trong một phân bố, mà số các số nằm trên hay dưới con số đó là bằng nhau. Điều đó có nghĩa rằng 1/2 quần thể sẽ có các giá trị nhỏ hơn hay bằng số trung vị, và một nửa quần thể sẽ có giá trị bằng hoặc lớn hơn số trung vị.

Để tìm số trung vị của một danh sách hữu hạn các số, ta xếp tăng dần tất cả các quan sát, rồi lấy giá trị nằm giữa danh sách. Nếu số quan sát là số chẵn, người ta thường lấy trung bình của hai giá trị nằm giữa.

Cách giải thích dễ hiểu

Giả sử có 19 người nghèo và 1 tỉ phú trong một căn phòng. Mọi người đều bỏ tất cả tiền trong túi mình ra và đặt lên một cái bàn. Mỗi người nghèo đặt 5 đồng lên bàn; người tỉ phú đặt 1 tỷ đồng (109 đồng) lên đó. Khi đó, tổng số là 1.000.000.095 đồng. Nếu đem chia đều số tiền đó cho 20 người, mỗi người được 50.000.004 đồng và 75 xu. Số tiền đó là trung bình của số tiền mà mỗi người đã đem vào phòng. Nhưng số trung vị lại là 5 đồng, vì ta có thể chia thành 2 nhóm mỗi nhóm 10 người, và nói rằng mọi người trong nhóm thứ nhất mang không nhiều hơn 5 đồng và mọi người trong nhóm thứ hai mang không dưới 5 đồng. Theo nghĩa đó, số trung vị là số tiền mà một người điển hình mang tới. Ngược lại, giá trị trung bình không điển hình chút nào, do không có ai - người nghèo hoặc tỉ phú - mang đến một số tiền xấp xỉ 50.000.004,75 đồng.

Không duy nhất: có thể có nhiều hơn một số trung vị

Có thể có nhiều hơn một số trung vị: ví dụ nếu số các trường hợp là một số chẵn thì không có một số trung vị duy nhất. Lưu ý rằng một nửa số các số trong danh sách có giá trị nhỏ hơn hoặc bằng một trong hai giá trị giữa, và một nửa lớn hơn hay bằng một trong hai giá trị đó, đối với bất cứ số nào nằm giữa hai giá trị đó cũng vậy. Do vậy, trong trường hợp đó, cả hai số nằm giữa và mọi giá trị nằm giữa chúng đều là số trung vị.

Đo đạc sự phân tán thống kê

Khi trung vị được dùng với vai trò tham số vị trí trong thống kê mô tả, có một vài lựa chọn một độ đo độ biến đổi: khoảng biến thiên giao độ (range), khoảng tứ phân vị (interquartile range), và độ lệch tuyệt đối (absolute deviation). Do trung vị chính là tứ phân vị thứ hai, việc tính toán nó được minh họa trong bài về các tứ phân vị.

Trung vị của các phân bố xác suất

lang=vi|nhỏ|Phân biệt các giá trị yếu vị, trung vị, và bình quân trong một phân bố xác suất. Cho một phân bố xác suất bất kỳ trên tập số thực với hàm phân bố tích lũy F, bất kể nó thuộc loại phân bố xác suất liên tục nào, một phân bố liên tục tuyệt đối (và do đó có một hàm mật độ xác suất) hay một phân bố xác suất rời rạc. Giá trị trung vị m của nó thỏa mãn đẳng thức

:P(X\leq m)=P(X\geq m)=\int_{-\infty}^m dF(x)

trong đó sử dụng tích phân Riemann-Stieltjes. Với một phân bố liên tục tuyệt đối với hàm mật độ xác suất f, ta có

:P(X\leq m)=P(X\geq m)=\int_{-\infty}^m f(x)\, dx=0.5.

Số trung vị của các phân bố cụ thể

  • Số trung vị của một phân bố chuẩn với giá trị trung bình μ và độ biến thiên σ2 là μ. Thực ra, với phân bố chuẩn, giá trị trung bình = median = mode.
  • Số trung vị của một phân bố đều trong khoảng [a, b] là (a + b) / 2, đó cũng là giá trị trung bình.
  • Số trung vị của một phân bố Cauchy với tham số vị trí x0 và tham số tỉ lệ (scale parameter) yx0, tham số vị trí.
  • Số trung vị của một phân phối mũ với tham số λ là tham số tỉ lệ (scale parameter) nhân với lôga tự nhiên của 2, λln 2.
  • Số trung vị của một phân bố Weibull với tham số hình dạng (shape parameter) k và tham số tỉ lệ λ là λ(log 2)1/k.

Số trung vị trong thống kê mô tả

Số trung vị thường dùng chủ yếu cho các phân bố lệch, do nó biểu thị chính xác hơn trung bình cộng. Xét tập { 1, 2, 2, 2, 3, 9 }. Trong trường hợp đó, số trung vị bằng 2 và bằng mode, và nó có thể được coi là chỉ định tốt hơn về xu hướng trung tâm (central tendency) hơn là trung bình số học có giá trị 3,166….

Tính toán số trung vị là một kỹ thuật phổ biến trong thống kê tổng kết (summary statistics) và dữ liệu thống kê tổng kết (summarizing statistical data), do nó dễ hiểu và dễ tính, trong khi vẫn cho ra một độ đo tốt hơn giá trị kỳ vọng trong trường hợp có mặt các giá trị ngoại lệ (outlier).

Các tính chất lý thuyết

Tính chất tối ưu hóa

Số trung vị còn là điểm trung tâm, nơi cực tiểu hóa trung bình của các độ lệch tuyệt đối; trong ví dụ trên, nó sẽ là (1 + 0 + 0 + 0 + 1 + 7) / 6 = 0.5 bằng cách sử dụng trung vị, trong khi nếu sử dụng giá trị trung binh, kết quả sẽ là 1.5. Trong ngôn ngữ của lý thuyết xác suất, giá trị của c mà làm cực tiểu

:E(\left|X-c\right|)\,

là số trung vị của phân bố xác suất của biến ngẫu nhiên X.

Bất đẳng thức liên quan tới giá trị trung bình và số trung vị

Đối với các phân bố xác suất liên tục, hiệu giữa số trung vị và giá trị trung bình nhỏ hơn hay bằng độ lệnh chuẩn. Xem bất đẳng thức giữa các tham số vị trí và tỉ lệ (an inequality on location and scale parameters).

Tính toán hiệu quả

Tuy việc sắp xếp n phần tử thường cần O(n log n) thao tác, bằng cách sử dụng một thuật toán "chia để trị", số trung vị của n phần tử có thể được tính với chỉ O(n) thao tác (thực ra, ta luôn có thể tìm thấy phần tử thứ k của một danh sách các giá trị với phương pháp này; nó có tên thuật toán lựa chọn (selection algorithm)).

👁️ 0 | 🔗 | 💖 | ✨ | 🌍 | ⌚
Trong lý thuyết xác suất và thống kê, **số trung vị** (tiếng Anh: _median_) là một số tách giữa nửa lớn hơn và nửa bé hơn của một mẫu, một quần thể, hay một phân
lang=vi|nhỏ|Phân biệt các giá trị yếu vị, trung vị, và bình quân trong một phân bố xác suất. Trong ngành Thống kê mô tả, **yếu vị** (tiếng Anh: _mode_) của một danh sách dữ liệu
lang=vi|Biểu đồ tuyến của chỉ số Dow Jones từ 1896 đến 2018 **Chỉ số trung bình công nghiệp Dow Jones** hay **Chỉ số bình quân công nghiệp Dow Jones** (tiếng Anh: _Dow Jones Industrial Average_,
**Chữ số Trung Quốc** là các chữ Hán để miêu tả số trong tiếng Trung Hoa. Ngày nay, những người dùng tiếng Trung Quốc hiểu ba hệ chữ số: hệ chữ số Hindu–Ả Rập phổ
Đây là danh sách các nước và vùng lãnh thổ theo **độ tuổi trung vị**. thumb|Median age by country, CIA World Factbook 2016 est. Độ tuổi trung vị ở đây là Median age, là độ
**Trường Trung học cơ sở – Trung học phổ thông Nguyễn Khuyến** là một trường liên cấp trung học cơ sở và trung học phổ thông tại Đà Nẵng. Đây từng là trường trung học
nhỏ|Chiếc bánh pizza được cắt nhỏ; mỗi miếng bánh là \frac1{8} chiếc bánh. **Phân số đơn vị** là phân số dương có tử số bằng 1, tức có dạng \frac1{n} với n
thumb|Thành huy Hà Nội thời kỳ Pháp thuộc từ năm 1888 đến năm 1954, hiện nay được nhìn thấy trên nóc tòa nhà hiệu bộ của Trường THCS Trưng Vương **Trường Trung học cơ sở
**Trường Trung học cơ sở Trưng Vương Nha Trang** là một trường Trung học cơ sở tại thành phố Nha Trang. Trước năm 1975, trường được cư dân địa phương biết đến nhiều với tên
Trong thống kê, **_số bình quân_** có hai nghĩa có liên quan: * _số bình quân_ theo nghĩa thông thường, được gọi chính xác hơn là số bình quân số học để phân biệt với
Trong mật mã học, **chỉ số trùng hợp** là kỹ thuật đặt hai văn bản bên cạnh nhau và đếm số lần mỗi chữ cái xuất hiện cùng một vị trí trong hai văn bản.
Tử Vi Đẩu Số - Trung Châu Vận Đoán Tử vi đẩu số là một thành tố quan trọng của văn hóa thần bí Trung Quốc cổ đại. Bắt nguồn từ hệ thôhg tinh tú
**Tần số trung bình** (tiếng Anh: medium frequency, viết tắt là **MF**) là tần số vô tuyến (RF) trong dải 300 kHz tới 3 MHz. Một phần của băng tần này là băng quảng bá AM sóng
Mindmap Kanji tiếng Nhật Dành cho trình độ sơ, trung cấp - Học kèm app là cuốn sách giúp bạn dễ dàng ghi nhớ bằng 3 phương pháp sơ đồ tư duy, học 1 biết
**Huyện hạt khu** , là một đơn vị hành chính dưới cấp huyện tại Cộng hòa Nhân dân Trung Hoa. Văn phòng hành chính của đơn vị hành chính này là **sở công khu**(区公所) và
Bài tập luyện dịch tiếng Trung Ứng Dụng Sơ Trung cấp, giao tiếp HSK Trung Pinyin Việt, có đáp án DVD quà tặng LUYENDICH Sách dành cho những ai Đang tìm một cuốn SÁCH BÀI
Bài tập luyện dịch tiếng Trung Ứng Dụng Sơ Trung cấp, giao tiếp HSK Trung Pinyin Việt, có đáp án DVD quà tặng LUYENDICH Sách dành cho những ai Đang tìm một cuốn SÁCH BÀI
Bài tập luyện dịch tiếng Trung Ứng Dụng Sơ Trung cấp, giao tiếp HSK Trung Pinyin Việt, có đáp án DVD quà tặng LUYENDICH Sách dành cho những ai Đang tìm một cuốn SÁCH BÀI
Mindmap Tiếng Nhật Kanji - Dành Cho Trình Độ Sơ, Trung Cấp Dễ dàng ghi nhớ bằng 3 phương pháp sơ đồ tư duy, học 1 biết 10, học qua câu chuyện thú vị và
Bài tập luyện dịch tiếng Trung Ứng Dụng Sơ Trung cấp, giao tiếp HSK Trung Pinyin Việt, có đáp án DVD quà tặng LUYENDICH Sách dành cho những ai Đang tìm một cuốn SÁCH BÀI
**Chiến tranh biên giới 1979**, hay thường được gọi là **Chiến tranh biên giới Việt – Trung năm 1979**, là một cuộc chiến ngắn nhưng khốc liệt giữa Trung Quốc và Việt Nam, diễn ra
**Lịch sử Trung Quốc** đề cập đến Trung Hoa, 1 trong 4 nền văn minh cổ nhất thế giới, bắt nguồn từ lưu vực phì nhiêu của hai con sông: Hoàng Hà (bình nguyên Hoa
**Trung Đông** (tiếng Anh: Middle East, tiếng Ả Rập: الشرق الأوسط, tiếng Hebrew: המזרח התיכון, tiếng Ba Tư: خاورمیانه) là chỉ bộ phận khu vực trung tâm của 3 Châu Lục: Á, Âu, Phi, từ
Hình ảnh tái hiện một buổi trình diễn nhạc cụ truyền thống cổ của Trung Quốc (nhã nhạc cung đình [[nhà Thanh)]] nhỏ|Nhóm nghệ sĩ [[người Nạp Tây hòa tấu nhạc cụ cổ truyền]] **Những
## Thuốc an thần và giảm đau ### Morphine Morphine là một ankaloit thuốc phiện nổi tiếng có các tác dụng chính trên hệ thần kinh trung ương và các cơ quan chứa cơ trơn
So sánh GDP TQ **Nền kinh tế của Cộng hòa Nhân dân Trung Hoa** là một nền kinh tế đang phát triển định hướng thị trường kết hợp kinh tế kế hoạch thông qua các
**Đảng Cộng sản Trung Quốc** (; Hán-Việt: Trung Quốc Cộng sản Đảng), một số văn kiện tiếng Việt còn gọi là **Đảng Cộng sản Tàu**, là đảng chính trị thành lập và điều hành Cộng
**Trùng Khánh** () là một thành phố lớn ở Tây Nam Trung Quốc và là một trong bốn thành phố trực thuộc trung ương tại Cộng hòa Nhân dân Trung Hoa. Năm 2018, Trùng Khánh
Nhân quyền tại Cộng hòa Nhân dân Trung Hoa là một vấn đề tranh cãi giữa chính phủ Trung Quốc và các nước khác cũng như các tổ chức phi chính phủ. Bộ Ngoại giao
phải|Bản đồ các [[quốc gia theo mật độ dân số, trên kilômét vuông. (Xem _Danh sách quốc gia theo mật độ dân số._)]] phải|Các vùng có mật độ dân số cao, tính toán năm 1994.
**Biểu tình bài Nhật tại Trung Quốc năm 2012** là một loạt các cuộc biểu tình bài Nhật Bản được tổ chức ở các thành phố lớn tại Trung Quốc và Đài Loan trong khoảng
thumb|[[Lăng Hoàng Đế|Miếu Hiên Viên thờ Hoàng Đế ở Hoàng Lăng, Thiểm Tây]] thumb|Miếu [[Thành hoàng ở Mã Công, Đài Loan]] thumb|Điện thờ trong Ngũ Công Tự ở [[Hải Khẩu, Hải Nam]] **Tín ngưỡng dân
right|thumb|[[Phân tầng xã hội truyền thống của những nước phương tây trong thế kỷ XV]] right|thumb **Giáo hội và nhà nước ở châu Âu thời trung cổ** nêu rõ sự tách biệt nguyên tắc phân
**Giao tranh Trung Quốc–Ấn Độ năm 2020** là một phần của các cuộc đụng độ quân sự đang diễn ra giữa Trung Quốc và Ấn Độ. Kể từ ngày 5 tháng 5 năm 2020, quân
**Đại số** là một nhánh của toán học nghiên cứu những hệ thống trừu tượng nhất định gọi là cấu trúc đại số và sự biến đổi biểu thức trong các hệ thống này. Đây
**Xung đột Việt Nam – Trung Quốc 1979–1991** là một chuỗi các cuộc đụng độ quân sự trên biên giới và hải đảo giữa hai nước Cộng hòa Xã hội chủ nghĩa Việt Nam và
**Ẩm thực Trung Quốc** (, ) là một phần quan trọng của văn hóa Trung Quốc, bao gồm ẩm thực có nguồn gốc từ các khu vực đa dạng của Trung Quốc, cũng như từ
**Độc lực** là phương thức để phát động quá trình nhiễm trùng và gây bệnh của vi khuẩn. ## Các yếu tố bám dính Bước quan trọng đầu tiên trong quá trình tương tác giữa
**Sở** (chữ Hán: 楚國), (chữ Phạn: श्रीक्रुंग / **Srikrung**) đôi khi được gọi **Kinh Sở** (chữ Hán: 荆楚), là một chư hầu của nhà Chu tồn tại thời Xuân Thu Chiến Quốc kéo đến thời
**Đại thanh trừng** là một loạt các biện pháp trấn áp tại Liên Xô kéo dài từ mùa thu năm 1936 cho tới đầu năm 1938. Sự kiện này liên quan tới một cuộc thanh
**Chiến tranh Hán-Sở** (漢楚爭雄 _Hán Sở tranh hùng_, 楚漢戰爭 _Sở Hán chiến tranh_, 楚漢相爭 _Sở Hán tương tranh_ hay 楚漢春秋 _Sở Hán Xuân Thu_, 206–202 TCN) là thời kỳ sau thời đại nhà Tần ở
**Chiến tranh Trung – Nhật** (1937–1945) là một cuộc xung đột quân sự giữa Trung Hoa Dân Quốc và Đế quốc Nhật Bản. Hai thế lực đã chiến đấu với nhau ở vùng biên giới
nhỏ|Các bảng số học dành cho trẻ em, Lausanne, 1835 **Số học** là phân nhánh toán học lâu đời nhất và sơ cấp nhất, được hầu hết mọi người thường xuyên sử dụng từ những
**Vi Tiểu Bảo** () là nhân vật chính trong cuốn tiểu thuyết võ hiệp nổi tiếng của Kim Dung và là cuốn cuối cùng của ông, Lộc đỉnh ký. ## Thân thế/ Cuộc đời Vi
Trong toán học, và đặc biệt hơn trong tôpô đại số và tổ hợp đa diện, **đặc trưng Euler** (hoặc **đặc trưng Euler-Poincaré**) là một topo bất biến, một số mà nó mô tả hình
**Trung Quốc** hiện là quốc gia có dân số đông thứ hai trên thế giới. Từ thời Chu Tuyên Vương, đã có điều tra nhân khẩu tại Trung Quốc, có thống kê nhân khẩu chi
**Thanh trừng trong nội bộ NKVD** (), còn được gọi là "thời kỳ Yezhov", đề cập đến các cuộc đàn áp quy mô lớn nhằm vào các nhân viên Bộ Dân ủy Nội vụ (NKVD)
Trong hệ thống giáo dục Trung Quốc, giáo dục chủ yếu được quản lý bởi hệ thống giáo dục công lập do nhà nước điều hành, nằm dưới sự quản lý của Bộ Giáo dục.
phải|nhỏ| Một [[Tập đoàn (sinh học)|tập đoàn sinh học của vi khuẩn _Escherichia coli_ được chụp hình phóng đại 10.000 lần.]] **Vi sinh vật** (, hay _microbe_) là một sinh vật có kích thước siêu
**Tết Trung thu** còn được gọi là **Tết trông Trăng** hay **Tết hoa đăng** theo Âm lịch là ngày Rằm tháng 8 hằng năm, là một lễ hội truyền thống được kỉ niệm ở văn