✨Chặn Chernoff

Chặn Chernoff

Trong lý thuyết xác suất, chặn Chernoff, đặt tên theo Herman Chernoff, cho một chặn trên giảm theo hàm mũ của đuôi phân phối của tổng nhiều biến ngẫu nhiên độc lập. Nó thường mạnh hơn các bất đẳng thức sử dụng mômen bậc nhất hay bậc hai chẳng hạn như bất đẳng thức Markov hay bất đẳng thức Chebyshev.

Nó có liên hệ với bất đẳng thức Bernstein, và bất đẳng thức Hoeffding.

Sau đây là một ví dụ trường hợp đặc biệt của chặn Chernoff. Giả sử X1,..., Xn là các biến ngẫu nhiên Bernoulli độc lập với xác suất p > 1/2. Khi đó, nếu gọi xác suất xảy ra ít nhất n/2 sự kiện {X_k = 1}P, thì

: P=\sum\limits_{i = \lfloor \frac{n}{2} \rfloor + 1}^n \binom{n}{i}p^i (1 - p)^{n - i}.

Chặn Chernoff cho thấy P có chặn dưới như sau:

: P \ge 1 - \mathrm{e}^{- 2n \left({p - \frac{1}{2 \right)^2}.

Dưới đây, trường hợp này sẽ được tổng quát hóa theo nhiều hướng khác nhau. Có nhiều phiên bản khác nhau của chặn Chernoff: sai số có thể là sai số tuyệt đối hoặc sai số tương đối so với giá trị kỳ vọng.

Bước thứ nhất trong chứng minh của chặn Chernoff

Chặn Chernoff cho biến ngẫu nhiên X là tổng của n biến ngẫu nhiên độc lập X_1, X_2,..., X_n, được chứng minh bằng cách xem xét phân bố của etX với giá trị thích hợp của t. Phương pháp này được áp dụng đầu tiên bởi Sergei Bernstein để chứng minh bất đẳng thức Bernstein.

Theo bất đẳng thức Markov và tính chất độc lập, ta có bất đẳng thức sau:

Với mọi t > 0,

: \Pr\left[X \ge a\right] = \Pr\left[e^{tX} \ge e^{ta}\right] \le \frac{ \mathbf{E} \left[e^{tX} \right]}{e^{ta = {\prod_i E[e^{tX_i}]\over e^{ta.

Do có thể chọn t tùy ý, ta có

: \Pr\left[X \ge a\right] \leq \min_{t>0} {\prod_i E[e^{tX_i}] \over e^{ta. \quad (+)

Tương tự như vậy,

: \Pr\left[X \le a\right] = \Pr\left[e^{-tX} \ge e^{-ta}\right]

Do đó,

: \Pr\left[X \le a\right] \leq \min_{t>0} e^{ta} \prod_i E[e^{-tX_i}]. \quad (++)

Phát biểu và chứng minh

Trường hợp sai số tuyệt đối

Định lý sau đây được chứng minh bởi Wassily Hoeffding và được gọi là định lý Chernoff-Hoeffding.

Giả sử các biến X_1, X_2, \ldots, X_m là độc lập và có cùng phân bố. Giả sử p = E \left [X_i \right ], X_i \in {0,1}, và \varepsilon > 0. Khi đó

:: \begin{align} &\Pr\left[ \frac 1 m \sum X_i \geq p + \varepsilon \right] \ &\qquad\leq \left ({\left (\frac{p}{p + \varepsilon}\right)}^{p+\varepsilon} {\left (\frac{1 - p}{1 -p - \varepsilon}\right)}^{1 - p- \varepsilon}\right) ^m = e^{ - D(p+\varepsilon|p) m} \end{align}

và :: \begin{align} &\Pr\left[ \frac 1 m \sum X_i \leq p - \varepsilon \right] \\ &\qquad\leq \left ({\left (\frac{p}{p - \varepsilon}\right)}^{p-\varepsilon} {\left (\frac{1 - p}{1 -p + \varepsilon}\right)}^{1 - p+ \varepsilon}\right) ^m = e^{ - D(p-\varepsilon\|p) m}, \end{align} trong đó :: D(x||y) = x \log \frac{x}{y} + (1-x) \log \frac{1-x}{1-y} là khoảng cách Kullback-Leibler giữa các biến ngẫu nhiên Bernoulli với tham số xy.

Chứng minh

Chứng minh xuất phát từ bất đẳng thức (+) ở trên. Đặt q = p + \varepsilon. Chọn a = mq và thay vào (+), ta có:

:: \Pr\left[ \frac{1}{m} \sum Xi \ge q\right] \le \inf{t>0} \frac{E \left[\prod e^{t Xi}\right]}{e^{tmq = \inf{t>0} \left[\frac{ E\left[e^{tX_i} \right] }{e^{tq\right]^m.

Do \Pr[X_i = 1] = p, \Pr[X_i = 0] = (1-p), ta có :: \left[\frac{ E\left[e^{tX_i} \right] }{e^{tq\right]^m = \left[\frac{p e^t + (1-p)}{e^{tq} }\right]^m = [pe^{(1-q)t} + (1-p)e^{-qt}]^m.

Bằng cách lấy lôgarit và tính đạo hàm, ta có thể tính được giá trị infimum ở trên thông qua đạo hàm sau :: \begin{align} &\frac{d}{dt} \log(pe^{(1-q)t} + (1-p)e^{-qt}) \ &\qquad= \frac{1}{pe^{(1-q)t} + (1-p)e^{-qt ((1-q)pe^{(1-q)t}-q(1-p)e^{-qt}) \ &\qquad = -q + \frac{pe^{(1-q)t{pe^{(1-q)t}+(1-p)e^{-qt \end{align}

Giải khi đạo hàm ở trên bằng 0 để tính infimum, ta có :: \begin{align} q & = \frac{pe^{(1-q)t{pe^{(1-q)t}+(1-p)e^{-qt = \frac{pe^{(1-q)t{e^{-qt}(pe^{t}+(1-p))} \\ pe^{(1-q)t} & = pe^{-qt}e^t = qe^{-qt}(pe^{t}+1-p) \\ \frac{p}{q}e^t & = pe^t + 1-p \end{align} nên e^t = (1-p)\left(\frac{p}{q}-p\right)^{-1}.

Do đó, t = \log\left(\frac{(1-p)q}{(1-q)p}\right).

q = p+\varepsilon > p, ta có t > 0, nên giá trị của t là hợp lệ. Sau khi đã giải được t, ta thay giá trị này vào phương trình ở trên và thu được :: \begin{align} &\log(pe^{(1-q)t} + (1-p)e^{-qt}) = \log[e^{-qt}(1-p+pe^t)] \ &\qquad = \log\left[e^{-q \log\left(\frac{(1-p)q}{(1-q)p}\right)}\right] + \log\left[1-p+pe^{\log\left(\frac{1-p}{1-q}\right)}e^{\log\frac{q}{p\right] \ &\qquad = -q\log\frac{1-p}{1-q} -q \log\frac{q}{p} + \log\left[1-p+ p\left(\frac{1-p}{1-q}\right)\frac{q}{p}\right] \ &\qquad = -q\log\frac{1-p}{1-q} -q \log\frac{q}{p} + \log\left[\frac{(1-p)(1-q)}{1-q}+\frac{(1-p)q}{1-q}\right] \ &\qquad = -q\log\frac{q}{p} + (1-q)\log\frac{1-p}{1-q} = -D(q | p). \end{align}

Tóm lại, ta thu được kết quả cần chứng minh như sau :: \Pr\left[\frac{1}{m}\sum X_i \ge p + \varepsilon\right] \le e^{-D(p+\varepsilon\|p) m}.

Để có bất đẳng thức thứ hai, ta xét các biến Y_i = 1-X_i, và áp dụng chứng minh tương tự.

Chặn đơn giản hơn

Có thể thu được một chặn đơn giản hơn bằng cách áp dụng

D(p + x \| p) \geq 2 x^2. Mệnh đề này có thể được chứng minh bằng tính chất lồi của D(p+x\| p) và tính chất \frac{d^2}{dx^2} D(p+x\|p) = \frac{1}{(p+x)(1-p-x)}. Chặn này là một trường hợp đặc biệt của bất đẳng thức Hoeffding. Đôi khi chặn D((1+x) p \| p) \geq x^2 p/4 cho -1/2 \leq x \leq 1/2 cũng được sử dụng.

Trường hợp sai số tương đối

Giả sử X_1, X_2, \ldots, X_n là các biến ngẫu nhiên độc lập nhận giá trị 0 hoặc 1. Giả sử \Pr(X_i = 1) = pi. Khi đó, nếu đặt X = \sum{i=1}^n X_i và \mu là giá trị kỳ vọng của X, thì với mọi \delta > 0 :: \Pr \left[ X > (1+\delta)\mu\right] < \left(\frac{e^\delta}{(1+\delta)^{(1+\delta)\right)^\mu.

Chứng minh

Theo (+), :: \begin{align} \Pr[X > (1 + \delta)\mu)] & \le \inf{t > 0} \frac{\mathbf{E}\left[\prod{i=1}^n\exp(tXi)\right]}{\exp(t(1+\delta)\mu)} \ & = \inf{t > 0} \frac{\prod_{i=1}^n\mathbf{E}[\exp(tXi)]}{\exp(t(1+\delta)\mu)} \ & = \inf{t > 0} \frac{\prod_{i=1}^n\left[p_i\exp(t) + (1-p_i)\right]}{\exp(t(1+\delta)\mu)} \end{align}

Đẳng thức ở dòng thứ 3 là do e^{tX_i} nhận giá trị e^{t} với xác suất p_i và giá trị 1 với xác suất 1-p_i.

Viết lại p_ie^t + (1-p_i)p_i(e^t-1) + 1 và áp dụng 1+x \le e^x (với bất đẳng thức chặt khi x > 0) cho x = p_i(e^t-1), ta có

:: \begin{align} &\Pr[X > (1+\delta)\mu] < \frac{\prod_{i=1}^n\exp(pi(e^t-1))}{\exp(t(1+\delta)\mu)} \ &\qquad = \frac{\exp\left((e^t-1)\sum{i=1}^n p_i\right)}{\exp(t(1+\delta)\mu)} = \frac{\exp((e^t-1)\mu)}{\exp(t(1+\delta)\mu)}. \end{align}

Chọn t = \log(1+\delta) nên t > 0 khi \delta > 0. Thay giá trị của t vào biểu thức trên, ta thu được :: \frac{\exp((e^t-1)\mu)}{\exp(t(1+\delta)\mu)} = \frac{\exp((1+\delta - 1)\mu)}{(1+\delta)^{(1+\delta)\mu = \left[\frac{\exp(\delta)}{(1+\delta)^{(1+\delta)\right]^\mu

Đây chính là bất đẳng thức cần chứng minh. Bằng một chứng minh tương tự, ta có :: \Pr[X < (1-\delta)\mu] < \exp(-\mu\delta^2/2).

Chặn Chernoff cho ma trận

Rudolf Ahlswede và Andreas Winter đã chứng minh một phiên bản của chặn Chernoff cho các biến ngẫu nhiên nhận giá trị ma trận.

👁️ 2 | 🔗 | 💖 | ✨ | 🌍 | ⌚
Trong lý thuyết xác suất, **chặn Chernoff**, đặt tên theo Herman Chernoff, cho một chặn trên giảm theo hàm mũ của đuôi phân phối của tổng nhiều biến ngẫu nhiên độc lập. Nó thường mạnh
Gel Làm Mờ Sẹo Dermatix Ultra 15gThông tin sản phẩm:Chuyên gia mờ sẹo thị phần số 1 Việt Nam⁽*⁾ – Làm phẳng, mềm,mờ sẹo4 ưu điểm nổi bật của Dermatix® Ultra:✓ HIỆU QUẢ: Được chứng
Dermatix Ultra Gel Làm Mờ Sẹo 7gThông tin sản phẩm:Chuyên gia mờ sẹo thị phần số 1 Việt Nam⁽*⁾ – Làm phẳng, mềm,mờ sẹo4 ưu điểm nổi bật của Dermatix® Ultra:✓ HIỆU QUẢ: Được chứng
Trong lý thuyết xác suất, các **bất đẳng thức Bernstein** cho chặn trên của xác suất tổng các biến ngẫu nhiên độc lập nhận giá trị lệch khỏi giá trị kì vọng. Trong trường hợp
Bài này nói về từ điển các chủ đề trong toán học. ## 0-9 * -0 * 0 * 6174 ## A * AES * ARCH * ARMA * Ada Lovelace * Adrien-Marie Legendre *
Trong lý thuyết độ phức tạp tính toán, **BPP** (viết tắt của cụm từ tiếng Anh **bounded-error probabilistic polynomial**) là lớp các bài toán quyết định giải được bằng máy Turing ngẫu nhiên trong thời
nhỏ|Điệu, một chuỗi lặp đi lặp lại, thể hiện trong khiêu vũ: một tranh động miêu tả [[Vanxơ|waltz.]] **Điệu** (từ gốc tiếng Hy Lạp ῥυθμός, rhythmos, "là bất kì chuyển động thường xuyên mang tính