問題設定
A={0,1} を標本空間とする確率変数 X,Y の同時確率 PXY(x,y)=PXY(X=x,Y=y) を以下のように定義し、周辺確率 PX(x),PY(y) を求める。
周辺確率
PX(x)PY(y)=y∈A∑PXY(x,y)=x∈A∑PXY(x,y)
Y \ X | 0 | 1 | PY |
---|
0 | 81 | 41 | 83 |
1 | 83 | 41 | 85 |
PX | 21 | 21 | 1 |
情報量
情報量 IXY(x,y),IX(x),IY(y) を求める。
情報量
IXY(x,y)IX(x)IY(y)=−log2PXY(x,y)=−log2PX(x)=−log2PY(y)
Y \ X | 0 | 1 | IY |
---|
0 | 3 | 2 | 3−log23 |
1 | 3−log23 | 2 | 3−log25 |
IX | 1 | 1 | 0 |
エントロピー
エントロピー HX(X),HY(Y) を求める。
エントロピー
HX(X)HY(Y)=EX[IX(X)]=x∈A∑PX(x)IX(x)=−x∈A∑PX(x)log2PX(x)=EY[IY(Y)]=y∈A∑PY(y)IY(y)=−y∈A∑PY(y)log2PY(y)
定理: エントロピーの上界式
HX(X)≤log2∣A∣HY(Y)≤log2∣A∣
HX(X)=log2∣A∣ となるのは X が一様分布であるときである。
HX(X)HY(Y)=EX[IX(X)]=21⋅1+21⋅1=1=EY[IY(Y)]=83⋅(3−log23)+85⋅(3−log25)=3−83log23−85log25(=3−81log233⋅55)
条件付きエントロピー
条件付きエントロピー HY∣X(Y∣X),HX∣Y(X∣Y) を求める。
条件付きエントロピー
HY∣X(Y∣X)HX∣Y(X∣Y)=EXY[IY∣X(Y∣X)]=x∈A∑y∈A∑PXY(x,y)IY∣X(Y∣X)=−x∈A∑y∈A∑PXY(x,y)log2PY∣X(Y∣X)=EXY[IX∣Y(X∣Y)]=x∈A∑y∈A∑PXY(x,y)IX∣Y(X∣Y)=−x∈A∑y∈A∑PXY(x,y)log2PX∣Y(X∣Y)
定理: エントロピーと条件付きエントロピーの関係
HX∣Y(X∣Y)≤HX(X)
HX∣Y(X∣Y)=HX(X) となるのは X と Y が独立なときである。
HY∣X(Y∣X)HX∣Y(X∣Y)=EXY[IY∣X(Y∣X)]=81⋅2+83⋅(2−log23)+41⋅1+41⋅1=23−83log23=EXY[IX∣Y(X∣Y)]=81⋅log23+83⋅(log25−log23)+41⋅(log23−1)+41⋅(log25−1)=−21+85log25
同時エントロピー
同時エントロピー HXY(X,Y) を求める。
同時エントロピー
HXY(X,Y)=EXY[IXY(X,Y)]=x∈A∑y∈A∑PXY(x,y)IXY(x,y)=−x∈A∑y∈A∑PXY(x,y)log2PXY(x,y)
定理: エントロピーの加法性
HXY(X,Y)=HX(X)+HY∣X(Y∣X)=HY(Y)+HX∣Y(X∣Y)
HXY(X,Y)=EXY[IXY(X,Y)]=81⋅3+83⋅(3−log23)+41⋅2+41⋅2=25−83log23
相互情報量
相互情報量 I(X;Y) を求める。
相互情報量
I(X;Y)=EXY[IX(X)+IY(Y)−IXY(X,Y)]=x∈A∑y∈A∑PXY(x,y)(IX(x)+IY(y)−IXY(x,y))=x∈A∑y∈A∑PXY(x,y)log2PX(x)PY(y)PXY(x,y)
定理
I(X;Y)=D(PXY∣∣PXPY)
定理: 相互情報量とエントロピーの関係
I(X;Y)I(X;Y)I(X;Y)I(X;X)=H(X)+H(Y)−H(X,Y)=H(X)−H(X∣Y)=H(Y)−H(Y∣X)=I(Y;X)=HX(X)
定理: 相互情報量の非負性
I(X;Y)≥0
I(X;Y)=0 となるのは X と Y が独立なときである。
I(X;Y)=81⋅(1−log23)+83(1+log23−log25)+41(2−log23)+41(2−log25)=23−85log25
交差エントロピー
交差エントロピー H(PX,PY),H(PY,PX) を求める。
交差エントロピー
H(PX,PY)H(PY,PX)=EX[IY(X)]=x∈A∑PX(x)IY(x)=−x∈A∑PX(x)log2PY(x)=EY[IX(Y)]=y∈A∑PY(y)IX(y)=−y∈A∑PY(y)log2PX(y)
H(PX,PY)H(PY,PX)=21⋅(3−log23)+21⋅(3−log25)=3−21log23−21log25(=3−21log23⋅5)=83⋅1+85⋅1=1
KL ダイバージェンス
KL ダイバージェンス D(PX∣∣PY),D(PY∣∣PX) を求める。
KL ダイバージェンス
D(PX∣∣PY)D(PY∣∣PX)=EX[IY(X)−IX(X)]=x∈A∑PX(x)(IY(x)−IX(x))=x∈A∑PX(x)log2PY(x)PX(x)=EY[IX(Y)−IY(Y)]=y∈A∑PY(y)(IX(y)−IY(y))=y∈A∑PY(y)log2PX(y)PY(y)
定理
D(PX∣∣PY)D(PY∣∣PX)=H(PX,PY)−HX(X)=H(PY,PX)−HY(Y)
定理: ダイバージェンスの非負性
D(PX∣∣PY)≥0D(PY∣∣PX)≥0
D(PX∣∣PY)=D(PY∣∣PX)=0 となるのは ∀x∈A,PX(x)=PY(x) のときである。
D(PX∣∣PY)D(PY∣∣PX)=21⋅(2−log23)+21(2−log25)=2−21log23−21log25(=2−21log23⋅5)=83⋅(−2+log23)+85⋅(−2+log25)=−2+83log23+85log25(=−2+81log233⋅55)