映像音響メディア 試験問題

2015年1月29日



問 1. 情報源 $ S = \left\{ s_1, s_2, s_3, s_4, s_5 \right\}$の生起確率を

$\displaystyle S = \left\{ \begin{array}{ccccc}
s_1, & s_2, & s_3, & s_4, & s_5 \\
1/3, & 1/5, & 1/15, & 2/15, & 4/15
\end{array} \right\}
$

としたとき、この情報源$ S$をハフマン符号で符号化しなさい。


問 2. 次に示すような $ 4 \times 4$ブロックの画素値を $ (4 \times 4点)$ 2次元DCT(離散コサイン変換)してDCT係数 $ F(0,0)$(DC成分)および $ F(2,2)$ を求めなさい。

$\displaystyle \left[
\begin{array}{cccc}
f(0,0) & f(1,0) & f(2,0) & f(3,0) \\...
...& 32 & 16 & 16 \\
8 & 16 & 16 & 32 \\
32 & 8 & 16 & 8
\end{array} \right]
$

 ただし、 $ 4 \times 4$点2次元DCTの基底 $ w_{ij}^{22}$としては

$\displaystyle \left[
\begin{array}{cccc}
w_{00}^{22} & w_{10}^{22} & w_{20}^{...
... -1/8 & 1/8 & 1/8 & -1/8 \\
1/8 & -1/8 & -1/8 & 1/8 \\
\end{array} \right]
$

を用いなさい。


問 3. 問 2. で求めたDCT係数$ F(0,0)$$ F(2,2)$を以下の量子化テーブルを用いて量子化しなさい。 ただし、画質と符号量(圧縮率)を調整するパラメータは用いないもの($ q=1$)とする。

$\displaystyle \left[
\begin{array}{cccc}
Q(0,0) & Q(1,0) & Q(2,0) & Q(3,0)\\ ...
...& 87 & 62 \\
35 & 64 & 104 & 92 \\
92 & 98 & 100 & 99
\end{array} \right]
$


問 4. MPEG Audio LayerIII(MP3)によるオーディオ圧縮符号化について次の問いに答えなさい。

 (1) MP3で用いられている聴覚心理モデルについて説明しなさい。

 (2) 直交変換する際にブロック間歪みを軽減するための仕組みを説明しなさい。


問 5. 動き推定によって、図 4-1 に示すような左上座標が(0,0)である対象フレーム$ f_n$ $ 16 \times 16$ブロックに対応する参照フレーム$ f_{n-1}$上のブロックが、図 4-2 に示すような左上座標(1,2)の位置になった場合について次の問いに答えなさい。

\resizebox{.15\textwidth}{!}{\includegraphics{f_n.eps}} \resizebox{.15\textwidth}{!}{\includegraphics{f_n-1.eps}}
図 4-1 対象フレーム$ f_n$ 図 4-2 参照フレーム$ f_{n-1}$

ただし

$\displaystyle f_n(3,2) = 128 $

$ \left[
\begin{array}{ccccccccc}
f_{n-1}(0,0) & f_{n-1}(1,0) & f_{n-1}(2,0) &...
...\vdots &\vdots &\vdots &\vdots &\vdots &\vdots &\ddots
\end{array} \right]
$
としなさい。

 (1) 動きベクトルを求めなさい。

 (2) 予測画像$ f_n'(3,2)$を求めなさい。

 (3) 予測誤差画像 $ d_n(3,2)$を求めなさい。