映像音響メディア 試験問題(2022年度)

高知工科大学 情報学群

2023年 2月 2日

試験の注意


1. 情報源$ S$

$\displaystyle S = \left\{ \begin{array}{ccccc}
s_1, & s_2, & s_3, & s_4, & s_5 \\
0.10, & 0.20, & 0.16, & 0.24, & 0.30
\end{array} \right\}
$

 としたとき、次の問いに答えなさい。

 (1) 情報源$ S$をハフマン符号化しなさい。

 (2) 情報源$ S$のエントロピー $ H(S)=2.23$[bit/記号] として、(1)で求めた符号の効率を求めなさい。


2. MPEG-1 Audio Layer III(MP3)で用いられている音声圧縮符号化について、 次の問いに答えなさい。

 (1) 聴覚心理モデルで、マスキング効果によってほとんど音として知覚されないため削除されてるのはどのような信号か、図を用いて説明しなさい。

 (2) 直交変換のためにブロック間で生じる歪みを軽減するために、どのような処理が施されているか説明しなさい。


3. 直交変換と変換係数量子化についての以下の問いに答えなさい。

 (1) $ 4 \times 4$ブロックの画素値(輝度値)$ f(i,j)$ $ (i,j = 0, 1, 2, 3)$ を 2次元DCT(離散コサイン変換)して、以下のようなDCT係数 $ F(u,v)$ が得られたとする。

$\displaystyle \left[
\begin{array}{cccc}
F(0,0) & F(1,0) & F(2,0) & F(3,0) \\...
... & -16 \\
-22 & -36 & -40 & 22 \\
-26 & 4 & -12 & -8
\end{array} \right]
$

  このDCT係数を下に示す量子化テーブル$ Q(u,v)$を用いて量子化しなさい。 ただし、画質と符号量(圧縮率)を調整するパラメータを$ q=2$としなさい。

$\displaystyle \left[
\begin{array}{cccccccc}
Q(0,0) & Q(1,0) & Q(2,0) & Q(3,0...
...& 69 \\
18 & 37 & 68 & 103 \\
49 & 78 & 103 & 120 \\
\end{array} \right]
$

 (2) (1) で量子化したDCT係数を逆量子化してから、 $ 4 \times 4$点2次元離散コサイン変換(DCT)の基底 $ w_{00}^{uv}$ $ (u,v = 0,1,2,3)$

$\displaystyle \left[
\begin{array}{rrrr}
w_{00}^{00} & w_{00}^{10} & w_{00}^{...
...0.25 & 0.33 & 0.25 & 0.14 \\
0.14 & 0.18 & 0.14 & 0.07
\end{array} \right]
$

  として $ 4 \times 4$点逆離散コサイン変換(逆DCT)して、画素値$ f(0,0)$を求めなさい。


4. 動き推定によって、対象フレーム$ f_n$$ (1,1)$ブロックに対する動きベクトルが

$\displaystyle \left[
\begin{array}{l}
v_x \\ v_y
\end{array} \right]
=
\left[
\begin{array}{r}
-2 \\ -1
\end{array} \right]
$

 と定まった場合について、次の問いに答えなさい。

 ただし、対象フレーム$ f_n$$ (1,1)$ブロック、参照フレーム$ f_{n-1}$の画素値はそれぞれ
 $ \left[
\begin{array}{cccc}
f_n(4,4) & f_n(5,4) & f_n(6,4) & f_n(7,4) \\
f_...
... & \upsilon_{5,7} & \upsilon_{6,7} & \upsilon_{7,7} \\
\end{array} \right]
$

 $ \left[
\begin{array}{llllllllll}
\cdots& f_{n-1}(2,0) & f_{n-1}(3,0) & f_{n-...
...\vdots &\vdots &\vdots &\vdots &\vdots &\vdots &\ddots
\end{array} \right]
$
 として、 動き補償のブロック(マクロブロック)サイズは $ 4 \times 4$画素としなさい。

 (1) $ f_n$$ (1,1)$ブロックに対する予測画像$ f_n'$を求めなさい。

 (2) $ f_n$$ (1,1)$ブロックに対する予測誤差画像 $ d_n$を求めなさい。


5. 直交変換の変換行列(直交行列) $ V^T$

$\displaystyle V^T =
\left[
\begin{array}{cccc}
\displaystyle\frac{1}{2} & \d...
...&
- \displaystyle\frac{1}{\sqrt{2}} \cos \frac{3 \pi}{8}
\end{array} \right]
$

 で与えられるとき、以下の問いに答えなさい。 ただし、$ \alpha$$ \beta$は未知である。

 (1) $ V^T$が直交行列であるために適切な $ \alpha$$ \beta$ を求めなさい。 このとき、$ \alpha$$ \beta$ が適切となる理由も説明しなさい。

 (2) 求めた直交行列 $ V^T$ を用いた1次変換が直交変換になることを確認しなさい。