AI資格ドリル

G検定 大項目5 ディープラーニングの要素技術 予想問題と解説

G検定大項目5 ディープラーニングの要素技術」の予想問題を13、各問の完全解説つきで掲載しています。全問オリジナル自作・公式シラバス準拠です。

この分野で問われる主な論点
  • 畳み込みニューラルネットワーク
  • 再帰型ニューラルネットワーク
  • 最適化と汎化
  • 生成モデルと注意機構

間違えやすいポイント(作問者分析)

当サイトの作問時に観察した、取り違えやすい論点です(公式の統計ではありません)。

  • CNN(画像・畳み込み/プーリング)とRNN(時系列・系列データ)の使い分け。
  • LSTMとGRUのゲート数の混同(LSTM=3ゲート+記憶セル、GRU=2ゲートに簡略化)。
  • 最適化手法の取り違え(モメンタム=慣性、AdaGrad/RMSProp=適応学習率、Adam=両方)。GAN・VAE・拡散モデルの生成方式の違い。
1 ・ 畳み込みニューラルネットワーク

CNNにおいて、特徴マップの縦横サイズを縮小して計算量を抑えつつ、対象の位置が多少ずれても出力が変化しにくい性質(位置不変性)を高める働きを主に担う層はどれか。

  • プーリング層正解
  • 全結合層
  • 畳み込み層
  • 出力層
解説

プーリング層は特徴マップを縮小(ダウンサンプリング)し、対象の位置ずれに対する頑健性(位置不変性)を高める。畳み込み層はフィルタで特徴を抽出する層、全結合層は抽出した特徴を統合して分類などに用いる層、出力層は最終的な予測値を出す層であり、いずれも空間サイズの縮小と位置不変性の付与を主目的とはしない。

https://www.jdla.org/certificate/general/ (大項目5 ディープラーニングの要素技術)

2 ・ 畳み込みニューラルネットワーク

生物の視覚野における単純型細胞と複雑型細胞の働きに着想を得て提案された、現在の畳み込みニューラルネットワークの原型とされる初期の階層型モデルはどれか。

  • LeNet
  • ResNet
  • ネオコグニトロン正解
  • AlexNet
解説

ネオコグニトロンは視覚野の単純型細胞・複雑型細胞の階層構造に着想を得た初期モデルで、現在のCNNの原型とされる。LeNetは誤差逆伝播法で学習する初期のCNNだが、単純型・複雑型細胞に着想した原型モデルそのものではない。AlexNetはILSVRCで注目された深いCNN、ResNetは残差接続を導入したより新しいモデルであり、いずれも原型とは言えない。

https://www.jdla.org/certificate/general/ (大項目5 ディープラーニングの要素技術)

3 ・ 畳み込みニューラルネットワーク

畳み込み演算において、フィルタを入力データ上でずらしながら適用する際の、1回あたりの移動幅を指す用語はどれか。

  • ストライド正解
  • フィルタ
  • プーリング
  • パディング
解説

ストライドは畳み込みでフィルタをずらす際の移動幅で、値を大きくすると出力サイズが小さくなる。パディングは入力の周囲に画素を補う処理で出力サイズの調整に使い、フィルタ(カーネル)は特徴抽出に用いる重みのまとまり、プーリングは特徴マップを縮小する処理であり、いずれも移動幅そのものを指す語ではない。

https://www.jdla.org/certificate/general/ (大項目5 ディープラーニングの要素技術)

4 ・ 再帰型ニューラルネットワーク

ある時刻の中間層の状態を次の時刻の入力として再び取り込む構造を持ち、文章や音声のような前後関係のある可変長の系列データを扱うのに適したニューラルネットワークはどれか。

  • 変分オートエンコーダ(VAE)
  • 畳み込みニューラルネットワーク(CNN)
  • リカレントニューラルネットワーク(RNN)正解
  • 敵対的生成ネットワーク(GAN)
解説

前の時刻の中間状態を次時刻に再帰的に渡す構造を持つのはリカレントニューラルネットワーク(RNN)で、可変長の系列データに適する。CNNは画像など空間的データの特徴抽出、GANはデータ生成、VAEは確率的な符号化と生成を行うものであり、時系列の再帰構造を本質としない。

https://www.jdla.org/certificate/general/ (大項目5 ディープラーニングの要素技術)

5 ・ 再帰型ニューラルネットワーク

通常の再帰型ニューラルネットワークが長い系列を扱うと勾配消失が起きやすい問題に対し、入力・出力・忘却の3種類のゲートと記憶セルを備えて長期の依存関係を保持できるようにした手法はどれか。

  • BPTT
  • 双方向RNN
  • LSTM正解
  • GRU
解説

入力・出力・忘却の3つのゲートと記憶セルを持ち、長期依存を保持して勾配消失を緩和するのはLSTM。GRUも勾配消失対策だがゲートは2つ(リセット・更新)で独立した記憶セルを持たず、説明と一致しない。双方向RNNは系列を前後両方向から処理する構造、BPTTは時間方向に展開して誤差逆伝播を行う学習法であり、ゲート機構の手法ではない。

https://www.jdla.org/certificate/general/ (大項目5 ディープラーニングの要素技術)

6 ・ 最適化と汎化

勾配の移動平均による慣性の効果と、パラメータごとに学習率を適応的に調整する仕組みの両方を兼ね備えた、ディープラーニングで広く用いられる最適化アルゴリズムはどれか。

  • AdaGrad
  • RMSProp
  • Adam正解
  • モメンタム
解説

慣性(モメンタム)と、パラメータごとの適応的な学習率調整の両方を併せ持つのはAdam。モメンタムは慣性のみ、AdaGradとRMSPropはパラメータごとの学習率調整のみであり、両方の性質を同時に備えるという説明には当てはまらない。

https://www.jdla.org/certificate/general/ (大項目5 ディープラーニングの要素技術)

7 ・ 最適化と汎化

学習済みの大きなモデル(教師)の出力を、より小さなモデル(生徒)に模倣させて学習させることで、精度をできるだけ保ちながらモデルを軽量化する手法はどれか。

  • データ拡張
  • 蒸留正解
  • 転移学習
  • ファインチューニング
解説

教師となる大きなモデルの出力を生徒となる小さなモデルに学習させ、精度を保ちつつ軽量化するのは蒸留(distillation)。転移学習は学習済みモデルを別タスクに再利用する枠組み、ファインチューニングは学習済みモデルの重みを新タスク向けに微調整する手法、データ拡張は学習データを水増しする手法であり、いずれもモデルの小型化を目的とした教師生徒の枠組みではない。

https://www.jdla.org/certificate/general/ (大項目5 ディープラーニングの要素技術)

8 ・ 生成モデルと注意機構

2つのネットワークを競い合わせ、一方が本物らしいデータを作り出し、もう一方が本物と偽物を見分けるよう交互に学習させることで、高品質なデータ生成を目指す手法はどれか。

  • 敵対的生成ネットワーク(GAN)正解
  • 変分オートエンコーダ(VAE)
  • オートエンコーダ
  • 拡散モデル(Diffusion Model)
解説

本物らしいデータを作る生成器と、真偽を見分ける識別器を競わせて交互に学習するのは敵対的生成ネットワーク(GAN)。VAEは確率的な潜在変数を用いる生成モデル、拡散モデルはノイズの付与と除去で生成する手法、オートエンコーダは入力の再構成を学ぶものであり、2つのネットワークの競合という枠組みではない。

https://www.jdla.org/certificate/general/ (大項目5 ディープラーニングの要素技術)

9 ・ 生成モデルと注意機構

データに少しずつノイズを加えていく過程を逆向きにたどり、ランダムなノイズから段階的にデータを復元するように学習して、画像などを生成するモデルはどれか。

  • 敵対的生成ネットワーク(GAN)
  • リカレントニューラルネットワーク(RNN)
  • 拡散モデル(Diffusion Model)正解
  • 変分オートエンコーダ(VAE)
解説

データへ徐々にノイズを加える過程を逆にたどり、ノイズから段階的に復元して生成するのは拡散モデル(Diffusion Model)。VAEは潜在変数を介した符号化と復元、GANは生成器と識別器の競合、RNNは系列の再帰処理であり、ノイズ除去の過程を逆にたどって生成する仕組みではない。

https://www.jdla.org/certificate/general/ (大項目5 ディープラーニングの要素技術)

10 ・ 生成モデルと注意機構

再帰や畳み込みの構造を用いず、系列内の各要素が互いにどれだけ関連するかを表す重みを計算する注意の仕組みを全面的に採用した、系列データを扱う多くのタスクで主流となったモデルはどれか。

  • 双方向RNN
  • GRU
  • LSTM
  • Transformer正解
解説

再帰や畳み込みを用いず、系列内の要素同士の関連度(自己注意)を計算して情報を重み付けするのはTransformer。LSTM・GRU・双方向RNNはいずれも再帰構造を基礎とする手法であり、注意機構を全面的に採用したモデルではない。

https://www.jdla.org/certificate/general/ (大項目5 ディープラーニングの要素技術)

11 ・ 生成モデルと注意機構

学習データとして変換前の画像と変換後の画像が一対一に対応づけられた組を用意できない場合でも、ある画像群がもつ特徴を別の画像群がもつ特徴へ相互に変換できるように学習する、敵対的生成ネットワークを応用した画像変換の手法はどれか。

  • 条件付きGAN(Conditional GAN)
  • StyleGAN
  • Pix2Pix
  • CycleGAN正解
解説

正解はCycleGAN。変換前後が一対一に対応づけられた画像の組(ペア)を用意できなくても、ある画像群がもつ特徴を別の画像群がもつ特徴へ相互に変換できるよう学習する手法である。Pix2Pixは対応するペア画像を前提とした画像変換、条件付きGAN(Conditional GAN)はラベルなどの条件を与えて生成物を制御する手法、StyleGANはスタイルを階層的に制御して高精細な画像を生成する手法であり、いずれも対応ペアが不要な相互変換を主目的とするものではない。

https://www.jdla.org/certificate/general/ (大項目5 ディープラーニングの要素技術)

12 ・ 生成モデルと注意機構

変換元と変換先が一対一に対応づいた画像のペアを教師データとして用意し、入力画像を対応する別の見た目の画像(たとえば線画から写真)へ変換できるように学習する、敵対的生成ネットワークを応用した画像変換の手法はどれか。

  • StyleGAN
  • DCGAN
  • CycleGAN
  • Pix2Pix正解
解説

正解はPix2Pix。変換元と変換先が一対一に対応づいた画像のペアを教師データとして用い、入力画像を対応する別の見た目の画像へ変換する手法である。CycleGANは対応ペアが不要な変換、DCGANは生成器・識別器に畳み込みを用いて画像生成を安定化させたモデル、StyleGANはスタイルを階層的に制御するモデルであり、いずれも対応ペアを前提とした画像変換そのものを指すものではない。

https://www.jdla.org/certificate/general/ (大項目5 ディープラーニングの要素技術)

13 ・ 生成モデルと注意機構

初期の敵対的生成ネットワークの生成器と識別器に畳み込みネットワークの構造を全面的に取り入れ、画像生成の品質と学習の安定性を高めた代表的なモデルはどれか。

  • DCGAN正解
  • CycleGAN
  • StyleGAN
  • 条件付きGAN(Conditional GAN)
解説

正解はDCGAN。初期のGANの生成器・識別器に畳み込みネットワークの構造を全面的に取り入れ、画像生成の品質と学習の安定性を高めた代表的なモデルである。条件付きGAN(Conditional GAN)は条件を与えて生成を制御する手法、CycleGANは対応ペアが不要な画像変換、StyleGANはスタイルを階層的に制御する手法であり、いずれも畳み込みの導入による学習安定化を主眼とした初期モデルではない。

https://www.jdla.org/certificate/general/ (大項目5 ディープラーニングの要素技術)