AI資格ドリル

G検定 大項目6 ディープラーニングの応用例 予想問題と解説

G検定大項目6 ディープラーニングの応用例」の予想問題を15、各問の完全解説つきで掲載しています。全問オリジナル自作・公式シラバス準拠です。

この分野で問われる主な論点
  • 画像認識・物体検出
  • 自然言語処理
  • 音声・強化学習
  • 生成AI・基盤モデル

間違えやすいポイント(作問者分析)

当サイトの作問時に観察した、取り違えやすい論点です(公式の統計ではありません)。

  • 物体検出(R-CNN系/YOLO/SSD)とセグメンテーション(セマンティック=画素単位の塗り分け、インスタンス=個体ごとに区別)の混同。
  • word2vec・BERT・GPTの違い(BERT=前後両方向、GPT=一方向・自己回帰)。
  • 強化学習の応用(DQN、AlphaGo)と画像/言語タスクの取り違え。
1 ・ 画像認識・物体検出

画像認識の競技会ILSVRCにおいて、ディープラーニング(畳み込みニューラルネットワーク)を用いた手法で従来手法を大差で上回って優勝し、その後のディープラーニング隆盛のきっかけをつくったモデルはどれか。

  • VGG
  • ResNet
  • AlexNet正解
  • GoogLeNet
解説

ILSVRCでディープラーニングを用いて従来手法を大差で上回り優勝し、ディープラーニング隆盛の契機となったのはAlexNet。GoogLeNet・ResNet・VGGはいずれもその後のILSVRC等で精度を高めた後続のモデルで、ブームの火付け役ではない。

https://www.jdla.org/certificate/general/ (大項目6 ディープラーニングの応用例)

2 ・ 画像認識・物体検出

画像中の各ピクセルがどのクラスに属するかを画素単位で分類し、同じクラスに属する物体どうしは個別に区別せずに領域を塗り分けるタスクはどれか。

  • セマンティックセグメンテーション正解
  • インスタンスセグメンテーション
  • 画像認識(クラス分類)
  • 物体検出
解説

画素単位でクラスを割り当て、同一クラスの物体を区別せずに領域を塗り分けるのはセマンティックセグメンテーション。インスタンスセグメンテーションは同じクラスでも物体ごとに区別する点が異なる。物体検出は矩形(バウンディングボックス)で位置を示す手法、画像認識(クラス分類)は画像全体に1つのクラスを与える手法で、いずれも画素単位の塗り分けではない。

https://www.jdla.org/certificate/general/ (大項目6 ディープラーニングの応用例)

3 ・ 画像認識・物体検出

物体検出において、画像を一度ネットワークに通すだけで物体の位置とクラスを同時に推定し、高速な検出を実現する代表的な手法はどれか。

  • ResNet
  • Faster R-CNN
  • R-CNN
  • YOLO正解
解説

画像を一度ネットワークに通すだけで物体の位置とクラスを同時に推定し高速処理を実現するのはYOLO。R-CNNやFaster R-CNNは候補領域を抽出してから分類する多段階方式で相対的に低速。ResNetは画像分類(認識)のモデルであり、物体検出そのものを行う手法ではない。

https://www.jdla.org/certificate/general/ (大項目6 ディープラーニングの応用例)

4 ・ 自然言語処理

単語を固定長の実数ベクトルに変換し、ベクトルの加減算によって単語間の意味的な関係を表せるようにした代表的な手法はどれか。

  • seq2seq
  • word2vec正解
  • 形態素解析
  • 機械翻訳
解説

単語を固定長の実数ベクトル(分散表現)に変換し、ベクトルの演算で意味的な関係を表せるようにした代表的手法はword2vec。形態素解析は文を単語に分割する処理、seq2seqは系列変換のモデル、機械翻訳はタスク名であり、いずれも単語ベクトルそのものを学習する手法ではない。

https://www.jdla.org/certificate/general/ (大項目6 ディープラーニングの応用例)

5 ・ 自然言語処理

Transformerを基盤とし、文の前後両方向の文脈を同時に捉えて事前学習を行い、その後さまざまな言語タスクにファインチューニングして使われる言語モデルはどれか。

  • seq2seq
  • BERT正解
  • GPT
  • word2vec
解説

Transformerを基盤に、前後両方向の文脈を同時に捉えて事前学習し、各タスクへファインチューニングして使うのはBERT。GPTもTransformer系だが左から右への一方向(自己回帰)で、両方向同時ではない。word2vecは静的な単語ベクトル、seq2seqは系列変換のモデルで、いずれも双方向の事前学習言語モデルではない。

https://www.jdla.org/certificate/general/ (大項目6 ディープラーニングの応用例)

6 ・ 自然言語処理

入力した系列をいったん固定長のベクトルに符号化し、それを復号して別の系列を生成するEncoder-Decoder型のモデルで、機械翻訳などに用いられるものはどれか。

  • 形態素解析
  • word2vec
  • BERT
  • seq2seq正解
解説

入力系列を固定長ベクトルに符号化し、それを復号して別の系列を生成するEncoder-Decoder型のモデルがseq2seqで、機械翻訳などに用いられる。形態素解析は分かち書き処理、word2vecは単語ベクトルの獲得、BERTは双方向の事前学習モデルであり、生成的な系列変換を主目的とはしない。

https://www.jdla.org/certificate/general/ (大項目6 ディープラーニングの応用例)

7 ・ 音声・強化学習

音声信号から人間の聴覚特性を考慮して抽出され、音声認識で古くから用いられてきた特徴量はどれか。

  • 敵対的生成ネットワーク(GAN)
  • メル周波数ケプストラム係数正解
  • 主成分分析(PCA)
  • 誤差逆伝播法
解説

音声信号から人間の聴覚特性を考慮して抽出され、音声認識で古くから使われてきた特徴量はメル周波数ケプストラム係数。主成分分析(PCA)は次元削減、敵対的生成ネットワーク(GAN)は生成モデル、誤差逆伝播法は学習アルゴリズムであり、いずれも音声の特徴量ではない。

https://www.jdla.org/certificate/general/ (大項目6 ディープラーニングの応用例)

8 ・ 音声・強化学習

ゲーム画面(画素)を入力として強化学習(Q学習)とディープラーニングを組み合わせ、ビデオゲームを人間以上のスコアでプレイできるようにした手法はどれか。

  • AlphaGo
  • word2vec
  • 方策勾配法
  • DQN正解
解説

ゲーム画面を入力に強化学習(Q学習)とディープラーニングを組み合わせ、ビデオゲームを人間以上のスコアでプレイできるようにしたのはDQN。AlphaGoは囲碁でプロ棋士に勝利したプログラム、方策勾配法は方策を直接最適化する強化学習の手法、word2vecは自然言語処理の手法であり、いずれも該当しない。

https://www.jdla.org/certificate/general/ (大項目6 ディープラーニングの応用例)

9 ・ 生成AI・基盤モデル

大規模言語モデルが、事実に基づかないもっともらしい誤った情報を生成してしまう現象を指す語はどれか。

  • ハルシネーション正解
  • ファインチューニング
  • マルチモーダル
  • プロンプト
解説

大規模言語モデルが事実に基づかないもっともらしい誤情報を生成してしまう現象はハルシネーション。マルチモーダルは複数種類のデータを扱うこと、プロンプトはモデルへの入力指示、ファインチューニングは追加学習による調整を指し、いずれも誤情報生成の現象名ではない。

https://www.jdla.org/certificate/general/ (大項目6 ディープラーニングの応用例)

10 ・ 生成AI・基盤モデル

大量かつ多様なデータで事前学習され、その後さまざまな下流タスクへ適応(ファインチューニング等)して幅広く応用できる大規模なモデルの総称はどれか。

  • 基盤モデル(Foundation Model)正解
  • 敵対的生成ネットワーク(GAN)
  • 変分オートエンコーダ(VAE)
  • 畳み込みニューラルネットワーク(CNN)
解説

大量かつ多様なデータで事前学習し、その後さまざまな下流タスクへ適応して幅広く応用できる大規模モデルの総称が基盤モデル。敵対的生成ネットワーク(GAN)・変分オートエンコーダ(VAE)・畳み込みニューラルネットワーク(CNN)はいずれも特定の構造を持つモデルであり、多様なタスクに広く適応する総称ではない。

https://www.jdla.org/certificate/general/ (大項目6 ディープラーニングの応用例)

11 ・ 画像認識・物体検出

GoogLeNetに採用された、サイズの異なる複数の畳み込みフィルタやプーリングを同じ入力に並列に適用し、それらの出力を結合することで多様な大きさの特徴を同時に捉えようとする構造はどれか。

  • スキップ結合(残差接続)
  • ドロップアウト
  • Inception正解
  • バッチ正規化
解説

正解はInception。GoogLeNetは、サイズの異なる複数の畳み込みフィルタやプーリングを同じ入力に並列に適用し、その出力を結合する構造(Inception)を積み重ねたモデルで、多様な大きさの特徴を同時に捉える。スキップ結合(残差接続)は層を飛び越えて入力を足し合わせる別の工夫でResNetに用いられる。ドロップアウトはノードをランダムに無効化する過学習対策、バッチ正規化は層の出力分布を整える手法であり、いずれも並列の畳み込みを束ねる構造ではない。

https://www.jdla.org/certificate/general/ (大項目6 ディープラーニングの応用例)

12 ・ 画像認識・物体検出

入力画像を段階的に縮小して特徴を抽出する経路と、段階的に拡大して元の解像度へ戻す経路を左右対称に配置し、対応する層どうしを直接つないで細かな位置情報を補いながら画素単位の領域分けを出力する、医用画像などで広く用いられるモデルはどれか。

  • Faster R-CNN
  • FCN
  • Mask R-CNN
  • U-Net正解
解説

正解はU-Net。特徴を抽出する収縮経路と、解像度を元へ戻す拡大経路を左右対称に配置し、対応する層どうしをスキップ結合で直接つないで細部の位置情報を補いながら画素単位の領域分け(セマンティックセグメンテーション)を出力するモデルで、医用画像などで広く使われる。FCNも画素単位の領域分けを行うが左右対称のU字構造を特徴とはしない。Mask R-CNNは物体ごとに領域を切り出すインスタンスセグメンテーションの手法、Faster R-CNNは矩形で物体位置を求める物体検出の手法であり、いずれも本問の説明とは異なる。

https://www.jdla.org/certificate/general/ (大項目6 ディープラーニングの応用例)

13 ・ 画像認識・物体検出

画像を小さなパッチに分割してそれらを系列として扱い、自然言語処理で成果を上げた自己注意(Self-Attention)の仕組みを画像認識に応用したモデルはどれか。

  • リカレントニューラルネットワーク(RNN)
  • 敵対的生成ネットワーク(GAN)
  • Vision Transformer(ViT)正解
  • 畳み込みニューラルネットワーク(CNN)
解説

正解はVision Transformer(ViT)。画像を小さなパッチに分割して系列として扱い、自然言語処理で成果を上げた自己注意(Self-Attention)の仕組みを画像認識に応用したモデルで、畳み込みを用いずに高い性能を示した。畳み込みニューラルネットワーク(CNN)は畳み込みで画像の特徴を抽出する従来の手法、リカレントニューラルネットワーク(RNN)は系列を再帰的に処理する手法、敵対的生成ネットワーク(GAN)はデータ生成の手法であり、いずれも自己注意を画像認識に応用したモデルではない。

https://www.jdla.org/certificate/general/ (大項目6 ディープラーニングの応用例)

14 ・ 自然言語処理

単語を1種類の固定したベクトルで表すのではなく、同じ単語であっても文中の前後の文脈に応じて異なるベクトル表現が得られるようにした、文脈を考慮した分散表現の手法はどれか。

  • word2vec
  • 形態素解析
  • ELMo正解
  • Transformer
解説

正解はELMo。同じ単語でも文中の前後の文脈に応じて異なるベクトル表現が得られる、文脈を考慮した分散表現を与える手法である。word2vecは1つの単語につねに同じ固定のベクトルを割り当てる静的な手法で文脈を反映しない。形態素解析は文を単語に分割する処理、Transformerは自己注意を用いるネットワーク構造そのものであり、いずれも文脈に応じて変化する単語の分散表現を与える手法を指すものではない。

https://www.jdla.org/certificate/general/ (大項目6 ディープラーニングの応用例)

15 ・ 音声・強化学習

人間の対局記録(棋譜)を一切学習に用いず、自分自身との対戦を繰り返す強化学習だけで囲碁などのゲームを習得し、人間の棋譜から学習した従来版を上回ったプログラムはどれか。

  • AlphaGo
  • AlphaZero正解
  • Actor-Critic
  • DQN
解説

正解はAlphaZero。人間の対局記録(棋譜)を用いず、自己対戦(セルフプレイ)による強化学習だけで囲碁・チェス・将棋などを習得し、人間の棋譜から学習した従来版を上回ったプログラムである。AlphaGoは人間の棋譜による学習を取り入れていた点で本問の条件と異なる。DQNはゲーム画面を入力にビデオゲームを学習した深層強化学習の手法、Actor-Criticは行動を選ぶ部分と価値を評価する部分を組み合わせた強化学習の手法であり、いずれも本問の説明に当てはまるプログラムではない。

https://www.jdla.org/certificate/general/ (大項目6 ディープラーニングの応用例)