AI資格ドリル

生成AIパスポート 第2章 生成AI(ジェネレーティブAI) 予想問題と解説

生成AIパスポート第2章 生成AI(ジェネレーティブAI)」の予想問題を27、各問の完全解説つきで掲載しています。全問オリジナル自作・公式シラバス準拠です。

この分野で問われる主な論点
  • ChatGPT
  • 生成AIの誕生まで
  • その他の主要生成AI

間違えやすいポイント(作問者分析)

当サイトの作問時に観察した、取り違えやすい論点です(公式の統計ではありません)。

  • ハルシネーション・アライメント・ファインチューニングの取り違え。事実と異なるもっともらしい出力=ハルシネーション、人間の意図に沿わせること=アライメント、追加学習で調整=ファインチューニング。
  • GANとVAEの混同。GANは生成器と識別器を競わせる方式、VAEはエンコーダ・デコーダと潜在ベクトルを使う方式。
  • Transformerの中核を畳み込みや位置エンコーディングと取り違える。中核は自己注意(Self-Attention)。
1 ・ ChatGPT

生成AIが、事実と異なる内容をもっともらしい文章として出力してしまう現象を何というか。

  • マルチモーダル
  • ファインチューニング
  • アライメント(Alignment)
  • ハルシネーション(Hallucination)正解
解説

もっともらしいが事実と異なる出力を生む現象をハルシネーションという。アライメントはAIの振る舞いを人間の意図に合わせること、ファインチューニングは追加学習でモデルを調整すること、マルチモーダルは文章・画像など複数種類のデータを扱えることを指す。

https://guga.or.jp/assets/syllabus.pdf (第2章 ChatGPT)

2 ・ 生成AIの誕生まで

GPTをはじめとする現在の多くの大規模言語モデルの基盤となっているアーキテクチャと、その中核的な仕組みの組み合わせとして正しいものはどれか。

  • ボルツマンマシン ── 強化学習
  • RNN ── 畳み込み(Convolution)
  • CNN ── 位置エンコーディングのみ
  • Transformerモデル ── 自己注意力(Self-Attention)正解
解説

現在のGPTモデルなどの基盤はTransformerモデルで、その中核は入力中の各要素の関係に重みづけする自己注意力(Self-Attention)である。畳み込みはCNN、位置エンコーディングはTransformerの補助要素だが中核ではない。ボルツマンマシンは初期の生成モデルの一つ。

https://guga.or.jp/assets/syllabus.pdf (第2章 生成AIの誕生まで)

3 ・ 生成AIの誕生まで

2つのネットワークを競い合わせることで本物らしいデータを生成する、生成器と識別器から成るモデルはどれか。

  • GAN(敵対的生成ネットワーク)正解
  • RNN(回帰型ニューラルネットワーク)
  • LSTM(長・短期記憶)
  • VAE(変分自己符号化器)
解説

GAN(敵対的生成ネットワーク)は、データを作り出す生成器と、本物か偽物かを見分ける識別器を競わせて学習する生成モデル。VAEはエンコーダ・デコーダと潜在ベクトルを使う別方式、RNNとLSTMは時系列・系列データを扱うためのモデルで、生成器と識別器を競わせる仕組みではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 生成AIの誕生まで)

4 ・ 生成AIの誕生まで

入力データをエンコーダで潜在ベクトルに圧縮し、デコーダで元のデータを復元するように学習する生成モデルはどれか。

  • LSTM(長・短期記憶)
  • VAE(変分自己符号化器)正解
  • Transformerモデル
  • GAN(敵対的生成ネットワーク)
解説

VAE(変分自己符号化器)は、エンコーダで入力を潜在ベクトルへ圧縮し、デコーダで復元する構造を持つ生成モデル。GANは生成器と識別器を競わせる方式、Transformerは自己注意力を中核とするモデル、LSTMは系列データ向けのモデルで、エンコーダ・デコーダと潜在ベクトルで復元する方式ではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 生成AIの誕生まで)

5 ・ ChatGPT

ChatGPTの開発で使われた、人間の評価を報酬として強化学習を行い、モデルの応答を人間の好みに近づける手法の略称はどれか。

  • RLHF正解
  • NSP
  • NLP
  • MLM
解説

RLHF(Reinforcement Learning from Human Feedback)は、人間の評価を報酬とする強化学習でモデルの出力を人間の意図・好みに合わせる手法。NLPは自然言語処理という技術分野、NSP(Next Sentence Prediction)とMLM(Masked Language Model)はBERTの事前学習で使われる手法で、人間のフィードバックによる強化学習ではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 ChatGPT)

6 ・ ChatGPT

テキストだけでなく、画像や音声など複数の種類のデータをまとめて扱えることを何というか。

  • マルチモーダル正解
  • ハルシネーション
  • ファインチューニング
  • アライメント
解説

複数種類のデータ(テキスト・画像・音声など)を扱えることをマルチモーダルという。ハルシネーションは事実と異なる出力を生む現象、ファインチューニングは追加学習でモデルを調整すること、アライメントはAIの振る舞いを人間の意図に合わせることで、いずれもデータの種類の多さを表す語ではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 ChatGPT)

7 ・ 生成AIの誕生まで

直前までの単語列をもとに次の単語を予測することを繰り返して文章を生成する、GPTが採用している方式を何というか。

  • GAN(敵対的生成ネットワーク)
  • ボルツマンマシン
  • VAE(変分自己符号化器)
  • 自己回帰モデル正解
解説

直前までの出力をもとに次を予測することを繰り返す方式を自己回帰モデルといい、GPTはこの方式で文章を生成する。GANは生成器と識別器を競わせる方式、VAEはエンコーダ・デコーダによる方式、ボルツマンマシンは初期の生成モデルで、いずれも逐次予測を繰り返す自己回帰方式ではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 生成AIの誕生まで)

8 ・ ChatGPT

事前学習済みのモデルを、特定の用途やタスク向けに追加で学習させて調整することを何というか。

  • マルチモーダル
  • プレトレーニング
  • ファインチューニング正解
  • ハルシネーション
解説

学習済みモデルを特定用途向けに追加学習して調整することをファインチューニングという。プレトレーニング(事前学習)はその前段階で大量データから汎用的に学習する工程、ハルシネーションは誤った出力を生む現象、マルチモーダルは複数種類のデータを扱えることで、いずれも追加学習による調整を指す語ではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 ChatGPT/第5章 LMとLLM)

9 ・ その他の主要生成AI

次のうち、対話型のテキスト生成AIに分類されるものはどれか。

  • Sora
  • Image Generation
  • Claude正解
  • Veo3
解説

Claudeは、ChatGPT以外の主要なテキスト生成AIの一つ。Soraは動画生成、Veo3も動画生成、Image Generationは画像生成に分類される機能・モデルであり、テキストを生成する対話型AIではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 その他の主要生成AI)

10 ・ ChatGPT

人間が日常的に使う言葉(自然言語)をコンピュータに処理・理解させる技術分野を何というか。

  • アライメント
  • 自然言語処理(NLP)正解
  • マルチモーダル
  • RLHF
解説

人間の言葉をコンピュータに処理させる技術分野を自然言語処理(NLP)という。RLHFは人間のフィードバックによる強化学習、マルチモーダルは複数種類のデータを扱えること、アライメントはAIの振る舞いを人間の意図に合わせることで、いずれも技術分野の名称ではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 ChatGPT)

11 ・ 生成AIの誕生まで

画像認識などで広く使われ、フィルタを用いた畳み込みによって画像の局所的な特徴を抽出することを中核とするニューラルネットワークはどれか。

  • ボルツマンマシン
  • CNN(畳み込みニューラルネットワーク)正解
  • RNN(回帰型ニューラルネットワーク)
  • VAE(変分自己符号化器)
解説

畳み込みによって画像の局所的な特徴を抽出することを中核とするのがCNN(畳み込みニューラルネットワーク)。RNNは系列データを順に処理するモデル、ボルツマンマシンは初期の確率的な生成モデル、VAEはエンコーダ・デコーダと潜在ベクトルを使う生成モデルで、いずれも畳み込みを中核とするものではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 生成AIの誕生まで)

12 ・ 生成AIの誕生まで

文章や時系列のような順序のある系列データ(シーケンスデータ)を、隠れ層(リカレント層)で前の情報を保持しながら順に処理していくニューラルネットワークはどれか。

  • GAN(敵対的生成ネットワーク)
  • CNN(畳み込みニューラルネットワーク)
  • RNN(回帰型ニューラルネットワーク)正解
  • VAE(変分自己符号化器)
解説

隠れ層(リカレント層)で前の情報を保持しながら系列データ(シーケンスデータ)を順に処理するのがRNN(回帰型ニューラルネットワーク)。CNNは畳み込みで画像の局所特徴を扱うモデル、GANは生成器と識別器を競わせる生成モデル、VAEはエンコーダ・デコーダ方式の生成モデルで、いずれも前の情報を保持して系列を順に処理する仕組みではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 生成AIの誕生まで)

13 ・ 生成AIの誕生まで

系列データ(シーケンスデータ)を扱うニューラルネットワークのうち、RNNを改良し、長い系列でも情報を保持しやすくしたモデルはどれか。

  • Transformerモデル
  • LSTM(長・短期記憶)正解
  • CNN(畳み込みニューラルネットワーク)
  • ボルツマンマシン
解説

長い系列でも情報を保持しやすいよう改良された、長・短期記憶と呼ばれるモデルがLSTM(長・短期記憶)。CNNは畳み込みで画像の局所特徴を扱うモデル、ボルツマンマシンは初期の確率的な生成モデル、Transformerモデルは自己注意力を中核とするモデルで、いずれも『長・短期記憶』と呼ばれるものではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 生成AIの誕生まで)

14 ・ 生成AIの誕生まで

生成モデルの初期に登場した確率的なモデルで、ユニット間の結合の一部を制限した「制約付き」と呼ばれる形が知られているものはどれか。

  • ボルツマンマシン正解
  • GAN(敵対的生成ネットワーク)
  • 自己回帰モデル
  • Transformerモデル
解説

初期に登場した確率的な生成モデルで、結合を一部制限した制約付きボルツマンマシンが知られているのがボルツマンマシン。Transformerモデルは自己注意力を中核とするモデル、GANは生成器と識別器を競わせる方式、自己回帰モデルは直前までの出力から次を予測する方式で、いずれも『制約付き』の形で知られる初期の確率的モデルではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 生成AIの誕生まで)

15 ・ 生成AIの誕生まで

Transformerモデルで、入力された単語の並び順(位置)の情報をモデルに伝えるために加えられる仕組みを何というか。

  • 畳み込み
  • 潜在ベクトル
  • 位置エンコーディング正解
  • 自己注意力(Self-Attention)
解説

単語の並び順(位置)の情報をモデルに与える仕組みが位置エンコーディング。自己注意力(Self-Attention)は入力中の要素どうしの関係に重みづけする仕組み、畳み込みはCNNで局所的な特徴を抽出する処理、潜在ベクトルはVAEなどでデータを圧縮した表現で、いずれも位置の情報を与える仕組みではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 生成AIの誕生まで)

16 ・ 生成AIの誕生まで

文章中の一部の単語を隠して当てさせるMLM(Masked Language Model)と、2つの文が連続しているかを判定するNSP(Next Sentence Prediction)によって事前学習を行う言語モデルはどれか。

  • VAE(変分自己符号化器)
  • ボルツマンマシン
  • BERTモデル正解
  • GPTモデル
解説

MLM(Masked Language Model)とNSP(Next Sentence Prediction)で事前学習を行うのはBERTモデル。GPTモデルは直前までの単語列から次を予測する自己回帰方式で学習する別系統のモデル、ボルツマンマシンは初期の確率的な生成モデル、VAEはエンコーダ・デコーダ方式の生成モデルで、いずれもMLM・NSPで事前学習するものではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 生成AIの誕生まで)

17 ・ 生成AIの誕生まで

BERTモデルを改良して提案された派生モデルとして挙げられるものはどれか。

  • ボルツマンマシン
  • Sora
  • ALBERT(a Lite BERT)正解
  • InstructGPT
解説

ALBERT(a Lite BERT)は、RoBERTaと並んでBERTモデルを改良して提案された派生モデル。InstructGPTはGPT系の派生モデル、ボルツマンマシンは初期の確率的な生成モデル、Soraは動画を生成するモデルで、いずれもBERTの派生モデルではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 生成AIの誕生まで)

18 ・ ChatGPT

OpenAIが、人間のフィードバックを用いた学習でGPT-3を改良し、ユーザーの指示に沿うよう出力を人間の意図に合わせる(アライメント)ことを目指したモデルはどれか。

  • RoBERTa
  • ALBERT(a Lite BERT)
  • InstructGPT正解
  • BERTモデル
解説

人間のフィードバックを用いた学習でGPT-3を改良し、指示に沿うよう出力を人間の意図に合わせる(アライメント)ことを目指したモデルがInstructGPT。RoBERTa・ALBERT(a Lite BERT)・BERTモデルはいずれもBERT系のモデルで、GPT-3を改良してアライメントを図ったものではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 ChatGPT)

19 ・ ChatGPT

GPTモデルの世代が進むにつれて一般に増加してきた、モデルの規模を表す指標で、モデル内部で調整される値を指す語はどれか。

  • データセット
  • マルチモーダル
  • パラメータ正解
  • ハルシネーション(Hallucination)
解説

モデル内部で調整される値で、モデルの規模を表す指標として用いられるのがパラメータ。データセットは学習に用いるデータの集まりであってモデル内部で調整される値ではない。ハルシネーションは事実と異なる出力を生む現象、マルチモーダルは複数種類のデータを扱えることで、いずれもモデル内部の調整値を指す語ではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 ChatGPT)

20 ・ ChatGPT

ChatGPT上で、利用者が用途に合わせて独自にカスタマイズした対話AIを作成・公開できる機能を何というか。

  • InstructGPT
  • RLHF(Reinforcement Learning from Human Feedback)
  • Code Interpreter
  • GPTs正解
解説

利用者が用途に合わせて独自にカスタマイズした対話AIを作成・公開できる機能がGPTs。Code Interpreterはコードの実行などを行う機能、InstructGPTは指示に沿うよう改良されたモデル、RLHFは人間のフィードバックによる強化学習の手法で、いずれも『独自の対話AIを作成・公開する機能』ではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 ChatGPT)

21 ・ ChatGPT

ChatGPT上で、アップロードしたファイルのデータを解析したり、プログラムを実行してグラフを作成したりできる機能はどれか。

  • GPTs
  • ファインチューニング
  • マルチモーダル
  • Code Interpreter正解
解説

ChatGPT上でプログラムを実行し、アップロードしたファイルのデータ分析やグラフ作成などを行える機能がCode Interpreterである。GPTsは利用者が独自にカスタマイズした対話AIを作成・公開する機能、ファインチューニングは学習済みモデルを特定用途向けに追加学習して調整すること、マルチモーダルはテキストや画像など複数種類のデータを扱えることを指し、いずれもコードを実行してデータを解析する機能ではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 ChatGPT)

22 ・ ChatGPT

OpenAIが提供する、自然言語での指示からプログラムのコードを生成・記述することを主な用途とするものはどれか。

  • Operator
  • Image Generation
  • Codex正解
  • Sora
解説

OpenAIが提供する、自然言語の指示からプログラムのコードを生成・記述することを主な用途とするものがCodexである。Soraは動画を生成するモデル、Image Generationは画像を生成する機能、Operatorはブラウザを操作してWeb上のタスクを代行するもので、いずれもコード生成を主目的とするものではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 ChatGPT)

23 ・ ChatGPT

人がWebブラウザの画面を見て入力やクリックを行うように操作し、Web上のタスクを自律的に代行するものはどれか。

  • Operator正解
  • Code Interpreter
  • Sora
  • GPTs
解説

人がWebブラウザの画面を見て入力やクリックを行うように操作し、Web上のタスクを自律的に代行するものがOperatorである。Code Interpreterはコードを実行してデータ分析を行う機能、GPTsは独自にカスタマイズした対話AIを作成・公開する機能、Soraは動画を生成するモデルで、いずれもブラウザを操作してタスクを代行するものではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 ChatGPT)

24 ・ ChatGPT

テキスト・音声・画像といった複数種類の情報を、一つのモデルでまとめて入出力できる、マルチモーダルに対応したGPTモデルの一つはどれか。

  • GPT-4o正解
  • InstructGPT
  • GPT-1
  • BERTモデル
解説

テキスト・音声・画像といった複数種類の情報を一つのモデルでまとめて入出力できる、マルチモーダルに対応したGPTモデルがGPT-4oである。GPT-1は初期のテキスト中心のモデル、BERTモデルはMLM・NSPで事前学習する別系統のモデル、InstructGPTは人間のフィードバックでGPT-3を改良したモデルで、いずれもテキスト・音声・画像を統合的に扱うことを特徴とするものではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 ChatGPT)

25 ・ ChatGPT

生成AIの出力や振る舞いを、人間の意図や価値観に沿うように調整しようとする取り組みを何というか。

  • マルチモーダル
  • アライメント(Alignment)正解
  • データセット
  • ハルシネーション(Hallucination)
解説

生成AIの出力や振る舞いを、人間の意図や価値観に沿うように調整しようとする取り組みをアライメント(Alignment)という。ハルシネーションは事実と異なる内容をもっともらしく出力してしまう現象、マルチモーダルは複数種類のデータを扱えること、データセットは学習に用いるデータの集まりで、いずれも人間の意図に沿わせる取り組みを指す語ではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 ChatGPT)

26 ・ ChatGPT

AIモデルの学習(訓練)に用いるために集められた、データの集まりを何というか。

  • データセット正解
  • マルチモーダル
  • ファインチューニング
  • パラメータ
解説

AIモデルの学習(訓練)に用いるために集められたデータの集まりをデータセットという。パラメータはモデル内部で調整される値、ファインチューニングは学習済みモデルを特定用途向けに追加学習すること、マルチモーダルは複数種類のデータを扱えることで、いずれも学習用に集めたデータの集合そのものを指す語ではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 ChatGPT)

27 ・ その他の主要生成AI

ChatGPT以外の主要なテキスト生成AIとして、シラバスで挙げられているサービスの組み合わせはどれか。

  • Sora・Veo3・Image Generation
  • VAE・GAN・RNN
  • GPTs・Code Interpreter・Operator
  • Gemini・Claude・Copilot正解
解説

ChatGPT以外の主要なテキスト生成AIとしてシラバスで挙げられているのはGemini・Claude・Copilotである。Sora・Veo3・Image Generationは動画や画像を生成するもの、GPTs・Code Interpreter・OperatorはChatGPTの機能や関連ツール、VAE・GAN・RNNは生成モデルやニューラルネットワークの種類で、いずれもChatGPT以外の主要テキスト生成AIの組み合わせではない。

https://guga.or.jp/assets/syllabus.pdf (第2章 その他の主要生成AI)