生成AIパスポート第2章生成AI（ジェネレーティブAI）予想問題と解説

生成AIパスポート「第2章生成AI（ジェネレーティブAI）」の予想問題を27問、各問の完全解説つきで掲載しています。全問オリジナル自作・公式シラバス準拠です。

この分野で問われる主な論点

ChatGPT
生成AIの誕生まで
その他の主要生成AI

この分野を演習する（27問）

間違えやすいポイント（作問者分析）

当サイトの作問時に観察した、取り違えやすい論点です（公式の統計ではありません）。

ハルシネーション・アライメント・ファインチューニングの取り違え。事実と異なるもっともらしい出力＝ハルシネーション、人間の意図に沿わせること＝アライメント、追加学習で調整＝ファインチューニング。
GANとVAEの混同。GANは生成器と識別器を競わせる方式、VAEはエンコーダ・デコーダと潜在ベクトルを使う方式。
Transformerの中核を畳み込みや位置エンコーディングと取り違える。中核は自己注意（Self-Attention）。

第1問・ ChatGPT

生成AIが、事実と異なる内容をもっともらしい文章として出力してしまう現象を何というか。

アマルチモーダル
イファインチューニング
ウアライメント（Alignment）
エハルシネーション（Hallucination）正解

解説

もっともらしいが事実と異なる出力を生む現象をハルシネーションという。アライメントはAIの振る舞いを人間の意図に合わせること、ファインチューニングは追加学習でモデルを調整すること、マルチモーダルは文章・画像など複数種類のデータを扱えることを指す。

https://guga.or.jp/assets/syllabus.pdf （第2章 ChatGPT）

第2問・生成AIの誕生まで

GPTをはじめとする現在の多くの大規模言語モデルの基盤となっているアーキテクチャと、その中核的な仕組みの組み合わせとして正しいものはどれか。

アボルツマンマシン ── 強化学習
イRNN ── 畳み込み（Convolution）
ウCNN ── 位置エンコーディングのみ
エTransformerモデル ── 自己注意力（Self-Attention）正解

解説

現在のGPTモデルなどの基盤はTransformerモデルで、その中核は入力中の各要素の関係に重みづけする自己注意力（Self-Attention）である。畳み込みはCNN、位置エンコーディングはTransformerの補助要素だが中核ではない。ボルツマンマシンは初期の生成モデルの一つ。

https://guga.or.jp/assets/syllabus.pdf （第2章生成AIの誕生まで）

第3問・生成AIの誕生まで

2つのネットワークを競い合わせることで本物らしいデータを生成する、生成器と識別器から成るモデルはどれか。

アGAN（敵対的生成ネットワーク）正解
イRNN（回帰型ニューラルネットワーク）
ウLSTM（長・短期記憶）
エVAE（変分自己符号化器）

解説

GAN（敵対的生成ネットワーク）は、データを作り出す生成器と、本物か偽物かを見分ける識別器を競わせて学習する生成モデル。VAEはエンコーダ・デコーダと潜在ベクトルを使う別方式、RNNとLSTMは時系列・系列データを扱うためのモデルで、生成器と識別器を競わせる仕組みではない。

https://guga.or.jp/assets/syllabus.pdf （第2章生成AIの誕生まで）

第4問・生成AIの誕生まで

入力データをエンコーダで潜在ベクトルに圧縮し、デコーダで元のデータを復元するように学習する生成モデルはどれか。

アLSTM（長・短期記憶）
イVAE（変分自己符号化器）正解
ウTransformerモデル
エGAN（敵対的生成ネットワーク）

解説

VAE（変分自己符号化器）は、エンコーダで入力を潜在ベクトルへ圧縮し、デコーダで復元する構造を持つ生成モデル。GANは生成器と識別器を競わせる方式、Transformerは自己注意力を中核とするモデル、LSTMは系列データ向けのモデルで、エンコーダ・デコーダと潜在ベクトルで復元する方式ではない。

https://guga.or.jp/assets/syllabus.pdf （第2章生成AIの誕生まで）

第5問・ ChatGPT

ChatGPTの開発で使われた、人間の評価を報酬として強化学習を行い、モデルの応答を人間の好みに近づける手法の略称はどれか。

アRLHF正解
イNSP
ウNLP
エMLM

解説

RLHF（Reinforcement Learning from Human Feedback）は、人間の評価を報酬とする強化学習でモデルの出力を人間の意図・好みに合わせる手法。NLPは自然言語処理という技術分野、NSP（Next Sentence Prediction）とMLM（Masked Language Model）はBERTの事前学習で使われる手法で、人間のフィードバックによる強化学習ではない。

https://guga.or.jp/assets/syllabus.pdf （第2章 ChatGPT）

第6問・ ChatGPT

テキストだけでなく、画像や音声など複数の種類のデータをまとめて扱えることを何というか。

アマルチモーダル正解
イハルシネーション
ウファインチューニング
エアライメント

解説

複数種類のデータ（テキスト・画像・音声など）を扱えることをマルチモーダルという。ハルシネーションは事実と異なる出力を生む現象、ファインチューニングは追加学習でモデルを調整すること、アライメントはAIの振る舞いを人間の意図に合わせることで、いずれもデータの種類の多さを表す語ではない。

https://guga.or.jp/assets/syllabus.pdf （第2章 ChatGPT）

第7問・生成AIの誕生まで

直前までの単語列をもとに次の単語を予測することを繰り返して文章を生成する、GPTが採用している方式を何というか。

アGAN（敵対的生成ネットワーク）
イボルツマンマシン
ウVAE（変分自己符号化器）
エ自己回帰モデル正解

解説

直前までの出力をもとに次を予測することを繰り返す方式を自己回帰モデルといい、GPTはこの方式で文章を生成する。GANは生成器と識別器を競わせる方式、VAEはエンコーダ・デコーダによる方式、ボルツマンマシンは初期の生成モデルで、いずれも逐次予測を繰り返す自己回帰方式ではない。

https://guga.or.jp/assets/syllabus.pdf （第2章生成AIの誕生まで）

第8問・ ChatGPT

事前学習済みのモデルを、特定の用途やタスク向けに追加で学習させて調整することを何というか。

アマルチモーダル
イプレトレーニング
ウファインチューニング正解
エハルシネーション

解説

学習済みモデルを特定用途向けに追加学習して調整することをファインチューニングという。プレトレーニング（事前学習）はその前段階で大量データから汎用的に学習する工程、ハルシネーションは誤った出力を生む現象、マルチモーダルは複数種類のデータを扱えることで、いずれも追加学習による調整を指す語ではない。

https://guga.or.jp/assets/syllabus.pdf （第2章 ChatGPT／第5章 LMとLLM）

第9問・その他の主要生成AI

次のうち、対話型のテキスト生成AIに分類されるものはどれか。

アSora
イImage Generation
ウClaude正解
エVeo3

解説

Claudeは、ChatGPT以外の主要なテキスト生成AIの一つ。Soraは動画生成、Veo3も動画生成、Image Generationは画像生成に分類される機能・モデルであり、テキストを生成する対話型AIではない。

https://guga.or.jp/assets/syllabus.pdf （第2章その他の主要生成AI）

第10問・ ChatGPT

人間が日常的に使う言葉（自然言語）をコンピュータに処理・理解させる技術分野を何というか。

アアライメント
イ自然言語処理（NLP）正解
ウマルチモーダル
エRLHF

解説

人間の言葉をコンピュータに処理させる技術分野を自然言語処理（NLP）という。RLHFは人間のフィードバックによる強化学習、マルチモーダルは複数種類のデータを扱えること、アライメントはAIの振る舞いを人間の意図に合わせることで、いずれも技術分野の名称ではない。

https://guga.or.jp/assets/syllabus.pdf （第2章 ChatGPT）

第11問・生成AIの誕生まで

画像認識などで広く使われ、フィルタを用いた畳み込みによって画像の局所的な特徴を抽出することを中核とするニューラルネットワークはどれか。

アボルツマンマシン
イCNN（畳み込みニューラルネットワーク）正解
ウRNN（回帰型ニューラルネットワーク）
エVAE（変分自己符号化器）

解説

畳み込みによって画像の局所的な特徴を抽出することを中核とするのがCNN（畳み込みニューラルネットワーク）。RNNは系列データを順に処理するモデル、ボルツマンマシンは初期の確率的な生成モデル、VAEはエンコーダ・デコーダと潜在ベクトルを使う生成モデルで、いずれも畳み込みを中核とするものではない。

https://guga.or.jp/assets/syllabus.pdf （第2章生成AIの誕生まで）

第12問・生成AIの誕生まで

文章や時系列のような順序のある系列データ（シーケンスデータ）を、隠れ層（リカレント層）で前の情報を保持しながら順に処理していくニューラルネットワークはどれか。

アGAN（敵対的生成ネットワーク）
イCNN（畳み込みニューラルネットワーク）
ウRNN（回帰型ニューラルネットワーク）正解
エVAE（変分自己符号化器）

解説

隠れ層（リカレント層）で前の情報を保持しながら系列データ（シーケンスデータ）を順に処理するのがRNN（回帰型ニューラルネットワーク）。CNNは畳み込みで画像の局所特徴を扱うモデル、GANは生成器と識別器を競わせる生成モデル、VAEはエンコーダ・デコーダ方式の生成モデルで、いずれも前の情報を保持して系列を順に処理する仕組みではない。

https://guga.or.jp/assets/syllabus.pdf （第2章生成AIの誕生まで）

第13問・生成AIの誕生まで

系列データ（シーケンスデータ）を扱うニューラルネットワークのうち、RNNを改良し、長い系列でも情報を保持しやすくしたモデルはどれか。

アTransformerモデル
イLSTM（長・短期記憶）正解
ウCNN（畳み込みニューラルネットワーク）
エボルツマンマシン

解説

長い系列でも情報を保持しやすいよう改良された、長・短期記憶と呼ばれるモデルがLSTM（長・短期記憶）。CNNは畳み込みで画像の局所特徴を扱うモデル、ボルツマンマシンは初期の確率的な生成モデル、Transformerモデルは自己注意力を中核とするモデルで、いずれも『長・短期記憶』と呼ばれるものではない。

https://guga.or.jp/assets/syllabus.pdf （第2章生成AIの誕生まで）

第14問・生成AIの誕生まで

生成モデルの初期に登場した確率的なモデルで、ユニット間の結合の一部を制限した「制約付き」と呼ばれる形が知られているものはどれか。

アボルツマンマシン正解
イGAN（敵対的生成ネットワーク）
ウ自己回帰モデル
エTransformerモデル

解説

初期に登場した確率的な生成モデルで、結合を一部制限した制約付きボルツマンマシンが知られているのがボルツマンマシン。Transformerモデルは自己注意力を中核とするモデル、GANは生成器と識別器を競わせる方式、自己回帰モデルは直前までの出力から次を予測する方式で、いずれも『制約付き』の形で知られる初期の確率的モデルではない。

https://guga.or.jp/assets/syllabus.pdf （第2章生成AIの誕生まで）

第15問・生成AIの誕生まで

Transformerモデルで、入力された単語の並び順（位置）の情報をモデルに伝えるために加えられる仕組みを何というか。

ア畳み込み
イ潜在ベクトル
ウ位置エンコーディング正解
エ自己注意力（Self-Attention）

解説

単語の並び順（位置）の情報をモデルに与える仕組みが位置エンコーディング。自己注意力（Self-Attention）は入力中の要素どうしの関係に重みづけする仕組み、畳み込みはCNNで局所的な特徴を抽出する処理、潜在ベクトルはVAEなどでデータを圧縮した表現で、いずれも位置の情報を与える仕組みではない。

https://guga.or.jp/assets/syllabus.pdf （第2章生成AIの誕生まで）

第16問・生成AIの誕生まで

文章中の一部の単語を隠して当てさせるMLM（Masked Language Model）と、2つの文が連続しているかを判定するNSP（Next Sentence Prediction）によって事前学習を行う言語モデルはどれか。

アVAE（変分自己符号化器）
イボルツマンマシン
ウBERTモデル正解
エGPTモデル

解説

MLM（Masked Language Model）とNSP（Next Sentence Prediction）で事前学習を行うのはBERTモデル。GPTモデルは直前までの単語列から次を予測する自己回帰方式で学習する別系統のモデル、ボルツマンマシンは初期の確率的な生成モデル、VAEはエンコーダ・デコーダ方式の生成モデルで、いずれもMLM・NSPで事前学習するものではない。

https://guga.or.jp/assets/syllabus.pdf （第2章生成AIの誕生まで）

第17問・生成AIの誕生まで

BERTモデルを改良して提案された派生モデルとして挙げられるものはどれか。

アボルツマンマシン
イSora
ウALBERT（a Lite BERT）正解
エInstructGPT

解説

ALBERT（a Lite BERT）は、RoBERTaと並んでBERTモデルを改良して提案された派生モデル。InstructGPTはGPT系の派生モデル、ボルツマンマシンは初期の確率的な生成モデル、Soraは動画を生成するモデルで、いずれもBERTの派生モデルではない。

https://guga.or.jp/assets/syllabus.pdf （第2章生成AIの誕生まで）

第18問・ ChatGPT

OpenAIが、人間のフィードバックを用いた学習でGPT-3を改良し、ユーザーの指示に沿うよう出力を人間の意図に合わせる（アライメント）ことを目指したモデルはどれか。

アRoBERTa
イALBERT（a Lite BERT）
ウInstructGPT正解
エBERTモデル

解説

人間のフィードバックを用いた学習でGPT-3を改良し、指示に沿うよう出力を人間の意図に合わせる（アライメント）ことを目指したモデルがInstructGPT。RoBERTa・ALBERT（a Lite BERT）・BERTモデルはいずれもBERT系のモデルで、GPT-3を改良してアライメントを図ったものではない。

https://guga.or.jp/assets/syllabus.pdf （第2章 ChatGPT）

第19問・ ChatGPT

GPTモデルの世代が進むにつれて一般に増加してきた、モデルの規模を表す指標で、モデル内部で調整される値を指す語はどれか。

アデータセット
イマルチモーダル
ウパラメータ正解
エハルシネーション（Hallucination）

解説

モデル内部で調整される値で、モデルの規模を表す指標として用いられるのがパラメータ。データセットは学習に用いるデータの集まりであってモデル内部で調整される値ではない。ハルシネーションは事実と異なる出力を生む現象、マルチモーダルは複数種類のデータを扱えることで、いずれもモデル内部の調整値を指す語ではない。

https://guga.or.jp/assets/syllabus.pdf （第2章 ChatGPT）

第20問・ ChatGPT

ChatGPT上で、利用者が用途に合わせて独自にカスタマイズした対話AIを作成・公開できる機能を何というか。

アInstructGPT
イRLHF（Reinforcement Learning from Human Feedback）
ウCode Interpreter
エGPTs正解

解説

利用者が用途に合わせて独自にカスタマイズした対話AIを作成・公開できる機能がGPTs。Code Interpreterはコードの実行などを行う機能、InstructGPTは指示に沿うよう改良されたモデル、RLHFは人間のフィードバックによる強化学習の手法で、いずれも『独自の対話AIを作成・公開する機能』ではない。

https://guga.or.jp/assets/syllabus.pdf （第2章 ChatGPT）

第21問・ ChatGPT

ChatGPT上で、アップロードしたファイルのデータを解析したり、プログラムを実行してグラフを作成したりできる機能はどれか。

アGPTs
イファインチューニング
ウマルチモーダル
エCode Interpreter正解

解説

ChatGPT上でプログラムを実行し、アップロードしたファイルのデータ分析やグラフ作成などを行える機能がCode Interpreterである。GPTsは利用者が独自にカスタマイズした対話AIを作成・公開する機能、ファインチューニングは学習済みモデルを特定用途向けに追加学習して調整すること、マルチモーダルはテキストや画像など複数種類のデータを扱えることを指し、いずれもコードを実行してデータを解析する機能ではない。

https://guga.or.jp/assets/syllabus.pdf （第2章 ChatGPT）

第22問・ ChatGPT

OpenAIが提供する、自然言語での指示からプログラムのコードを生成・記述することを主な用途とするものはどれか。

アOperator
イImage Generation
ウCodex正解
エSora

解説

OpenAIが提供する、自然言語の指示からプログラムのコードを生成・記述することを主な用途とするものがCodexである。Soraは動画を生成するモデル、Image Generationは画像を生成する機能、Operatorはブラウザを操作してWeb上のタスクを代行するもので、いずれもコード生成を主目的とするものではない。

https://guga.or.jp/assets/syllabus.pdf （第2章 ChatGPT）

第23問・ ChatGPT

人がWebブラウザの画面を見て入力やクリックを行うように操作し、Web上のタスクを自律的に代行するものはどれか。

アOperator正解
イCode Interpreter
ウSora
エGPTs

解説

人がWebブラウザの画面を見て入力やクリックを行うように操作し、Web上のタスクを自律的に代行するものがOperatorである。Code Interpreterはコードを実行してデータ分析を行う機能、GPTsは独自にカスタマイズした対話AIを作成・公開する機能、Soraは動画を生成するモデルで、いずれもブラウザを操作してタスクを代行するものではない。

https://guga.or.jp/assets/syllabus.pdf （第2章 ChatGPT）

第24問・ ChatGPT

テキスト・音声・画像といった複数種類の情報を、一つのモデルでまとめて入出力できる、マルチモーダルに対応したGPTモデルの一つはどれか。

アGPT-4o正解
イInstructGPT
ウGPT-1
エBERTモデル

解説

テキスト・音声・画像といった複数種類の情報を一つのモデルでまとめて入出力できる、マルチモーダルに対応したGPTモデルがGPT-4oである。GPT-1は初期のテキスト中心のモデル、BERTモデルはMLM・NSPで事前学習する別系統のモデル、InstructGPTは人間のフィードバックでGPT-3を改良したモデルで、いずれもテキスト・音声・画像を統合的に扱うことを特徴とするものではない。

https://guga.or.jp/assets/syllabus.pdf （第2章 ChatGPT）

第25問・ ChatGPT

生成AIの出力や振る舞いを、人間の意図や価値観に沿うように調整しようとする取り組みを何というか。

アマルチモーダル
イアライメント（Alignment）正解
ウデータセット
エハルシネーション（Hallucination）

解説

生成AIの出力や振る舞いを、人間の意図や価値観に沿うように調整しようとする取り組みをアライメント（Alignment）という。ハルシネーションは事実と異なる内容をもっともらしく出力してしまう現象、マルチモーダルは複数種類のデータを扱えること、データセットは学習に用いるデータの集まりで、いずれも人間の意図に沿わせる取り組みを指す語ではない。

https://guga.or.jp/assets/syllabus.pdf （第2章 ChatGPT）

第26問・ ChatGPT

AIモデルの学習（訓練）に用いるために集められた、データの集まりを何というか。

アデータセット正解
イマルチモーダル
ウファインチューニング
エパラメータ

解説

AIモデルの学習（訓練）に用いるために集められたデータの集まりをデータセットという。パラメータはモデル内部で調整される値、ファインチューニングは学習済みモデルを特定用途向けに追加学習すること、マルチモーダルは複数種類のデータを扱えることで、いずれも学習用に集めたデータの集合そのものを指す語ではない。

https://guga.or.jp/assets/syllabus.pdf （第2章 ChatGPT）

第27問・その他の主要生成AI

ChatGPT以外の主要なテキスト生成AIとして、シラバスで挙げられているサービスの組み合わせはどれか。

アSora・Veo3・Image Generation
イVAE・GAN・RNN
ウGPTs・Code Interpreter・Operator
エGemini・Claude・Copilot正解

解説

ChatGPT以外の主要なテキスト生成AIとしてシラバスで挙げられているのはGemini・Claude・Copilotである。Sora・Veo3・Image Generationは動画や画像を生成するもの、GPTs・Code Interpreter・OperatorはChatGPTの機能や関連ツール、VAE・GAN・RNNは生成モデルやニューラルネットワークの種類で、いずれもChatGPT以外の主要テキスト生成AIの組み合わせではない。

https://guga.or.jp/assets/syllabus.pdf （第2章その他の主要生成AI）

この分野を演習で力試し →