MLA-C01 模擬問題 30 問 — ドメイン配点比例で解答力を仕上げる

MLA-C01 模擬問題 30 問 — ドメイン配点比例で解答力を仕上げる
MLA-C01 模擬問題を、本試験のドメイン配点(Domain 1: 28% / Domain 2: 26% / Domain 3: 22% / Domain 4: 24%)に比例させて 30 問用意した。Domain 1 から 8 問、Domain 2 から 8 問、Domain 3 から 7 問、Domain 4 から 7 問。すべて実在の AWS サービス・機能のみで構成し、各問に解説を付けている。4 ドメインの深掘りを終えた読者が、知識を「2 分で 1 問を裁く解答力」へ変換するための仕上げ教材だ。
各ドメインの体系的な解説は、MLA-C01 Domain 1 完全攻略(2026-06-16 公開)から始まる 4 記事を参照してほしい。本記事は演習に徹する。
模擬問題の使い方 — 採点基準と合格目安

最初に運用ルールを決めておく。1 問 2 分以内、根拠を言語化してから解答を見る、正誤だけでなく「他の選択肢がなぜ誤りか」まで確認する。この 3 点を守るだけで、同じ 30 問から得られる学習効果が大きく変わる。
採点の目安はこうだ。30 問中 24 問(80%)以上の正解が安定して出るなら、本番の予約に進んでよい水準。21〜23 問なら弱点ドメインを特定して該当記事へ戻る。20 問以下なら、模擬問題の周回ではなく体系学習のやり直しが先だ。正答数だけでなくドメイン別の内訳を必ず出すこと。全体 80% でも特定ドメインが 5 割なら、本番では補償型スコアリングに救われない崩れ方をするリスクが残る。
解法の 3 原則

30 問に入る前に、MLA-C01 のシナリオ問題に共通する解法原則を 3 つ挙げる。
第一に「要件語の翻訳」。「断続的な」「大容量の」「説明責任が」といった形容が、それぞれ特定のサービス・方式を指す合図になっている。問題文を読みながら要件語に印を付け、選択肢を見る前に答えの輪郭を作る。
第二に「コスト基準の優先」。複数の選択肢が技術的に成立する場合、MLA-C01 は一貫して「要件を満たす最小コスト・最小運用負荷」を正解に置く。過剰設計の選択肢は、技術的に正しくても誤答だ。
第三に「工程の位置から考える」。問われているのがデータ準備・開発・デプロイ・運用のどの工程かを最初に特定すれば、サービスの候補は自動的に絞られる。Clarify のように複数工程に現れるサービスこそ、「いまどの工程の話か」で用法を切り替える。
なお、本記事の 30 問は紙面の都合で多肢選択形式に統一しているが、本番には順序付け(ordering)と組み合わせ(matching)も出る。本記事の各問を解いた後、「この知識が順序付けで出たらどの工程順か」「組み合わせで出たらどのペアか」と一段抽象化して眺め直すと、同じ 30 問が形式違いの練習にもなる。たとえば問 22 の Code 3 兄弟は、そのまま matching の典型題材だ。
Domain 1: データ準備 — 8 問

問 1. S3 のデータレイクに CSV で蓄積したログを Athena で分析しているが、クエリのスキャン量と料金が増え続けている。最も効果的な対策はどれか。
- A. CSV を gzip 圧縮する
- B. 列指向の Parquet 形式へ変換する
- C. ファイルを 1 つに結合する
- D. JSON 形式へ変換する
解答: B。 分析クエリは特定の列だけを読むことが多く、列指向の Parquet なら必要な列のみスキャンでき、圧縮効率も高い。A は転送量を減らすが列の選択的読み取りはできず、D は逆効果。「スキャン量を減らしたい」は列指向への合図だ。
問 2. 推論時にミリ秒単位のレイテンシで最新の顧客特徴量を参照したい。SageMaker Feature Store のどの構成が適切か。
- A. オフラインストアのみ有効化する
- B. オンラインストアを有効化する
- C. オフラインストアを Iceberg 形式にする
- D. S3 から都度読み出す
解答: B。 オンラインストアは最新レコードを低レイテンシで返す本番推論向けの層。オフラインストアは S3 上の全履歴で、学習・バッチ向けであり即時参照には不向き。テーブル形式の変更(C)はレイテンシ要件の解にならない。
問 3. 医療画像のラベリングジョブを Ground Truth で実施する。患者情報を含むため、外部に出せない。選ぶべきワークフォースはどれか。
- A. Amazon Mechanical Turk
- B. ベンダーワークフォース
- C. プライベートワークフォース
- D. 自動ラベリングのみで完結させる
解答: C。 機密データとドメイン専門知識が要る題材はプライベートワークフォース(自社の限定メンバー)が適する。Mechanical Turk は PII を含むデータに使えないと公式に明記されている。
問 4. 学習データの陽性クラスが全体のごく一部しかない。学習前にこの問題を検出する SageMaker Clarify の指標はどれか。
- A. RMSE
- B. CI(クラス不均衡)
- C. AUC
- D. モデルレイテンシ
解答: B。 学習前バイアス指標の代表が CI(Class Imbalance)と DPL。A と C は学習後の評価指標、D は運用指標であり、「学習前」という工程の位置で絞り込める。
問 5. コードを書かないデータアナリストが、可視化された UI でデータ品質ルールの適用とクレンジングを行いたい。適切なサービスはどれか。
- A. AWS Glue DataBrew
- B. Amazon EMR 上の Spark
- C. AWS CDK
- D. SageMaker Model Debugger
解答: A。 「ノーコード」「アナリスト」が DataBrew への合図。EMR は大規模分散処理でコードが前提、CDK は IaC、Model Debugger は学習の収束デバッグでいずれも工程が違う。
問 6. 複数の学習インスタンスから同一の学習データセットへ同時にファイルアクセスさせたい。適切なストレージはどれか。
- A. インスタンスストア
- B. Amazon EBS
- C. Amazon EFS
- D. S3 Glacier
解答: C。 複数インスタンスからの共有ファイルアクセスは EFS(または FSx)の領分。EBS は基本的に単一インスタンスへのブロックストレージ、Glacier はアーカイブ用でレイテンシが合わない。
問 7. 海外拠点から大容量の学習データを S3 へ定期アップロードしており、転送に時間がかかっている。まず検討すべき機能はどれか。
- A. S3 Transfer Acceleration
- B. EBS Provisioned IOPS
- C. DynamoDB のキャパシティ増強
- D. CloudWatch アラーム
解答: A。 遠隔地からの S3 アップロード高速化はそのまま Transfer Acceleration の用途。B はブロックストレージの I/O、C は NoSQL のスループットで、転送経路の問題には効かない。
問 8. カテゴリ変数「都道府県」(順序なし・47 種類)をモデルに入力する前処理として標準的なものはどれか。
- A. ラベルエンコーディングで 1〜47 の整数にする
- B. one-hot エンコーディングする
- C. 対数変換する
- D. 標準化する
解答: B。 順序のないカテゴリに整数を割り当てると、存在しない大小関係をモデルが学習してしまう。順序なしカテゴリの基本は one-hot。C・D は数値変数向けの変換だ。
Domain 2: モデル開発 — 8 問

問 9. 会議音声を文字起こしして検索可能にしたい。最小の開発工数で実現する選択はどれか。
- A. SageMaker で音声認識モデルを学習する
- B. Amazon Transcribe を使う
- C. Amazon Rekognition を使う
- D. 基盤モデルをゼロから事前学習する
解答: B。 汎用タスクは既製 AI サービスが第一候補。Transcribe が音声の文字起こし、Rekognition は画像分析。自前学習(A・D)は要件に対する過剰投資だ。
問 10. 表形式の顧客データで解約予測(二値分類)を行う。SageMaker 組み込みアルゴリズムでまず試すべきはどれか。
- A. DeepAR
- B. K-Means
- C. XGBoost
- D. PCA
解答: C。 表形式データの分類・回帰は勾配ブースティング木の XGBoost が第一候補。DeepAR は時系列予測、K-Means は教師なしクラスタリング、PCA は次元削減で、タスク種別が合わない。
問 11. 学習データでは精度 98%、検証データでは 71%。まず疑うべき状態と処方はどれか。
- A. 過小学習なのでモデルを複雑にする
- B. 過学習なので正則化やドロップアウトを検討する
- C. データ不足なのでエポックを増やす
- D. 収束失敗なので学習率を上げる
解答: B。 学習と検証の精度乖離は過学習の典型症状。処方は L1/L2 正則化、ドロップアウト、特徴量の削減など。エポック増(C)は乖離をさらに広げる方向に働く。
問 12. 事前学習済みモデルを自社データでファインチューニングしたところ、元の汎用タスクの性能が大きく落ちた。この現象は何か。
- A. データドリフト
- B. 破滅的忘却
- C. コールドスタート
- D. クラス不均衡
解答: B。 ファインチューニングで元の能力が失われる現象が破滅的忘却(catastrophic forgetting)。試験ガイドが過学習・過小学習と並べて明記する、基盤モデル時代の頻出概念だ。
問 13. ハイパーパラメータ探索で、過去の試行結果を使って次に試す組み合わせを効率的に選びたい。適切な手法はどれか。
- A. グリッドサーチ
- B. ベイズ最適化
- C. 手動チューニング
- D. 全組み合わせの総当たり
解答: B。 「過去の試行から次を推定」がベイズ最適化の定義そのもの。SageMaker の自動モデルチューニング(AMT)で利用できる。A と D は試行履歴を活用しない探索だ。
問 14. 陽性が 1% しかない不正検知モデルの評価で、正解率 99% という報告があった。適切な評価への修正はどれか。
- A. 正解率で十分である
- B. 適合率・再現率・F1 で評価し直す
- C. RMSE で評価し直す
- D. 学習時間で評価する
解答: B。 全件を陰性と答えるだけで正解率 99% が出る不均衡データでは、正解率は無意味になる。見逃しと誤検知の構造を映す適合率・再現率・F1(と AUC)への切り替えが定石。RMSE は回帰用だ。
問 15. 学習ジョブの損失が下がらず、収束していない可能性がある。リアルタイムに学習の内部状態を検査する SageMaker の機能はどれか。
- A. SageMaker Clarify
- B. SageMaker Model Debugger
- C. SageMaker Ground Truth
- D. AWS Budgets
解答: B。 収束デバッグは Model Debugger の領分。Clarify は解釈・バイアス分析で「なぜこの予測か」を扱う。両者の切り分けは Domain 2 の定番論点だ。
問 16. 監査要件として「本番中のモデルがどの学習の成果物か」を即答できる状態にしたい。使うべき SageMaker の機能はどれか。
- A. SageMaker Model Registry
- B. SageMaker Neo
- C. S3 のバージョニングのみ
- D. CloudWatch ダッシュボード
解答: A。 モデルのバージョン登録と来歴管理は Model Registry の役割で、再現性と監査対応のスキル項目として試験ガイドに明記されている。Neo はエッジ最適化で無関係だ。
Domain 3: デプロイとオーケストレーション — 7 問

問 17. 社内ツールの推論エンドポイントは 1 日に数回しか呼ばれず、アイドル時間の課金をなくしたい。応答の多少の起動待ちは許容できる。適切な方式はどれか。
- A. リアルタイム推論(常時起動)
- B. サーバーレス推論
- C. マルチ AZ でインスタンスを増やす
- D. 非同期推論
解答: B。 「断続的なトラフィック」「アイドル課金なし」「起動待ち許容」はサーバーレス推論の条件が完全に揃った状態。常時起動(A)はアイドル課金が残り、D はキューイングと大容量向けで文脈が違う。
問 18. 1 件あたり数百 MB の動画を解析する推論で、処理に 30 分かかる。結果は完了後の通知でよい。適切な方式はどれか。
- A. リアルタイム推論
- B. サーバーレス推論
- C. 非同期推論
- D. エッジ推論
解答: C。 非同期推論はペイロード最大 1 GB・処理最大 1 時間で、リクエストをキューに積み完了後に通知する設計。リアルタイム(25 MB / 60 秒)とサーバーレス(4 MB / 60 秒)は上限で脱落する。
問 19. 月末に全顧客 1,000 万件のスコアを一括計算する。常設のエンドポイントは不要だ。適切な方式はどれか。
- A. バッチ変換
- B. リアルタイム推論
- C. サーバーレス推論
- D. マルチコンテナエンドポイント
解答: A。 「事前に揃った大量データ」「常設エンドポイント不要」はバッチ変換の定義そのもの。GB 級のデータセットを一括処理し、ジョブ完了でリソースも解放される。
問 20. 工場の制約されたエッジデバイスでモデルを動かすため、ターゲットハードウェア向けに最適化したい。使うべきサービスはどれか。
- A. SageMaker Neo
- B. AWS X-Ray
- C. Amazon EKS
- D. AWS CodeBuild
解答: A。 エッジデバイス向けのモデル最適化は SageMaker Neo の役割として試験ガイドに名指しされている。Domain 2 のプルーニング・圧縮と組み合わせて出題されやすい。
問 21. TypeScript に習熟したチームが、プログラミング言語の表現力(ループ・条件分岐・抽象化)でインフラを定義したい。適切な IaC はどれか。
- A. CloudFormation テンプレートを直接書く
- B. AWS CDK
- C. コンソールで手動構築し手順書を作る
- D. CodeDeploy
解答: B。 CDK はプログラミング言語でインフラを記述し CloudFormation に合成する選択肢。手動構築(C)は再現性の要請に反する誤答の典型。CodeDeploy はデプロイ実行でレイヤーが違う。
問 22. CodePipeline・CodeBuild・CodeDeploy の役割の組み合わせとして正しいものはどれか。
- A. ビルド/パイプライン定義/デプロイ
- B. パイプライン定義/ビルドとテスト/デプロイ実行
- C. デプロイ/ビルド/監視
- D. 監視/ビルド/パイプライン定義
解答: B。 流れの定義が CodePipeline、ビルド・テストの実行が CodeBuild、デプロイの実行が CodeDeploy。matching 形式の頻出題材なので、3 点セットを一気に固定しておく。
問 23. 新モデルをまずトラフィックの 5% にだけ公開し、問題がなければ全量へ広げたい。該当するデプロイ戦略はどれか。
- A. ブルー/グリーン(一括切替)
- B. カナリア
- C. シャドーテスト
- D. 手動での切り戻し前提の一括リリース
解答: B。 一部トラフィックで検証してから全量に広げるのがカナリア。シャドー(C)はユーザーに結果を返さない検証であり、「5% に公開」という要件と合わない。
Domain 4: 監視・保守・セキュリティ — 7 問

問 24. ローンの貸し倒れ予測では正解ラベルの確定に数か月かかる。その間も劣化の早期警報を出せる監視はどれか。
- A. モデル品質監視
- B. データ品質監視
- C. A/B テスト
- D. 統合テスト
解答: B。 モデル品質監視は予測と正解の突き合わせが必要で、正解の遅延中は機能しない。入力分布の変化を捉えるデータ品質監視が「正解不要の早期警報」として働く。この対は Domain 4 最頻出の構図だ。
問 25. 本番モデルの予測に含まれるバイアスの変化を定期監視したい。Model Monitor と連携するサービスはどれか。
- A. SageMaker Clarify
- B. AWS Trusted Advisor
- C. Amazon QuickSight
- D. AWS CodePipeline
解答: A。 バイアスドリフトと特徴量アトリビューションドリフトの監視は Clarify との連携で実現する。Clarify は学習前・学習後・本番運用の 3 工程に登場する縦串サービスだ。
問 26. マイクロサービス構成の推論システムで、レイテンシの悪化がどのコンポーネントで起きているかを特定したい。適切なツールはどれか。
- A. AWS CloudTrail
- B. AWS X-Ray
- C. AWS Budgets
- D. AWS Artifact
解答: B。 分散システムのリクエスト追跡とボトルネック特定は X-Ray。CloudTrail は API 操作の記録(誰が何をしたか)であり、性能調査の道具ではない。
問 27. 「誰がいつ本番エンドポイントを削除したか」を監査で答えられるようにしたい。構成すべきものはどれか。
- A. CloudWatch ダッシュボード
- B. CloudTrail の証跡(トレイル)
- C. SageMaker Model Registry
- D. Cost Explorer のレポート
解答: B。 API 操作の記録は CloudTrail。証跡の作成は試験ガイドの明示的なスキル項目で、監査と、操作イベントを起点にした自動化の両方の文脈で登場する。
問 28. 推論エンドポイントのインスタンスタイプを、実測の負荷テストに基づいて選定し直したい。適切な機能はどれか。
- A. SageMaker AI Inference Recommender
- B. SageMaker Ground Truth
- C. AWS Glue Data Quality
- D. Amazon EventBridge
解答: A。 推論エンドポイントのライトサイジングは Inference Recommender の領分。汎用リソースには Compute Optimizer が対応する。「勘でインスタンスを選ばない」が Domain 4 の思想だ。
問 29. 数時間で終わる再実行可能な学習ジョブのコストを下げたい。中断は許容できる。適切な購入オプションはどれか。
- A. オンデマンドのまま実行する
- B. Spot インスタンス
- C. リザーブドインスタンス
- D. 専有ホスト
解答: B。 中断許容・再実行可能なバッチ性ワークロードは Spot の典型適用先。リザーブド(C)は長期の定常利用向けで、単発の学習ジョブには合わない。
問 30. データサイエンティストと MLOps エンジニアに、それぞれの職務に応じた最小権限の IAM ロールを素早く整備したい。適切なツールはどれか。
- A. 全員に管理者権限を付与する
- B. SageMaker Role Manager
- C. セキュリティグループ
- D. AWS X-Ray
解答: B。 ペルソナ別の IAM ロール構成を簡略化するのが SageMaker Role Manager。A は最小権限の対極、C はネットワーク層の制御でアイデンティティ管理の道具ではない。
弱点の特定と仕上げの進め方

採点が終わったら、ドメイン別の正答率を出してほしい。Domain 1(問 1〜8)、Domain 2(問 9〜16)、Domain 3(問 17〜23)、Domain 4(問 24〜30)。正答率 7 割を切ったドメインが、本番までに埋めるべき穴だ。
復習は「誤答した問題の解説を読む」だけで終わらせない。その問題が依拠する判断軸——フォーマット選択、症状と処方、要件語の翻訳、監視タイプの使い分け——まで遡り、同じ軸の類題に正答できる状態を作る。本記事の各解説には対応する判断軸を埋め込んであるので、誤答時は該当ドメインの解説記事の該当節へ戻るのが最短経路になる。
仕上げには公式リソースの併用を勧める。AWS Skill Builder の MLA-C01 Exam Prep には公式の演習問題があり、出題の言い回しの「公式の癖」を体感できる。市販の模擬試験(Tutorials Dojo 等)でボリュームを積むのはその後でよい。なお、実試験問題の転載をうたう dumps サイトは NDA 違反であり、利用は認定剥奪のリスクを伴う。正規教材だけで合格圏には届く。
まとめ — 30 問の先にある本番

配点比例の 30 問を 80% 以上で安定して通過できれば、知識面の準備はほぼ完成だ。残るは 130 分 65 問という本番の時間圧の中で、同じ判断を再現する運用面の準備になる。時間配分、見直しフラグの使い方、当日の手続き。最終仕上げは次の合格戦略編で扱う。
4 ドメインの解説へ戻るなら AWS MLA-C01 完全攻略入門(2026-06-15 公開)を起点に、弱点のドメイン記事を選んでほしい。
参照
- MLA-C01 試験ガイド(公式)
- AWS Skill Builder MLA-C01 Exam Prep
- SageMaker 推論オプション(公式ドキュメント)
- SageMaker Model Monitor(公式ドキュメント)





