2026.06.17 2026.06.17

MLA-C01 Domain 2 完全攻略 — モデル開発で 26% を取る

ゲンキ

MLA-C01 Domain 2 完全攻略 — モデル開発で 26% を取る

MLA-C01 の Domain 2「ML Model Development」は配点 26% で、データ準備に次ぐ第 2 の柱だ。アルゴリズムの選択、学習の制御、ハイパーパラメータチューニング、そして評価指標。Domain 1 が「使い分けの暗記」で押し切れるのに対し、Domain 2 は過学習の兆候から正則化を選ばせるような「症状 → 処方」型の出題が中心で、概念の理解度がそのまま得点に出る。本記事は公式試験ガイドの Task 2.1〜2.3 に準拠し、Domain 2 の判断基準を体系化する。

試験全体の構造は AWS MLA-C01 完全攻略入門（2026-06-15 公開）を、前段のデータ準備は MLA-C01 Domain 1 完全攻略（2026-06-16 公開）を参照してほしい。

Domain 2 の性格 — 「症状 → 処方」の試験領域
Task 2.1 — 作る前に「作らない」選択肢を検討する
組み込みアルゴリズムの地図 — XGBoost から DeepAR まで
Task 2.2 — 学習プロセスの語彙: エポック・バッチ・分散学習
過学習との戦い — 正則化・ドロップアウト・破滅的忘却
ハイパーパラメータチューニング — AMT は「総当たり」を卒業させる
モデルの軽量化と合成 — アンサンブルから Model Registry まで
Task 2.3 — 評価指標の使い分け: 混同行列から AUC まで
Clarify と Model Debugger — 解釈・バイアス・収束の三点セット
頻出論点チェックリスト — 本番想定の自己診断
まとめ — モデル開発は「診断学」として学ぶ
参照

忍者AdMax

Domain 2 の性格 — 「症状 → 処方」の試験領域

公式試験ガイドは Domain 2 を 3 つのタスクに分ける。

タスク	テーマ	問われる能力
Task 2.1	モデリングアプローチの選択	アルゴリズム適性、既製 AI サービスの活用判断、コストと解釈可能性
Task 2.2	モデルの学習と改良	学習プロセスの制御、正則化、ハイパーパラメータチューニング、バージョン管理
Task 2.3	モデル性能の分析	評価指標の選択と解釈、ベースライン、過学習の検出、収束デバッグ

Domain 2 で最初に意識すべきは、出題が「数式の計算」ではなく「状況の診断」だという点だ。検証データの精度だけが落ちている、損失が下がりきらない、学習に時間がかかりすぎる。こうした症状を読み、原因を推定し、正しい処方を選ぶ。実務で ML モデルの面倒を見たことがある人ほど有利な領域であり、逆に教科書的な暗記だけで挑むと選択肢の絞り込みで時間を失う。

もう 1 つの特徴は、AWS サービスの知識と一般的な機械学習の知識が半々で混ざることだ。正則化や評価指標は AWS 固有の話ではないが、それを SageMaker のどの機能で実装するかは AWS 認定ならではの問われ方になる。一般論と AWS 実装の両輪で学ぶ、という構えが Domain 2 では特に効く。

Task 2.1 — 作る前に「作らない」選択肢を検討する

Task 2.1 の最重要思想は、モデル開発の最初の判断が「どのアルゴリズムにするか」ではなく「そもそも自前で作るべきか」だという点にある。

試験ガイドは、特定のビジネス課題を解くための既製 AI サービスとして Amazon Translate（翻訳）、Amazon Transcribe（音声の文字起こし）、Amazon Rekognition（画像分析）、Amazon Bedrock（基盤モデル）を名指しする。要件が汎用タスク——多言語対応、議事録の文字起こし、画像内の物体検出——に収まるなら、学習ジョブを 1 本も走らせずに API 呼び出しで済ませるのが正解になる。カスタムモデルの学習・運用コストを負う判断は、既製サービスで要件を満たせないことを確認した後でよい。

自前で作る場合も、ゼロからの学習が既定ではない。SageMaker JumpStart や Bedrock の事前学習済みモデル・ソリューションテンプレートから出発し、必要に応じてカスタムデータでファインチューニングする段階的アプローチが、ガイドのスキル項目に明記されている。さらに「データ量と問題の複雑さから ML ソリューションの実現可能性を評価する」という項目もある。ラベル付きデータが数十件しかないのに深層学習を選ぶ、決定的なルールで解ける問題に ML を持ち込む——こうした筋の悪い選択を排除できるかが、Task 2.1 の合否ラインだ。

解釈可能性も独立した判断軸になる。与信や医療のように「なぜその予測になったか」の説明責任が伴う領域では、精度がわずかに勝る複雑なモデルより、構造が読める線形モデルや決定木系を選ぶ判断が問われる。精度・コスト・解釈可能性の三すくみを要件文から読み取る訓練をしておきたい。

コストに基づくモデル・アルゴリズム選択も、ガイドが独立したスキル項目として挙げている。深層学習は GPU の学習コストと推論コストを継続的に支払う選択であり、勾配ブースティング木や線形モデルで同等の業務価値が出るなら、後者が経済合理的だ。試験の選択肢で「最も高精度なモデル」が正解になるとは限らない。「要件を満たす最小コストの構成」を選ばせる思想は、SAA-C03 のコスト最適化と同じ文法であり、MLA-C01 でも一貫している。

組み込みアルゴリズムの地図 — XGBoost から DeepAR まで

SageMaker の組み込みアルゴリズムは、コンテナを用意せずに学習ジョブを起動できる既製の選択肢だ。代表格をタスク別に押さえる。

アルゴリズム	タスク	一言で
XGBoost	分類・回帰	勾配ブースティング木。表形式データの第一候補
Linear Learner	分類・回帰	線形モデル。高速・解釈しやすい基準点
K-Means	クラスタリング	教師なしのグループ分け
PCA	次元削減	特徴量の圧縮・可視化の前処理
Random Cut Forest	異常検知	教師なしの外れ値スコアリング
DeepAR	時系列予測	RNN ベースの確率的予測。複数系列の同時学習

全アルゴリズムの暗記は不要だが、「表形式なら XGBoost をまず試す」「時系列予測には DeepAR」「異常検知の教師なし要件には Random Cut Forest」という対応付けは、組み合わせ（matching）形式の典型的な題材になる。また、組み込みで足りない場合のエスカレーション経路として、TensorFlow や PyTorch のコードをそのまま持ち込む SageMaker のスクリプトモード、さらに独自コンテナという段階があることも、Task 2.2 のスキル項目（サポートされるフレームワークでの学習）として覚えておく。

Task 2.2 — 学習プロセスの語彙: エポック・バッチ・分散学習

学習の制御に関する語彙は、試験ガイドが明示する範囲を確実に固める。エポック（データセット全体を何周するか）、ステップ、バッチサイズ（1 回の勾配更新に使うサンプル数）という学習プロセスの構成要素。そして学習時間を短縮する手法としての早期終了（early stopping）と分散学習だ。

早期終了は一石二鳥の概念として整理するとよい。検証スコアが改善しなくなった時点で学習を打ち切るため、時間とコストを節約すると同時に、過学習が進む前にモデルを止める正則化的な効果も持つ。分散学習は大規模データ・大規模モデルで学習時間を圧縮する選択肢で、「学習に時間がかかりすぎる」という症状への処方の 1 つだ。

バッチサイズの効き方は定性的に理解しておく価値がある。バッチを大きくすると勾配の推定が安定し、ハードウェアの並列性も活かしやすい一方、メモリ消費が増える。小さくすると更新がノイジーになるが、そのゆらぎが正則化のように働くこともある。「メモリ不足で学習が落ちる」という症状にバッチサイズ削減という処方が対応する、といった因果の向きで覚えると、シナリオ問題でそのまま使える。学習率との組み合わせで挙動が変わる点も含め、唯一の正解値があるのではなく要件と資源からの調整対象だ、という理解が問われる。

モデルサイズに影響する要因、そして SageMaker の外で構築したモデルを SageMaker に統合する方法も知識項目に含まれる。後者は実務で頻出のシナリオで、既存の学習済みモデルを持ち込んで SageMaker のデプロイ・監視基盤に載せる、という流れを把握しておくと Domain 3 への接続もよくなる。

過学習との戦い — 正則化・ドロップアウト・破滅的忘却

Domain 2 の中核概念が過学習（overfitting）と過小学習（underfitting）の診断だ。学習データでは高精度なのに検証データで崩れるなら過学習、両方で精度が出ないなら過小学習。この診断を起点に、処方の選択肢が枝分かれする。

試験ガイドが挙げる正則化の道具立ては、L1・L2 正則化、重み減衰（weight decay）、ドロップアウトだ。L1 は不要な特徴量の係数をゼロに押し込み、実質的な特徴量選択として働く。L2 は係数全体を滑らかに小さくし、極端な重みを抑える。ドロップアウトはニューラルネットワークの学習中にランダムにユニットを無効化し、特定の経路への依存を防ぐ。「特徴量が多すぎて過学習している」なら L1 や特徴量選択、「ネットワークが訓練データを暗記している」ならドロップアウト、という症状との対応で覚える。

もう 1 つ、ファインチューニング時代に重要度が上がった概念が破滅的忘却（catastrophic forgetting）だ。事前学習済みモデルを新しいデータで調整すると、元のタスクの能力が失われる現象を指す。ガイドはこれを過学習・過小学習と並ぶ「防ぐべき事象」として明記しており、基盤モデルのファインチューニングを扱う Bedrock・JumpStart の文脈と組み合わせた出題が想定される。

ハイパーパラメータチューニング — AMT は「総当たり」を卒業させる

ハイパーパラメータ——木の本数、ニューラルネットワークの層数、学習率——は学習前に人間が決める設定値であり、その良し悪しがモデル性能を大きく左右する。試験ガイドが名指しする探索手法はランダムサーチとベイズ最適化の 2 つ。グリッド状の総当たりに比べ、ランダムサーチは同じ試行回数で広い空間を探索でき、ベイズ最適化は過去の試行結果から「次に試すべき点」を推定して効率を上げる。

SageMaker でこれを担うのが自動モデルチューニング（AMT: Automatic Model Tuning）だ。目的指標（検証精度など）と探索範囲を指定すると、複数の学習ジョブを走らせて最良の組み合わせを探す。「手動で 1 つずつ試している時間がない」「チューニングを自動化したい」という要件文は AMT への誘導と読んでよい。ハイパーパラメータが性能に与える影響——木を増やせば表現力が上がるが過学習リスクも上がる、層を深くすれば複雑なパターンを捉えるが学習は難しくなる——という定性的な因果も、知識項目として問われる。

AMT を使う際の設計判断は 2 つに集約される。第一に目的指標の選択。不均衡データで正解率を目的指標にすると、チューニングそのものが間違った方向へ最適化される。後述する評価指標の議論は、AMT の設定段階から効いてくるわけだ。第二に探索範囲と試行回数の設計。範囲を広げるほど良い解に出会う可能性は上がるが、学習ジョブの本数だけコストがかかる。チューニングは無料ではない、という当たり前の事実が、Domain 4 のコスト最適化と接続する出題ポイントになる。

モデルの軽量化と合成 — アンサンブルから Model Registry まで

性能を上げる方向の道具と、軽くする方向の道具を対で押さえる。

上げる方向は複数モデルの組み合わせだ。試験ガイドはアンサンブル、スタッキング、ブースティングを挙げる。独立に学習した複数モデルの予測を合議させるのがアンサンブルの基本発想で、XGBoost 自体が弱いモデルを順次積み上げるブースティングの実装である、という接続も理解しておくと記憶が安定する。

軽くする方向は、データ型の変更（量子化的な発想）、プルーニング（寄与の小さい部分の刈り込み）、特徴量選択の見直し、圧縮だ。エッジデバイスへの配置やレイテンシ要件が厳しい推論で必要になる。この文脈は Domain 3 の SageMaker Neo（エッジ最適化）に直結する。

そして学習の成果物を管理するのが SageMaker Model Registry だ。モデルのバージョンを登録し、再現性と監査対応を担保する。「どのデータ・どの設定で学習したモデルが本番にいるのか答えられない」という状況を防ぐ仕組みであり、ガイドでは再現可能な実験の実施とあわせてスキル項目に挙げられている。MLOps の文脈で Domain 3 の CI/CD、Domain 4 の監視と連鎖する要の部品なので、位置づけを正確に。

Task 2.3 — 評価指標の使い分け: 混同行列から AUC まで

評価指標は Domain 2 で最も確実に出る領域だ。試験ガイドの列挙は、混同行列、F1 スコア、正解率（accuracy）、適合率（precision）、再現率（recall）、RMSE、ROC 曲線、AUC、そしてヒートマップによる可視化。

分類指標は「何を間違えると痛いか」から逆引きする。不正検知や病気のスクリーニングのように見逃しが致命的なら再現率を重視する。スパム判定のように誤検知（正常をスパム扱い）が痛いなら適合率を重視する。両者のバランスを 1 つの数字で見たいなら、調和平均である F1 スコア。クラスが極端に不均衡なデータでは正解率が無意味になる——99% が正常なら「全部正常」と答えるだけで正解率 99% が出る——という罠は、最頻出の論点と考えてよい。

回帰には RMSE。しきい値に依存しない分類器の総合力には ROC 曲線と AUC。そして個々の予測の内訳を見るには混同行列。指標と用途の対応付けは matching 形式の典型題材であり、ここで取りこぼすと Domain 2 全体が崩れる。性能のベースラインを最初に作る方法、モデルの性能・学習時間・コストのトレードオフ評価も、ガイドが明記するスキル項目だ。

適合率と再現率の関係は、しきい値という 1 本のつまみで理解すると揺らがない。分類器が出すスコアに対して「どこから陽性と判定するか」のしきい値を下げれば、陽性判定が増えて見逃しは減る（再現率が上がる）が、誤検知も増える（適合率が下がる）。しきい値を上げれば逆になる。つまり両者はトレードオフの両端であり、どちらに寄せるかは業務の損失構造で決まる。ROC 曲線はこのしきい値を動かしたときの挙動を一望する道具で、AUC はその曲線下面積として「しきい値の選び方によらない総合力」を 1 つの数字に畳み込む。ここまで一続きで説明できれば、指標まわりの出題はどの形式で来ても崩れない。

Clarify と Model Debugger — 解釈・バイアス・収束の三点セット

Task 2.3 の後半は、SageMaker のツール群で性能分析を実装する話になる。

SageMaker Clarify は、学習データとモデルへの洞察を得る指標群を提供し、モデル出力の解釈とバイアス検出を担う。Domain 1 では学習前バイアス指標（CI、DPL）の文脈で登場したが、Domain 2 では学習後のモデルに対する解釈・バイアス分析として再登場する。同じサービスが工程によって役割を変える点は、出題者が混乱を誘いやすいポイントだ。

SageMaker Model Debugger は、学習中の収束問題をデバッグするツールだ。損失が下がらない、勾配が暴れる、といった学習の不健康をリアルタイムに検出する。「収束しない学習ジョブの原因を調べたい」なら Debugger、「モデルの予測がなぜそうなったかを説明したい」なら Clarify という切り分けを、一言で言えるようにしておく。

もう 1 つ、シャドーバリアントと本番バリアントの性能比較がスキル項目に明記されている。新モデルを本番トラフィックの複製に対して裏側で走らせ、ユーザー影響なしに本番モデルと比較する手法で、Domain 3 のデプロイ戦略、Domain 4 の A/B テストと地続きの概念だ。ドメインをまたいで「安全に新モデルを試す方法」という一本の物語として整理しておくと、応用問題に強くなる。

頻出論点チェックリスト — 本番想定の自己診断

以下に根拠付きで即答できるかを確認してほしい。

翻訳・文字起こし・画像分析の汎用要件にまず検討すべきは（→ Translate / Transcribe / Rekognition などの既製 AI サービス）
表形式データの分類・回帰でまず試す組み込みアルゴリズムは（→ XGBoost）
検証スコアが頭打ちになった時点で学習を止める手法は（→ 早期終了）
不要な特徴量の係数をゼロに押し込む正則化は（→ L1）
ファインチューニングで元タスクの能力が失われる現象は（→ 破滅的忘却）
過去の試行から次の探索点を推定するチューニング手法は（→ ベイズ最適化、AMT で実行）
不均衡データで正解率の代わりに見るべき指標は（→ 適合率・再現率・F1・AUC）
学習の収束問題を調べる SageMaker ツールは（→ Model Debugger）

8 問中 6 問以上なら Domain 2 は得点圏だ。詰まった項目は対応する節に戻り、「症状 → 処方」の向きで覚え直してほしい。

まとめ — モデル開発は「診断学」として学ぶ

Domain 2 の 26% は、暗記量では Domain 1 に及ばないが、理解の深さを最も問われる領域だ。作る前に既製サービスを検討する判断、組み込みアルゴリズムのタスク対応、過学習の診断と正則化の処方、AMT によるチューニングの自動化、そして評価指標の使い分け。すべてに共通するのは「状況を診断してから道具を選ぶ」という順序であり、この順序が身につけば、初見のシナリオ問題も同じ型で解ける。

次は Domain 3「デプロイとオーケストレーション」（22%）。学習したモデルを本番に送り出し、CI/CD で回し続ける領域へ進む。学習計画の全体像は AWS MLA-C01 完全攻略入門（2026-06-15 公開）の 8 週間ロードマップを参照のこと。

参照

#AWS #AWS認定 #MLA-C01 #SageMaker #XGBoost #モデル開発

ブラウザだけでできる本格的なAI画像生成【ConoHa AI Canvas】

ABOUT ME

MLA-C01 Domain 2 完全攻略 — モデル開発で 26% を取る

MLA-C01 Domain 2 完全攻略 — モデル開発で 26% を取る

Domain 2 の性格 — 「症状 → 処方」の試験領域

Task 2.1 — 作る前に「作らない」選択肢を検討する

組み込みアルゴリズムの地図 — XGBoost から DeepAR まで

Task 2.2 — 学習プロセスの語彙: エポック・バッチ・分散学習

過学習との戦い — 正則化・ドロップアウト・破滅的忘却

ハイパーパラメータチューニング — AMT は「総当たり」を卒業させる

モデルの軽量化と合成 — アンサンブルから Model Registry まで

Task 2.3 — 評価指標の使い分け: 混同行列から AUC まで

Clarify と Model Debugger — 解釈・バイアス・収束の三点セット

頻出論点チェックリスト — 本番想定の自己診断

まとめ — モデル開発は「診断学」として学ぶ

参照

Anthropic Academy 学習ロードマップ 2026 — Academy卒業からCCA認定合格への道

CCA Foundations試験完全ガイド 2026 — Claude認定アーキテクトへの最短ルート

Claude 2026春完全ロードマップ — 新機能統合ワークフローとCCA認定への道

Jules 非同期コーディングエージェント — VM で動く「待たないAI」

Gemini API と Gemini Enterprise Agent Platform — Vertex AI リブランド後の使い分け

AWS SAA-C03 模擬問題 30 問 + 頻出アーキテクチャパターン10種で解答力を仕上げる

MLA-C01 Domain 2 完全攻略 — モデル開発で 26% を取る

Domain 2 の性格 — 「症状 → 処方」の試験領域

Task 2.1 — 作る前に「作らない」選択肢を検討する

組み込みアルゴリズムの地図 — XGBoost から DeepAR まで

Task 2.2 — 学習プロセスの語彙: エポック・バッチ・分散学習

過学習との戦い — 正則化・ドロップアウト・破滅的忘却

ハイパーパラメータチューニング — AMT は「総当たり」を卒業させる

モデルの軽量化と合成 — アンサンブルから Model Registry まで

Task 2.3 — 評価指標の使い分け: 混同行列から AUC まで

Clarify と Model Debugger — 解釈・バイアス・収束の三点セット

頻出論点チェックリスト — 本番想定の自己診断

まとめ — モデル開発は「診断学」として学ぶ

参照

Anthropic Academy 学習ロードマップ 2026 — Academy卒業からCCA認定合格への道

CCA Foundations試験 完全ガイド 2026 — Claude認定アーキテクトへの最短ルート

Claude 2026春 完全ロードマップ — 新機能統合ワークフローとCCA認定への道

Jules 非同期コーディングエージェント — VM で動く「待たないAI」

Gemini API と Gemini Enterprise Agent Platform — Vertex AI リブランド後の使い分け

AWS SAA-C03 模擬問題 30 問 + 頻出アーキテクチャパターン10種で解答力を仕上げる

CCA Foundations試験完全ガイド 2026 — Claude認定アーキテクトへの最短ルート

Claude 2026春完全ロードマップ — 新機能統合ワークフローとCCA認定への道