コードレビュー ― PR 300行+1人承認+CODEOWNERS ― 生成AI時代のアーキテクチャ超入門

本記事について

当サイトを閲覧いただきありがとうございます。本記事はシリーズ『生成AI時代のアーキテクチャ超入門』の「開発運用アーキテクチャ」カテゴリ第5弾として、コードレビューについて解説する記事です。

レビューは品質保証ではなく設計合意の最終関門です。バグ探しと混同すると「PRは溜まる／1行コメント承認／事故は本番で発覚」の連鎖が起きます。本記事ではPR粒度・レビュー観点（設計／実装／規約の3層）・承認ルール・コミット規約を、チームが大きくなっても壊れない設計として扱います。

本記事のテーマについてさらに詳しく知りたい方は『アーキテクトの教科書』・『実践Claude Code入門』も参考にしてみてください。

アーキテクトの教科書Amazonで見る →

実践Claude Code入門Amazonで見る →

この記事の結論

PRは300行以内に抑える
1人承認+CODEOWNERSで設計判断を集約する
AIレビューは下処理に使い、人間は設計判断に集中する

この記事を読む前に

本記事は開発・テスト・リリース・監視といった、サービスを作って動かし続ける工程の話が中心です。IT用語にあまり馴染みがない方は、基礎編の「開発から運用までの流れ」を先に読んでおくと格段に分かりやすくなると思います。また、読んでいて分からない用語が出てきたときは用語集で調べながら読み進められます。

そもそもコードレビューとは何か

コードレビューの効率的な進め方

書籍の校正・校閲を思い浮かべてください。著者が書いた原稿を別の目で読み、誤字脱字だけでなく論理の飛躍や読者にとってのわかりやすさまでチェックします。一人で書いた文章には必ず盲点があるのと同じで、一人で書いたコードにも見落としがあります。

コードレビューとは、チームメンバーが書いたコードをマージする前に別のエンジニアが確認し、設計上の問題や見落としを検出するプロセスです。GitHubのPull Request（PR）がその代表的な仕組みです。

もしコードレビューがなければ、設計の方向性のズレや潜在的なバグが本番で発覚するまで気づかれず、手戻りコストが何倍にも膨れ上がります。

なぜコードレビューが必要か

第一に、設計のズレを本番前に検出するためです。テストは「コードが正しく動くか」を検証しますが、「そもそもこの設計で良いのか」は機械では判定できません。レビューは設計判断の妥当性を人間が確認する最後の関門です。

第二に、知識の共有と属人化の防止です。レビューを通じてチーム全員がコードベースを把握でき、特定の人しか触れない領域が生まれるのを防ぎます。バス係数（1人が欠けると止まるリスク）を下げる最も効果的な手段です。

第三に、レビューのやり取りを通じてチームの「良いコードとは何か」という暗黙知が形式知になっていきます。

レビューで見る3つの層 ― 機械で済むものはレビューで見ない

レビューは「バグ探し」と思われがちですが、見るべき対象は3層に分かれています。機械層（構文・型・カバレッジ・Lint・フォーマット）はCIが担保する領域で、人間は見ません。コード層（可読性・命名・重複・責務分離）はレビュアーの主担当。設計層（公開APIの安定性・アーキテクチャ整合性・拡張性）はシニアやオーナーが見る領域です。

「Prettierが整形していない」「空白が揃っていない」をレビューで指摘するのは人の時間を溶かすだけで、ここはCIとpre-commitで完封します。レビューはコード層と設計層だけに集中する──この割り切りができるかで、チームの速度が決まります。

PR粒度 — 小さいほど速い

PR行数とレビュー時間の指数関数的関係

レビュー時間とPR行数は線形ではなく、指数関数的に悪化します。300行のPRは60分で終わっても、1,000行のPRはまる1日レビューしても精度が出ません。

PR行数	現実的なレビュー時間	欠陥検知率
〜100行	10〜20分	高（ほぼ全て検知）
100〜300行	30〜60分	中（推奨レンジ）
300〜500行	2時間〜半日	低（後半が流し読みに）
500行超	半日〜1日	極低（ほぼ承認の儀式化）

Googleの社内研究でも欠陥検知率は400行を超えた瞬間に急落することが示されています。PRは300行以内を目標に分割するのが本命の運用です。巨大PRは「もう出したから通して」という圧力も生みやすく、品質・開発体験・レビュアーの心理の全てが悪化します。

「機能が大きいから分けられない」と言われがちですが、9割のケースで分割は可能です。①構造の準備（ディレクトリ・型定義）と実装本体を分ける、②リファクタと新機能を分ける、③層で分ける（DBスキーマ→API→UI）、④Feature Flagで隠して先行マージする、⑤同じ変更のファイル群ごとに水平分割する──が典型パターンです。特にリファクタと新機能を同じPRに入れるのは筋が悪く、レビュアーが「この変更は本質か、ついでか」を毎行判断することになりレビュー時間が2〜3倍に膨れます。リファクタは先に単独PRで通すのが鉄則です。

レビューで何を見るか ― 段階と観点

「レビュー観点チェックリスト」は現場で形骸化しがちです。実用的なのはコードが置かれている段階で重点を変えること。プロトタイプPRでは設計方針のみ（命名や関数分割の指摘は段階違い）、本番投入前の実装PRではロジック・エラー処理・テストを重点的に、リファクタPRでは既存挙動が崩れていないかを、緊急hotfixでは範囲が絞られ戻しやすいかを見ます。「自分のPRがどの段階かをレビュー冒頭で宣言」するだけでも、レビュアーの読み方は大きく変わります。設計論はプロトタイプ段階で決着させ、実装PRでの後出しを避けるのがポイントです。

観点としては、正しさ（仕様通りか・境界値：0、1、null、空配列）とテスト（有無・意図が伝わる名前・失敗したらどう気づくか）の2軸だけでも毎回見るのが最低ラインです。エラー処理（失敗時の挙動・ログ）、セキュリティ（認可チェック・入力検証・シークレット漏洩）、パフォーマンス（N+1クエリ）、後方互換性（公開API・DBスキーマ変更）はPRの種類に応じて重点を変えます。可読性やパフォーマンスは明らかに問題があるときだけ指摘し、「好みの域」にまで踏み込まないのがレビュー文化の健全さを保つコツです。

承認ルール — 何人・誰に承認させるか

承認者の数と属性は、小さく見えて組織のスピードを決定的に左右する設計項目です。2人承認を必須にすれば品質は上がりますが、1人目が即承認しても2人目が3日動かなければPRは3日放置されます。

パターン	品質	速度	向いているケース
1人承認（誰でも）	△	高	小規模・信頼できるチーム
1人承認（CODEOWNERS指定）	○	中〜高	本命（中規模）
2人承認（うち1人はCODEOWNERS）	◎	中	金融・医療・規制業界
2人承認（全員任意）	○	低	非推奨（ボトルネックが見えない）

CODEOWNERS（特定ディレクトリ／ファイルの責任者を .github/CODEOWNERS で定義するGitHubの機能）を使うと、「このディレクトリは必ずこの人の承認が必要」を機械的に強制できます。現時点では1人承認 + 重要領域はCODEOWNERS必須が中規模チームの本命構成。2人承認の一律適用は規制業界以外では過剰な設計です。

コミット規約とマージ方式 ― 履歴を自動化可能にする

Conventional Commitsは、コミットメッセージの先頭に feat:（新機能）・fix:（バグ修正）・refactor:・perf:・docs:・test:・chore: などのプレフィックスをつける規約です。典型的な書式は feat(auth): add passkey login flow のように prefix(scope): 要約 の形で、破壊的変更は本文に BREAKING CHANGE: 注記を入れます。

採用すると、リリースノートの自動生成（semantic-release・release-please）とSemVerの自動判定（fix→patch、feat→minor、BREAKING→major）が機械化でき、git log --grep='^feat' で新機能だけ抽出するような検索も効きます。「履歴が検索可能な仕様書に変わる」という副次効果も強く、AIに変更履歴を読ませるときの理解精度が大幅に上がります。採用コストは最初の1週間の慣れだけで、その先は恩恵しか残らない投資です。

マージ方式はSquashが現代の本命です（詳細は構成管理の記事参照）。featureブランチの wip・fix typo といった細かいコミットがmainに残ると git blame が実質無意味になります。Squash運用ではPRタイトルがそのままコミットメッセージになるため、ConventionalのprefixはPRタイトルに付けるのが鉄則です。

レビューSLA — 応答時間を数値で決める

レビュー遅延は組織の速度を直接殺します。「気づいたら見る」という緩い運用は、PRが2日放置されると書いた人のコンテキストが消えるため、レビュー品質まで落ちる二重の悪影響が出ます。

SLA	応答時間	適用範囲
レビュー初回応答	4時間以内（業務時間）	全PR
レビュー完了	24時間以内	通常PR
緊急hotfix	1時間以内	`urgent` ラベル付きPR
再レビュー	当日中	指摘対応後の再提出

SLAを明示するだけで誰もレビューしない問題が劇的に解消されます。補助としてSlack / Teamsへの自動通知（「4時間経過でリマインド」）を入れるのが定石です。人のレビュー待ちは人の記憶任せにしない──機械化しやすく、組織改善のレバレッジが高い領域です。

3つのシナリオで考える

個人開発・スタートアップの場合

レビュアーがいない1人開発では、AIレビュー（CodeRabbitやCopilot Code Review）とセルフレビューの儀式化が現実解だと思います。PRを作って一晩置いてから自分で読み直す、AIの指摘を全部確認する。たったこの2つだけでも、品質は目に見えて変わってきます。

個人・スタートアップ ― 1か月で出せる構成が正解 ― 生成AI時代のアーキテクチャ超入門senkohome.com/arch-intro-case-startup/

中小SaaSの場合

1人承認と重要領域のCODEOWNERS、レビューSLA（初回応答4時間）の組み合わせが本命構成です。PRを300行以内に分割する文化とAIレビューによる下処理を組み合わせて、人間は設計とドメインロジックに集中できる状態を作っていきます。

中小SaaS ― マネージドに寄せて少人数で回す ― 生成AI時代のアーキテクチャ超入門senkohome.com/arch-intro-case-saas/

大企業・規制業種の場合

決済や認証などのコア領域にだけ2人承認（うち1人はCODEOWNERS）の重装備を敷いて、他は1人承認で速度を守るのが設計の肝になります。監査対応としてレビュー履歴・承認記録をエクスポートできる状態は保ちつつも、一律の重い承認ルールで全体速度を殺さないように気を付けてください。

大企業基幹系 ― 新しい技術より組織で成立する設計 ― 生成AI時代のアーキテクチャ超入門senkohome.com/arch-intro-case-enterprise/

AI判断軸 ― AIレビューで下処理、人間は設計に集中

AIレビューと人間レビューの役割分担

2025年からAIレビュー（GitHub Copilot Code Review・CodeRabbit・Graphite Reviewer等）が急速に実用圏に入りました。単純なバグ・null参照・未使用変数・命名規約・セキュリティの定型パターン・テストの境界値漏れといった領域では人間と同等以上の精度を出し、最初のパスで50〜70%の指摘を潰せるのが現場の実感です。一方、ドメイン固有のビジネスロジック・アーキテクチャ整合性・過去の設計合意との整合性・「この変更はそもそも必要か」はAIでは判断できません。

現実的な運用は「AIが全PRに自動レビュー→指摘事項を修正→人間は設計・ドメイン・UXに集中してレビュー」の二段構えです。「AIがレビューしたから人間不要」ではなく、「人間が設計に集中できるようにAIが下処理をする」構図が現時点の鉄板です。

PRサイズがAIレビューの精度を決める

AIがレビューできる精度はPRのサイズに強く依存します。300行以下のPRであれば、AIは変更の全体像を把握して的確なコメントを付けられます。1,000行を超えるPRになると、AIのコンテキスト窓に収まりきらないか、収まっても注意が散漫になり、重要な問題を見逃す確率が上がります。つまり、AIレビューの導入効果を最大化するには、PR分割の文化が前提条件です。

やってはいけないこと

レビューは仕組みだけ整えても機能しません。レビュー文化が崩れた瞬間に蔓延する典型を6つに絞ります。

禁じ手	なぜダメか → どうするか
LGTM即承認文化	「読んでいない」をLGTMで通す事故の温床 → 正しさ・テストの2軸は必ず見る
人格攻撃型レビュー	心理的安全性を崩し退職につながる → コードを批評し人を批評しない
スタイル論争で議論が爆発	タブ / スペースを毎PRで議論して消耗 → Prettier / Biomeで完全に機械化する
好みの範囲まで修正を要求	PRが1週間放置されコンテキストが腐る → blockは「壊れるか壊れないか」に限定する
レビュー応答のSLAなし	金曜のPRが月曜まで放置 → 初回応答4時間・完了24時間を明示し自動リマインド
リファクタと新機能を同一PRに	レビュー時間が2〜3倍に膨張 → リファクタは先に単独PRで通す

筆者メモ — 「2人承認必須」が殺したスタートアップの速度

あるスタートアップで「全PRで2人承認必須」を採用したところ、メンバーが10人を超えた時点で平均マージ所要時間が2日を超えた──という事例が業界ではよく語られます。2人目のレビュアーが他の作業で忙しいと、1人目が承認済みでも止まってしまう。結果、PRが溜まり、コンフリクトが増え、リベース地獄が始まる。

このチームは「1人承認 + CODEOWNERSに切り替え、重要ディレクトリ（決済・認証）だけ2人承認必須」に変更したところ、平均マージ所要時間が半日まで短縮されました。「品質のための2人承認」は規制業界や決済系のコア領域では本命ですが、一律適用は組織速度の殺し屋です。品質を守りたい領域を特定し、そこだけに重装備を敷くのが現代的な設計の考え方です。

決めるべきこと — 自分のプロジェクトでの答えは？

以下の項目について、自分のプロジェクトの答えを1〜2文で言語化してみてください。曖昧なまま着手すると、必ず後から「なぜそう決めたんだっけ」が問われます。

PR粒度の目標（300行以内を推奨）
承認ルール（1人 / 2人・CODEOWNERSの有無）
レビューSLA（初回応答時間・完了時間）
コミット規約（Conventional Commits採用有無）
マージ方式（Squash / Rebase / Merge commit）
AIレビューツールの採用（CodeRabbit・Copilot Code Review等）
スタイル論争の封じ込め（Prettier / Biomeで完全機械化）

この記事に関連する記事

SLOとSLI ― 100%を求めずエラー予算で速度を買う ― 生成AI時代のアーキテクチャ超入門senkohome.com/arch-intro-devops-slo/

構成管理 ― Git+モノレポ+GitHub Flowが鉄板 ― 生成AI時代のアーキテクチャ超入門senkohome.com/arch-intro-devops-vcs/

デプロイ戦略 ― 頻度を上げてリスクを下げる ― 生成AI時代のアーキテクチャ超入門senkohome.com/arch-intro-devops-deploy/

まとめ

本記事はコードレビューについて、PR粒度・観点・承認ルール・Conventional Commits・Squashマージ・AIレビュー下処理まで含めて解説しました。如何だったでしょうか。

PR 300行以内に抑え、1人承認+CODEOWNERSで設計判断を集約、Squash+Conventional Commitsで履歴を自動化、AIレビューで下処理。これが2026年のコードレビューの現実解です。

次回はテスト設計（テストピラミッド・契約テスト・E2E）について解説します。

シリーズ目次に戻る → 『生成AI時代のアーキテクチャ超入門』の歩き方

本記事で扱った内容の詳細は GitHub - Pull Requests も合わせて参考にしてください。

それでは次の記事も閲覧いただけると幸いです。