Claude Fable 5とは、アンソロピックが2026年6月9日に公開した、同社史上最も高性能なAIモデルです。
ソフトウェアエンジニアリングの主要ベンチマークであるSWE-Bench Proで80.3%を記録し、あらゆるベンチマークで既存モデルを大幅に上回る性能を示しています。価格は入力100万トークンあたり10ドル、出力100万トークンあたり50ドルと、従来のOpusモデルを大きく超える最上位の価格帯に位置します。
このモデルを実際にテストしたAI専門家は、「最高性能のモデルがすべてのタスクで最適とは限らない」と警鐘を鳴らしました。この事実は、カスタマーサクセス活動でAIを活用しようとする日本企業の経営者にとって極めて重要な教訓を含みます。
本稿では、ChatPRDの創業者、クレア・ヴォ(Claire Vo)氏によるFable 5のレビュー動画『Claude Fable 5 - is this Mythos model worth the wait?』に基づき、筆者の視点で日本企業への学びを考察した結果をご紹介します。
クレア・ヴォ氏は、プロダクトマネージャー向けAIツール「ChatPRD」の創業者であり、Lenny's Podcastネットワークのポッドキャスト「How I AI」のホストを務めています。LaunchDarkly、Color Health、Optimizelyなど複数の企業でCPTO(最高プロダクト&テクノロジー責任者)を歴任した経験を持ち、AIを日々の業務に組み込む実践者として知られています。
彼女のレビューが注目に値するのは、単にベンチマークの数字を追うのではなく、「実際の業務に使ったらどうだったか」という視点で率直にAIモデルを評価する点にあります。
Claude Fable 5とは、アンソロピックが開発した「Mythos(ミソス)クラス」と呼ばれる最上位のAIモデルを、一般ユーザー向けに安全対策を施して公開したものです。
Mythos本体は、サイバーセキュリティ上の懸念からProject Glasswingと呼ばれる枠組みのもと、限定されたパートナー企業にのみ提供されています。Fable 5はそのMythosと同じ基盤モデルを使いながら、サイバーセキュリティ、生物学、化学などの高リスク領域に安全分類器(セーフティクラシファイア)を搭載し、一般公開を可能にしたバージョンです。
アンソロピックはFable 5の特長として、高度な自律性、長時間にわたるタスクの実行能力、卓越した視覚認識(Vision)能力、そしてサブエージェントを活用したマルチエージェント・オーケストレーションを挙げています。トークン消費量は従来モデルの約2倍とされており、その分コストも高くなります。
なお、Fable 5は2026年6月9日に一般公開された後、同月12日に「外国籍者による Fable 5 / Mythos 5 へのアクセスを停止する米国政府の輸出管理指令」が出たことを受け、アンソロピックはFable 5 と Mythos 5 を全顧客向けにアクセス停止の対応をしました。クレア・ヴォ氏のレビュー動画は一般公開後、アクセス停止の前に公開されています。
クレア・ヴォ氏がFable 5を高く評価したのは、視覚認識(Vision)能力とドキュメントのフォーマッティング能力です。彼女は7歳の子ども向けの書き取り練習シートの作成において、Fable 5とOpus 4.8を比較しました。
Fable 5が生成したシートは、行間のスペースが適切で読みやすく、子どもが書き取りしやすいレイアウトになっていました。一方、Opus 4.8は情報が密集し、どこに書けばいいのか分かりにくいデザインでした。
彼女はPDFフォーマッティング全般においても複数のモデルと比較テストを行い、Fable 5が最も優れた結果を出したと評価しています。
一方、3つの領域において期待を大きく下回りました。
1つ目は文章の読みにくさです。
クレア・ヴォ氏は自身が開発中のプロダクトの仕様書をFable 5に分析させたところ、出力されたマークダウン文書は非常に詳細ではあるものの、内部参照が複雑に入り組み、長い段落が連なる「森を見ることができない」文章でした。
彼女はこれを「ベテランエンジニアの悪い面」と表現しています。仕様書やPRD(プロダクト要件定義書)の作成には、むしろSonnetやOpusの方が読みやすい文章を出力すると指摘しました。
2つ目はUIデザインの品質です。
スキルレジストリの画面デザインをFable 5に依頼したところ、グレー、黒、赤の単調な配色で、基本的なデザイン原則すら守られていない結果になりました。プロンプトを詳細に指定しても改善は限定的だったとのことです。
3つ目はMVP(実用最小限の製品)構築における過度な保守性です。
仕様書を渡して「顧客が価値を感じられるV0を作ってほしい」と指示したところ、Fable 5が出力したのは「最小限」を極端に解釈した、実用性に欠けるものでした。
アンソロピック自身がFable 5を「ベテランエンジニアのように働く」と説明していますが、クレア・ヴォ氏はまさにその「ベテランエンジニアの弱点」、つまり120%の確実性を追求するあまり出荷が遅れる傾向が、このモデルにも表れていると指摘しています。
彼女の結論は明快です。Fable 5は「難しい技術的問題」と「視覚認識を必要とするタスク」に投入すべきであり、フロントエンドのデザインや戦略文書の作成には向いていない、というものです。
そして、最も重要なメッセージとして、「SonnetにもOpusにも、エコシステム内の他のモデルにも、それぞれ活躍する場所がある」と述べています。
クレア・ヴォ氏のレビューから得られる1つ目の示唆は、AIモデルの適材適所の重要性です。
「一番賢いモデルを導入すれば、CS業務は全面的に改善する」という考え方は一見合理的に思えます。しかしFable 5のレビューが示したのは、最高性能モデルが「文章が読みにくい」「デザインができない」「MVPを作れない」という、直感に反する事実でした。これはAIモデルの世界においても、万能な人材が存在しないのと同じことです。
CS活動でAIを活用する際、「モデルのオーケストレーション」 という考え方が鍵になります。
たとえば、顧客への日常的なメール作成、ヘルプセンターの記事執筆、社内向けの報告書作成など、文章の読みやすさが求められるタスクには、コストが低く文章力に優れたモデルが適しています。
一方、顧客の複雑なシステム連携に関するトラブルシューティングや、膨大な利用ログからの異常検知パターンの分析など、深い技術的推論が求められるタスクには、Fable 5のような高性能モデルが力を発揮します。
ポイントは「コスト」です。Fable 5はトークン消費量が従来モデルの約2倍であり、価格も最上位です。すべてのCS業務にFable 5を使えば、AIへの投資コストは膨れ上がる一方、文章やデザインの品質はむしろ低下するという逆説的な結果を招きかねません。
CS活動へのAI活用でROI(投資対効果)を最大化するには、現行のCS活動を、「どのタスクにどの水準の知能が必要か」という観点で棚卸しすることが出発点になります。
2つ目の示唆は、Fable 5に搭載された「フォールバック」という仕組みから導かれます。
Fable 5には、サイバーセキュリティ、生物学、化学などの高リスク領域に対する安全分類器が組み込まれています。ユーザーのリクエストがこれらの領域に該当すると判定された場合、Fable 5は処理を拒否するのではなく、自動的にOpus 4.8という別のモデルに切り替えてレスポンスを返します。
アンソロピックによれば、Fable 5のセッションのうち安全分類器が作動するのは5%未満であり、95%以上のユーザーはフォールバックを意識することなく利用できています。
この仕組みの本質は、「最高性能のシステムが対応できない状況でも、サービスを完全に停止させず、安全なレベルに自動的に縮退させる」という設計思想にあります。
このフォールバック設計という思想は、CSに関わる業務にAIを組み込む際に極めて重要です。
AIチャットボットが顧客対応をしている場面を想像してください。ある顧客が、AIの訓練データにない複雑な質問をしたり、感情的なクレームを伝えたりした時、AIが「お答えできません」と応答を拒否すれば、顧客体験は著しく損なわれます。
Fable 5のフォールバック設計に倣えば、CS活動におけるAI運用で必要なのは、次のような「縮退運転」の設計です。
この多層構造を事前に設計しておくことで、顧客から見たサービス品質を一定に保ちながら、AIの限界による顧客体験の断絶を防ぐことができます。
重要なのは、「AIが失敗しない」ことを前提にするのではなく、「AIが失敗した時にどうするか」を前提に設計することです。
これはカスタマーサクセスにおける「リスクマネジメント」の考え方そのものであり、AIに限った話ではありません。顧客のヘルススコアが悪化した時のエスカレーションフローを設計するのと同じように、AIの縮退運転フローを設計することが、CS活動でAIを活用する際の信頼性を担保します。
3つ目の示唆は、クレア・ヴォ氏が繰り返し指摘した「Fable 5はベテランエンジニアのように働く。それは良いことでもあり、悪いことでもある」という評価から導かれます。
クレア・ヴォ氏がFable 5に仕様書のV0(最初の実用版)を依頼した際、AIは「最小限」という指示を極端に解釈し、実用性に欠けるものを出力しました。
一方、仕様書の分析を依頼すれば、内部参照が複雑に入り組んだ、誰も読み通せないほど詳細な文書を生成しました。つまり、「やりすぎる」か「やらなさすぎる」かのどちらかに振れてしまい、「ちょうどいい」落としどころを見つけられないのです。
この傾向は、CS業務にAIを導入した際にも同じように現れる可能性があります。
たとえば、解約リスクのある顧客への対応策をAIに提案させると、AIは考えうるすべてのリスク要因を網羅した「完璧な」行動計画を生成するかもしれません。しかし、20項目にわたる行動計画を渡されたCSMは、明確な優先順位をつけられないまま、結果として何も実行に移せない、という事態に陥りかねません。あるいは逆に、AIが安全側に振れて「まず顧客にヒアリングしてください」という当たり前の提案しかしないケースもありえます。
ここで問われるのは、AIの出力を鵜呑みにする能力ではなく、AIの出力を「編集」する能力です。
つまり、「顧客のビジネスゴールにとって今すぐ必要な最低限の価値は何か?」「20項目の行動計画の中から今週やるべき優先事項3つはどれか?」。こうした判断は、顧客のビジネス文脈を深く理解しているCSMにしかできません。
クレア・ヴォ氏が「時にはもう少し賢くないモデルの方がいい」と述べたのは、AIの知能レベルを下げろという意味ではありません。AIの出力を、人間のビジネスセンスでコントロールすることの重要性を指摘したものです。
AI時代のCSMに求められる新しい能力は「AIディレクター」としてのスキルです。
つまり、AIに適切な指示を出し、AIの出力を顧客のビジネスゴールに合わせて翻訳し、最速で顧客に「成功体験」を届けるための取捨選択を行う。こうした、「ディレクション(明快な指示だし)能力」こそが、AI時代にCSを実践することで競争優位性を高めるCSMの必須要件です。
本稿は、クレア・ヴォ氏によるClaude Fable 5のレビューを基に、カスタマーサクセスへのAI活用における示唆3つを解説しました。要は、「AIの力で顧客へ成果を届けよ」です。逆に言えば、AI時代にそれができなければ、早晩、顧客は確実に離れていくでしょう。
最後に、日本企業の経営者としてカスタマーサクセス活動にAIを活用する際にチェックすべき5つの問いを紹介します。皆さんの意思決定にぜひ活かしてください。
AI時代に問われるのは、「どれだけ高性能なAIを使っているか」ではなく、「どれだけ顧客の成果にAIの力を変換できるか」です。最強のAIモデルですら万能ではないという事実は、裏を返せば、AIの手綱を握る人間の判断力がこれまで以上に重要になる、ということを意味しています。
あなたのビジネスは、AIの手綱を握れていますか? 同僚と議論してみてください。
なお、本記事の元になったクレア・ヴォ氏の動画は以下よりご覧になれます。