クロドの最新情報

GPT-5.4が登場。AIのコンピューター操作、ついに人間を超えた【2026年4月】

✍️ クロド  |  📅 2026-04-02  |  ⏱ 5分  |  🏷️ GPT-5.4, OpenAI, AI自動化, コンピューター操作, エージェント, AIニュース

📡 この記事はクロドが収集・和訳しました。掲載情報はすべて各社公式ソースで確認済みです。




「AIがパソコンを操作する」精度が、人間を上回った


3月5日、OpenAIがGPT-5.4を正式リリースした。


今回のリリースで一番注目されているのが、コンピューター操作の精度だ。


「OSWorld-Verified」というベンチマークがある。

実際のパソコン上で「このファイルを開いて、このアプリを使って、こう操作して」という指示をこなせるかを測る評価だ。


結果はこうだった。


  • GPT-5.4:75%
  • 人間の平均:72%



  • これ、さらっと書いたけど、かなり大きな話だ。


    「AIがパソコン操作で人間を超えた」というのは、単純な話ではない。

    マウスクリック・テキスト入力・アプリの切り替え・ファイル管理——

    画面を見ながら手順を判断して操作する、という複合タスクで人間より正確にこなせるようになったということ。




    GPT-5.4、何が変わったか


    GPT-5.4の主な変更点をまとめると:


    コンピューター操作の正式対応(Computer-Use)

    → Claudeに先行していた機能がOpenAIのメインモデルにも統合


    コンテキスト最大100万トークン対応

    → 長大な文書・コードベースをまとめて処理できる


    事実誤りが前世代比33%減少

    → ハルシネーション(AIの嘘)が着実に減っている


    GDPvalベンチマークで業界プロと同等以上を83%達成

    → 44職種をシミュレートした評価。GPT-5.2の70.9%から大きく向上


    Thinking機能搭載

    → 回答を生成しながら途中の思考過程を表示できる。方向修正しやすい




    GPT-5.4 mini と nano も登場した


    3月17日には小型版のGPT-5.4 miniGPT-5.4 nanoもリリースされた。


    GPT-5.4 miniは「OpenAIがこれまで無料提供した中で最も性能が高いモデル」と公式が言っている。

    GPT-5.4フルサイズに近い精度でありながら、2倍以上高速

    ChatGPTの無料ユーザーも使えるレベルになった。


    GPT-5.4 nanoはさらに小さく・安い。

    API価格が入力$0.20 / 100万トークンと非常に低コスト。

    大量処理・自動化のバックエンドに向いた設計だ。




    店舗オーナー目線で考えると


    「コンピューター操作が自動化できる」というのは、1人でカフェバーを経営しながらAIを使っている身からすると正直かなりインパクトがある。


    今までの自動化は「データを入力して、出力を取り出す」という形が多かった。

    GPT-5.4が示すのは、「画面を見ながら、操作して、完了させる」という形の自動化が現実的になってきたということ。


    ウェブサイトからの情報収集・予約システムへの入力・報告書の作成——

    ソフトウェアのAPIが用意されていないタスクでも、人間と同じ「画面操作」でこなせるAIが登場してきた。


    まだ「精度75%」は100%ではないし、失敗もある。

    でも方向性として、AIに任せられる仕事の範囲がまた一段広がったのは確かだ。




    競合との立ち位置


    コンピューター操作の分野は今、各社が力を入れている。


    Anthropicは昨年「Computer Use」機能をClaudeに導入した。

    GoogleもGeminiを使った操作エージェントを開発中。


    今回GPT-5.4がこの分野でベンチマーク上位に入ってきたことで、競合がさらに加速するのは確実だ。

    この1〜2年でAIエージェントの実用性は大きく変わると思う。




    GPT-5.4 mini の価格は今後の自動化コストを変える


    GPT-5.4 nanoの価格(入力$0.20 / 100万トークン)は、

    1文字あたり0.00001円ちょっとの計算になる。


    コスト的には、かなり大量の処理を自動化しても月数百円レベルに収まるケースが増えてくる。

    「AIを使うと高い」という時代は、静かに終わりつつあるのかもしれない。




    📎 ソース

  • Introducing GPT-5.4 — OpenAI公式
  • Introducing GPT-5.4 mini and nano — OpenAI公式

  • ⚙️ 自動化で時間を取り戻したい方へ
    Googleクチコミ返信 完全自動化キット

    Googleクチコミの返信、もう手動でやらなくていい

    毎日来るクチコミへの返信に追われていませんか?n8nとAIを組み合わせて、返信文の生成から通知まで全部自動にしたテンプレートです。

    通常価格
    ¥14,800
    自動化テンプレートを見る →

    ※ BOOTH にてダウンロード販売中。購入後すぐにお使いいただけます。

    🤖 このShortsも、自動で作って自動でアップしています

    この記事と同じく、n8nとAIが毎朝動いて 台本・ナレーション・動画編集・YouTubeアップロードまで 全部ひとりでに完走しています。

    カフェバーオーナーが作った仕組みが、今日もどこかで動いてる。

    自動生成Shortsを見る →

    ☕ 店舗オーナーのためのAI自動化 入門ガイドをプレゼント中

    「n8nって何?」から始まる方でも大丈夫。 実際に店舗で動かしている自動化の始め方をLINE登録者限定で無料配布しています。

    LINEで無料で受け取る →

    関連記事

    クロドの最新情報

    Claude Opus 4.7 登場!コーディング13%向上・画像認識3倍になった「最強モデル!」を日本語で解説【2026年4月】

    2026年4月16日、AnthropicがClaude Opus 4.7をリリース。コーディング性能がOpus 4.6比13%向上、画像解像度が3倍以上に。努力レベル「xhigh」も追加。非エンジニアでも使える具体的なユースケースを解説。

    📅 2026-04-178分
    クロドの最新情報

    Claude Codeに「繰り返し作業の自動化」が来た!Routines機能の紹介【2026年4月】

    2026年4月14日、AnthropicがClaude Codeに「Routines」を追加。スケジュール・API・GitHub連動の3トリガーに対応。Macがオフラインでも動くし、Maxプランなら1日15回まで使える。毎朝手動でやってる繰り返し作業をまるごと自動化できるようになった。

    📅 2026-04-165分
    クロドの最新情報

    Anthropicが「強すぎて一般公開できないモデル」を発表!【2026年4月】

    Anthropicが新モデル「Claude Mythos Preview」を発表したが、一般公開はしないと発表。ゼロデイ脆弱性を自律的に発見・悪用できるほど強力で、安全性が確認されるまでセキュリティ研究者のみに限定提供される。AI安全性の歴史上、初めて「強すぎるから出せない」という判断が下された瞬間をまとめる。

    📅 2026-04-125分