表示
44,858
ビュー
Codex / GPT
言うことを聞かない事はあるけど、かなり賢くなってる。直前の自分の投稿を受けて、補足や再評価だけを短く足した投稿です。表示 44,858 / いいね 232 / いいね率 0.5%。短文としては十分に反応があり、どこを評価しているかがつかみやすい投稿です。

表示
44,858
ビュー
いいね
232
支持
いいね率
0.5%
反応密度
再共有
49
拡散
Read First
Original Post
朱雀 | SUZACQUE @Suzacque / 2025-11-13 09:29
GPT-5.1 Thinkingを1時間使った印象。 言うことを聞かない事はあるけど、かなり賢くなってる。
以下の理由でGPT-5 proより実用性は高いかもしれない。 1. 回答速度が圧倒的に速い 2. 無理に情報圧縮しようとしないので回答がわかりやすい 3. 知能もGPT-5 proに近づいてきてる
Quoted Post
GPT-5.1ではユーザープロンプトよりも優先される強力な上位ルールが設定されたみたい。


投稿の核
この投稿の核は、言うことを聞かない事はあるけど、かなり賢くなってる。以下の理由でGPT-5 proより実用性は高いかもしれない という一点にあります。文章量は多くありませんが、何を高く評価し、どこに差があると見ているかはかなり明確です。
とくに GPT-5.1 のようなテーマでは、単に『良い』『すごい』と言うだけでは意味がありません。どの作業で差が出るのか、どの前提でその結論に達したのかまで読めるかが重要です。
この投稿は直前の自分の投稿を受けて書かれており、比較や補足の流れを一段深くしています。単発の感想ではなく、自分の論点を積み増すための再整理になっているのが特徴です。
反応の理由
反応の理由は、まず主張がはっきりしていることです。表示 44,858 / いいね 232 / いいね率 0.5% で、短文としては十分に観測に値する数字です。
もう一つは、Codex / GPT系 をめぐる現場感覚に寄っていることです。機能一覧ではなく、実際に使ったときに何が決定的だったかを短く切り出しているため、自分の仕事へ引き寄せやすい形になっています。
前提整理
この系統の投稿では、モデルの能力差を単なるベンチマークではなく、長い推論やファイル横断の作業に使ったときの体感差として語ることが多いです。性能表より先に、どの仕事で差が体感に変わるのかを見ると輪郭がつかみやすくなります。
このページでは、投稿本文、引用先、反応の数字、関連する自己返信を並べることで、短い投稿を単なる感想で終わらせず、判断材料として読み直せるようにしています。
読み方
強いモデル評価は、使い手のワークフローと課題の難しさで印象が大きく変わります。汎用的な正解として固定するより、自分の仕事で差が出る作業を特定した方が整理しやすくなります。
実際に使った感想は有用ですが、試した時間、触ったタスク、比較対象で結論はかなり動きます。一回の試行だけで普遍的な序列にすると話が粗くなります。
持ち帰り
複雑な文章整理、複数ファイルをまたぐ考察、調査の論点整理のような『長く考えさせる仕事』で試すと差が見えやすくなります。
GPT-5.1 の最終評価を受け取るというより、自分でも同じ仕事を一時間か半日まわして差を確かめる視点が残るページです。