表示
16,054
ビュー
Codex / GPT
GPT-5.1 Thinkingを半日使った印象。 いつもはGPT-5 proばかりだが、今日はThinkingをメインで使ってみた。 を起点に、引用先の論点へ自分の評価軸を重ねた投稿です。明確に伸びた投稿で、何を重要視しているかが短文でも読み取れます。

表示
16,054
ビュー
いいね
90
支持
再共有
14
拡散
返信
1
対話
Read First
Original Post
朱雀 | SUZACQUE @Suzacque / 2025-11-13 22:05
GPT-5.1 Thinkingを半日使った印象。
いつもはGPT-5 proばかりだが、今日はThinkingをメインで使ってみた。 結果、それほど違和感はなかった。 GPT-5 proとGPT-5 Thinkingの知能差はかなり大きかったから、GPT-5.1 proには期待できるね!楽しみ!
Quoted Post
GPT-5.1が登場! 少し使ってみたけどGPT-5とはかなり違う回答が返ってくる。 左上:GPT-5.1 右上:GPT-5 左下:GPT-5.1 Thinking 右下:GPT-5 Thinking




What
この投稿の核は、GPT-5.1 Thinkingを半日使った印象。 いつもはGPT-5 proばかりだが、今日はThinkingをメインで使ってみた。 という一点にあります。文章量は多くありませんが、何を高く評価し、どこに差があると見ているかはかなり明確です。
とくに GPT-5.1 のようなテーマでは、単に『良い』『すごい』と言うだけでは意味がありません。どの作業で差が出るのか、どの前提でその結論に達したのかまで読めるかが重要です。
この投稿は 朱雀 | SUZACQUE の発言を受けて書かれており、元の論点に対して朱雀側の評価軸が重ねられています。単なる紹介ではなく、立場のある読み替えになっているのが特徴です。
Reaction
反応の理由は、まず主張がはっきりしていることです。表示回数は 16,054、いいねは 90 で、短文としては十分に観測に値する数字です。
もう一つは、Codex / GPT系 をめぐる現場感覚に寄っていることです。機能一覧ではなく、実際に使ったときに何が決定的だったかを短く切り出しているため、読む側が自分の仕事に引き寄せやすくなっています。
Context
この系統の投稿では、モデルの能力差を単なるベンチマークではなく、長い推論やファイル横断の作業に使ったときの体感差として語ることが多いです。読者にとって重要なのは、性能表より先に、どの仕事で差が体感に変わるのかを見ることです。
このページでは、投稿本文、引用先、反応の数字、関連する自己返信を並べることで、短い投稿を単なる感想で終わらせず、判断材料として読み直せるようにしています。
Caution
強いモデル評価は、使い手のワークフローと課題の難しさで印象が大きく変わります。汎用的な正解として読むより、自分の仕事で差が出る作業を特定して確かめる方が価値があります。
特にXの投稿は、読む側が前提を補ってしまうため、強い断定だけが一人歩きしがちです。重要なのは、その断定がどの条件で成立するのかを自分で切り分けることです。
Takeaway
複雑な文章整理、複数ファイルをまたぐ考察、調査の論点整理のような『長く考えさせる仕事』で試すと差が見えやすくなります。
この投稿を読む価値は、正誤をそのまま受け取ることではなく、GPT-5.1 を評価するときの観点を一つ増やせることにあります。そこがニュース記事よりも短い投稿を読む意味です。