Back to people
@kinopee_ai
K
@kinopee_ai

Cursor Regional Leader (East Asia) / Cognition Ambassador / Sponsored by CodeRabbit /「Software Design」誌で連載中

15KFollowers1.9KFollowing191KPostsView on X

Recent posts

AI コーディングは、つまるところ、AI が理解できる明確なゴールを与えて、それを検証できる術を与えること。

Cursor Long running agents も完了条件を満たすか、所定の時間を経過するまで最大限の努力を行う。 Claude Code や Codex の /goal コマンドに萌えを感じないのは、非同期エージェントで普通に存在する機能だから。

Photo 1

Devin には、Claude Code や Codex の /goal コマンドのような機能は不要。生まれつきのネイティブな自律型エージェント。 驚くべきことは、2024年12月一般公開された時点からそうだったこと。

Photo 1

Devin も忙しいらしい。

Photo 1

きちんとしたプランを立てたら、非同期エージェントに任せる。あとは、風呂に入る、寝る、飯を食う。

Photo 1

Devin の Android仮想デバイス(AVD)を検証するプロジェクトとして、Cursory の Android 版を作りますかね。

Photo 1

とかく話題になる「ハーネス」だけど、どのツールも一定以上の精度はあるので、「ワークフロー」にもっと目を向けるステージだと思います。 コーディングが10倍速くなったも、10倍速くリリースやデプロイができるわけではありません。

Claude Code、Codex にもクラウド上のサンドボックスはあるけど、機能性では Devin、Cloud Agents とはかなり差がある。 それでも、もっと活用した方がよいと私は思うけど。

Cloud Agents が Devin に対して明確に優れている点、コスト。Cloud Agents は現時点では モデル課金のみでインフラは無料状態。Composer 2.5 を使えば特にコスト高。

Photo 1

Composer 2.5、Opus 4.7、GPT-5.5 との比較もいろいろアップされているけど、タスク依存、使い方依存。 どれだと「○○できない」という評価も、人が違えば結果も違うので、自分で評価するのが一番だとと思いますよ。

Codex の PR レビューの設定でオプションが増えていますね。いつの間にか

Photo 1

論理的な分析タスク、Data Analyst Agent (DANA) に任せて、今夜は寝る。DANA はあまり使ったことがなかったので、結果が楽しみ。

Photo 1

私も日次のリポ更新の要約を Slack に送信する Automations を使っている。日毎に何をやったか、振り返ることができて、とても良い。 欲を言えば、Automations も複数リポジトリに対応して欲しいかな。

Photo 1

一部未完成だけど、書籍原稿アーカイブを編集部に送信。少し気が楽になった。

私が新しいモデルの精度を試す題材、スペースインベーダーをよく使うのだけど、Tee も同じで、思わずニヤリとした😏

Cursor Party feat. Tee 楽しく盛り上がりましたね😊 #cursorparty

Photo 1Photo 2

Cursor がエージェントに対するフィードバックを求めてきた。

Photo 1

サブエージェントに指示を渡す時点、結果が戻る時点でのコンテキストの欠落は意外に馬鹿にならない。メインのエージェントには、サブエージェントの結果を盲信しないで検証するように指示しないと、思わぬ誤判断が紛れ込む原因にもなる。

でかいタスクを AI に任せて、寝る。これが自分のスタイル。