Claude CodeのReact習熟度を測る
BRANK
皆さんこんにちは。コーディングエージェントの発展により、プログラムの多くの部分をAiが書いてくれるようになりました。しかし、筆者が得意とするReactに関しては、動くものを作ることはできるにせよ、人間が十分に指図しなければ質のいいコードが書けないことも多いと感じています。そこで、今回は、Claude CodeのReact習熟度を測るための簡単なベンチマークを作ってみたので、その結果を共有します。注意と予防線ベンチマークと名乗ると、粗探しをしたい方々が寄ってくる傾向があります。その前に、今回の設定が以下のとおりであることをご理解ください。あくまで筆者が考える「習熟度」を測っています。特に、Reactのベストプラクティスを適切に運用すること、新しいAPIも使いこなして適切な場面で適切なAPIを利用できることを重視しています。ベンチマーク対象はClaude Codeの3つのモデル(Haiku, Sonnet, Opus) です。他のLLMは今後の課題とします。モデルの「素の実力」を測った結果であり、プロンプトによる工夫やlinterの補助はありません。簡単なベンチマークであり、この記事の結果を出すにあたって、各ケースに対して1回しか実行していません。内容に意見のあ…