アメリカのサンフランシスコに拠点を置くスタートップAI企業のAnthropicはClaude2.1(クロード2.1)のアップデートを発表しました。
アップデートされた内容をまとめてみましたのでアップデート内容を確認したいという方はこの記事で内容を確認してみてください。
簡単なおさらい
Claudeにどのような特徴があるのか簡単におさらいします。
すでに知っているという方はアップデート内容のみご覧ください。
2023年3月にClaudeが公開され、ChatGPTの競合として今も注目されているAIツールになっています。
元OpenAIのメンバーによって設立されており、Googleから巨額の出資を受けています。
Claudeの大きな特徴としては、より人間に近い自然な会話を実現してくれます。
ChatGPTよりもより人間らしい会話ができると評価されています。
さらに、100Kトークン(当時)という長い入力が可能なのもClaude唯一の特徴とも言えるでしょう。
そして、Claudeの狙いとして「正直で無害」なAIアシスタントを開発することを目標として開発がされています。
これは安全面に配慮したAIツールであることが分かります。
Claude2.1のアップデート内容
簡単なおさらいも終わったところで、ここからアップデート内容をご紹介します。
今回のアップデート内容は大きく3つのアップデートがありました。
200Kトークンのコンテキストウィンドウ
Calude2では最大100Kのコンテキストウィンドウだったのに対してClaude2.1ではコンテキストウィンドウが200Kトークンに増加しました。
これにより、Claudeに送信できる情報量は2倍となりました。
また、翻訳すると150,000語または500ページ分の情報を理解し、処理する能力を持っています。
この拡張されたコンテキストウィンドウは、長文のドキュメントや技術資料、財務諸表などの処理が可能になります。
幻覚率(ハルシネーション)が半減
このアップデートによりClaude 2.1は、以前のモデルに比べて誤った情報を生成する率が大幅に減少しました。
上記の画像では、難しい質問に対する正確性を測定したグラフになります。
Inocorrent「不正確」を見てみると、Claude2が40%越えであるのに対してClaude2.1は25%程度であることが分かります。
Declined answer「回答を拒否」では、Claude2が25%程度に対してClaude2.1は40%越えとなっています。
さらにこちらのグラフでは、長いテキストの文脈に基づいて質問に答える際のエラー率を示しているグラフです。
各グラフには、文脈の「Beginning」(始まり)、「Middle」(中間)、「End」(終わり)、「Average」(平均)の4つのカテゴリがあり、それぞれの位置でのエラー率が表示されています。
グラフを確認すると、Claude2.1のエラー率が低いことが分かります。
Endの割合はほとんど変わりませんが、BeginningとMiddleに関しては改善が見られます。
以上のグラフの比較から、難しい問題に対して誤回答する割合が大幅に減少し、分からない問題については断るようになったことが分かります。
そして長文に対する理解度や要約に関する能力も向上しています。
AIの出力はより信頼性が高くなり、特に重要な判断を必要とする業務や情報の精度が求められる場面での利用が安心して行えるようになりました。
APIツールの使用
新たに追加された「ツール使用」機能により、Claudeは開発者が定義した機能やAPIと連携し、より多様な作業を実行できるようになります。
これにより、日常業務においてClaudeの活用範囲が広がりを見せそうです。
まとめ
Claude2.1についてまとめてみました。
ちなみに、Calude2.1は現在APIで利用可能になっています。
200Kのコンテキストウィンドウを使用するには、Proユーザー(有料版)のみが利用可能になります。
無料版では、200Kコンテキストウィンドウは使用できませんのでご注意ください。
それでもChatGPT-3.5には負けない精度と自然なやり取りが実現できていますので論文など長文の資料を読み込ませて学習をする際には活用してみるのも良いのではないでしょうか。
以上です。
最後までご覧いただきありがとうございました。