皆さんは「GPT-4V」をご存知でしょうか?
もし「GPT-4V」を知らない、もしくは聞いたことはあるけど具体的にどうやって使うのか知りたいという方はこの記事を一読する価値があるかもしれません。
ぜひ、最後まで読んでいってください。
この記事で分かること
・GPT-4Vが何か知りたい人
・GPT-4Vの使い方
・GPT-4Vの活用事例を知りたい人
GPT-4Vとは?
GPT-4Vとは、ChatGPTに追加された新機能のことです。
2023年9月25日にOpen AI社が「GPT-4V」の新機能を発表したことで、GPT-4Vという単語が話題になりました。
この新機能の追加によってChatGPTは今までテキストのみの対話でしたが、テキストだけではなく画像認識や音声認識といった事が可能になりました。
GPT-4Vの「V」とはVision(視覚)のことで、ChatGPTが目と耳を持ったといわれています。
現状、音声認識機能はスマホのアプリ版でしか使用できず、PCでの使用はできません。
画像認識機能については、どちらも使用可能ですがChatGPT Plus(有料版)に課金しているユーザーのみの提供なので注意してください。
画像認識については、Xでも下記のような投稿がされています。
この投稿では、自転車の画像をもとにサドルの下げ方を質問しています。
画像認識機能と音声認識機能が追加されたことでChatGPTの可能性がとても広がったと感じています。
実際に画像認識機能については、下で解説する活用事例などを参考にすれば仕事でも活用できるアイデアがあるかもしれないのでぜひ参考にしてみてください。
GPT-4Vの使い方
ChatGPT Plusに追加された機能なので、特に操作は必要ありません。
下記の手順に沿ってみてください。
ChatGPTの画面で「GPT-4」をクリックしてDefaultにチェックされていることを確認します。
以上で設定は終了です。
あとは、チャット欄に上記のような写真マークが出てくるのでクリックすると画像を選択できるようになります。
GPT-4Vの活用事例5選
私が、実際に使用したり調べてみて便利だと思った活用の仕方を5つまとめてみました。
1,画像内の文章を翻訳させる
2,手書きの文字を文字起こししてもらう
3,画像のプロンプトを出力してもらう
4,画像内の改善案を教えてもらう
5,画像のネーム案を出してもらう
1,画像内の文章を翻訳させる
GPT-4Vは画像内の翻訳も可能です。
上で説明をしたOpen AI社がX(旧Twitter)で投稿している動画の中の一部を翻訳させてみました。
しっかり翻訳してくれる印象です。
2,手書きの文字を文字起こししてもらう
撮影した写真の文字起こしも可能です。
自分が撮影した写真から適当にピックアップして文字起こしをお願いしてみました。
私が載せた写真は食べ物のメニューと金額だったのですが、色分けをしてとても分かりやすく文字起こししてくれました。
こうした文字起こしは自分が手書きで書いた文字も認識してくれます。
仕事などではホワイトボードに書かれた文字を撮影しておいて後から文字起こしをするといった用途にも使えるのでかなり便利な活用方法だと思います。
3,画像のプロンプトを出力してもらう
自分の撮影した写真などを画像生成AIで出力したい場合、このGPT-4Vを活用してプロンプトを作ってもらうことも可能です。
牛の写真を再現してもらいたいので、プロンプトを作ってもらうことにしました。
そして、プロンプトを出力してDALLE-3で出力してもらったのがこちらです。
あまりイメージ通りに出力はできませんでしたが、特徴は捉えていますね!
また、プロンプトを出力するときにちょっとした工夫でプロンプトの精度をあげると、もっと詳細な画像を出力できる可能性があるので下記のようなこともイメージしながら皆さんもやってみてください。
・「かなり詳細に」という言葉使って詳細に文章を書きだしてもらう
・「英語」で出力する
・文章形式ではなく、単語形式で羅列してもらう
・自分の中で重要と思うワードは先に書く
4,画像内の改善案を教えてもらう
撮影した写真の画像に対して改善案を出してもらうこともできます。
上の写真は私がプロンプトで出力したスーツを着たシベリアンハスキーです!
もう少し変化が欲しいときにChatGPTにアドバイスをもらうのもよいかもしれません。
回答はこんな感じでした。
しっかりアドバイスをくれるのでとても便利です。
このように改善案を出してもらうことも可能ですが、他にも部屋の写真を撮影してレイアウトの改善案を出してもらうのもかなり実用的だと思います!
5,画像のネーム案を出してもらう
自分の撮影した写真にネーミング案を出力することもできます。
先ほどDALLE-3で出力した牛の画像にネーミング案を出してもらいましょう。
5つ考えてもらった結果がこちらです。
しっかりとネーミングの由来まで出力してくれました。
自分でネーミングを考えることが思いつかなかったり、恥ずかしいという方もいらっしゃるのでChatGPTにアイデア出しを手伝ってもらうと良いのではないでしょうか。
まとめ
以上がGPT-4Vの概要と活用事例でした。
活用事例に関しては、シンプルな事例が多いですがどれも便利な活用方法です。
私は実際に使用してみて、翻訳と文字起こしは実際に仕事の場でかなり重宝できそうだと感じています。
皆さんもGPT-4Vを活用して色々な活用方法を試してみてください。
最後まで見ていただきありがとうございました。