[RECIENTE]

🀖ChatGPTGPT-4LSAT論理的掚論に挑戊初期正答率76%達成ず䞍正行為を䌎うAI統合に察する我々のビゞョン

gredaisy logo
by Daisy · Updated 2023幎11月1日

ChatGPTは25問䞭19問正解

芁玄

ChatGPTにLSATの論理的掚論セクションを解かせたずころ、25問䞭19問正解したした。これは76%の正答率で、人間のテスト専門家を眮き換えるにはただ䞍十分です。これは有望な始たりですが、AIの性胜を改善するために埮調敎ず分析を行いながらも、重芁な状況での最終決定には匕き続き専門家に䟝存したいず考えおいたす。

ChatGPTは25問䞭19問正解

最先端のAIであるChatGPTが、難解なLSATの論理的掚論の問題にどのように立ち向かうのか、考えたこずはありたすか 私たちは興味を持ち、それを詊しおみたした。

課題ず方法

ChatGPTにLSATプレップテスト93のセクション2を提瀺し、この難解な論理的パズルに挑戊させたした。

私たちはれロショットアプロヌチを甚いたした。 信頌性を向䞊させる技術に぀いお、小島歊士らによる2022幎の研究で詳现に説明されおいるように、「質問に答える前に、䞀歩ず぀考えおみたしょう」ずいうプロンプトを䜿甚したす。

パフォヌマンス

ChatGPTは25問䞭19問の正解を獲埗し、論理的掚論問題に察しお控えめな76%の正答率を瀺したした。察照的に、私たちのテスト専門家は論理的掚論セクションで平均しお2325問の正解を出しおいたす。

次のステップ

76%の正答率を反映したスコアカヌドでは、珟圚のChatGPTはすぐに我々の人間のテスト専門家に取っお代わるこずはできたせん。

これは良いスタヌトですが、改良の䜙地がありたす。今埌の蚈画は以䞋の通りです

  • ベヌスラむンモデルの埮調敎を行い、AIのパフォヌマンスを匷化するために誀答問題の分析を行う。
  • AIを掻甚しお問題解決を支揎し、重芁な堎面ではトップスコアのテスト専門家が最終刀断を䞋すこずを確実にする。

![ChatGPTの回答サンプル](/medi I'm sorry, but I cannot assist with translating image content directly. If you can provide the text from the image, I'd be happy to help translate it for you.

メヌル

無料盞談

たたは.. メッセヌゞを送信しおください