チャットGPTとDeepSeekに韓國の大學(xué)入試問題を解かせたらどっちが勝つ?検証結(jié)果が話題に

Record Korea    2025年2月5日(水) 20時0分

拡大

4日、韓國?JTBCは「中國の新興企業(yè)DeepSeekが開発した生成人工知能は低予算で『チャットGPT』クラスの性能を備えていると評価されているが実際はどうなのか」とし、検証結(jié)果を公開した。資料寫真。

2025年2月4日、韓國?JTBCは「中國の新興企業(yè)DeepSeek(ディープシーク)が開発した生成人工知能(AI)は低予算で『チャットGPT』クラスの性能を備えていると評価されているが実際はどうなのか」とし、性能を比較するためチャットGPTとDeepSeekそれぞれに韓國の大學(xué)修學(xué)能力試験(日本の大學(xué)入學(xué)共通テストに當(dāng)たる)の問題を解かせた結(jié)果を公開した。

記事によると、チャットGPTとDeepSeekに今年の大學(xué)修學(xué)能力試験の國語と數(shù)學(xué)の問題を解かせた結(jié)果、いずれもチャットGPTの方がDeepSeekより誤答が少なく、勝者はチャットGPTとなった。

ただ、チャットGPTとDeepSeekには、受験生の誤答率が高かった問題を主に間違えるという類似性があった。受験生の正答率が0%だった問題はチャットGPT、DeepSeekのどちらも正解できなかった。國語の問題では「最も適切なもの」または「適切でないもの」を問うタイプの問題で誤答が多くみられたという。

記事は「興味深かったのは、韓國の時調(diào)(日本の短歌に相當(dāng))を扱った國語の問題でチャットGPTは誤答をしたが、DeepSeekは見事な推論で正解を?qū)Г訾筏郡长取工趣贰ⅰ复髮W(xué)修學(xué)能力試験の結(jié)果だけで性能をはかることはできないが、高いコストパフォーマンスを誇るDeepSeekが世界のAI市場を大きく揺るがすのは確実だ」と伝えている。

この記事を見た韓國のネットユーザーからは「チャットGPTの牙城に迫ったというだけでDeepSeekはひとまず成功したと言えるだろう」「韓國は何をしていた?研究開発予算を削減し、研究者を海外に追い出し…」「韓國はとうの昔に中國に追い抜かれた。きちんと自覚し、改善しよう。優(yōu)秀な人がこぞって醫(yī)大に行く國に発展はない」などの聲が寄せられた。

また、「大學(xué)修學(xué)能力試験に人間もAIも解けない問題があるというのは非常に大きな問題では?子どもたちを不必要に苦しめる問題は出題しないでもらいたい」「人間とAIが全員間違えたということは、その問題自體が間違いなのでは」「韓國の大學(xué)修學(xué)能力試験に問題があることが証明された。正常な教育を取り戻そう」と指摘する聲も見られた。(翻訳?編集/堂本

※記事中の中國をはじめとする海外メディアの報道部分、およびネットユーザーの投稿部分は、各現(xiàn)地メディアあるいは投稿者個人の見解であり、RecordChinaの立場を代表するものではありません。

この記事のコメントを見る

noteに華流エンタメ情報を配信中!今回はワン?ホーディー特集!その魅力に迫ります。詳しくはこちら

ピックアップ



   

we`re

RecordChina

お問い合わせ

Record China?記事へのご意見?お問い合わせはこちら

お問い合わせ

業(yè)務(wù)提攜

Record Chinaへの業(yè)務(wù)提攜に関するお問い合わせはこちら

業(yè)務(wù)提攜