注目集めるディープシーク、次世代モデルに期待

CRI online    2025年4月8日(火) 14時(shí)30分

拡大

ディープシークの次世代モデル発表が期待される中、同社は大規(guī)模言語(yǔ)モデルの推論能力を向上させる新たな手法を発表しました。

中國(guó)の人工知能(AI)スタートアップ企業(yè)であるディープシーク(DeepSeek)の次世代モデル発表が期待される中、同社は大規(guī)模言語(yǔ)モデル(LLM)の推論能力を向上させる新たな手法を発表しました。

最近公開(kāi)された論文によると、ディープシークは清華大學(xué)の研究者と協(xié)力し、「生成的報(bào)酬モデリング(GRM)」と「自己原則評(píng)価調(diào)整」という技術(shù)を組み合わせた手法を開(kāi)発しました。このアプローチにより、LLMが一般的な質(zhì)問(wèn)に対して、より正確かつ迅速に回答できるようになることを目指しています。

研究者らは、この手法を採(cǎi)用したディープシーク-GRMモデルが既存の手法を上回り、強(qiáng)力な公開(kāi)報(bào)酬モデルを活用することで「競(jìng)爭(zhēng)力のあるパフォーマンスを発揮した」と報(bào)告しています。報(bào)酬モデリングは、LLMを人間の好みに適合させるためのプロセスです。

ディープシークはGRMモデルをオープンソース化する意向を示していますが、具體的な公開(kāi)時(shí)期については明らかにしていません。

一方で、ディープシークの基盤モデル「V3」および推論モデル「R1」が世界的に注目を集める中、同社の次の展開(kāi)に関する臆測(cè)が飛び交っています。海外メディアは、ディープシーク-R2が間もなく公開(kāi)される見(jiàn)込みと報(bào)じました。ディープシーク-R1は、コストパフォーマンスに優(yōu)れた性能を持ち、既存のトップモデルと肩を並べる実力を示したことで、世界のテクノロジー業(yè)界に衝撃を與えました。

しかし、ディープシークはR2の発表については沈黙を守っています。

浙江省杭州市に本社を置く同社は先月、V3モデルを「ディープシーク-V3-0324」にアップグレードし、推論能力の強(qiáng)化、フロントエンドウェブ開(kāi)発の最適化、そして中國(guó)語(yǔ)の文章生成能力の向上を?qū)g現(xiàn)したと発表しました。その次なる一手に、世界中の関心が集まっています。(提供/CRI

※本記事はニュース提供社の記事であり、RecordChinaの立場(chǎng)を代表するものではありません。すべてのコンテンツの著作権は、ニュース提供社に帰屬します。

この記事のコメントを見(jiàn)る

noteに華流エンタメ情報(bào)を配信中!詳しくはこちら

ピックアップ



   

we`re

RecordChina

お問(wèn)い合わせ

Record China?記事へのご意見(jiàn)?お問(wèn)い合わせはこちら

お問(wèn)い合わせ

業(yè)務(wù)提攜

Record Chinaへの業(yè)務(wù)提攜に関するお問(wèn)い合わせはこちら

業(yè)務(wù)提攜