拡大
ディープシークの次世代モデル発表が期待される中、同社は大規(guī)模言語(yǔ)モデルの推論能力を向上させる新たな手法を発表しました。
中國(guó)の人工知能(AI)スタートアップ企業(yè)であるディープシーク(DeepSeek)の次世代モデル発表が期待される中、同社は大規(guī)模言語(yǔ)モデル(LLM)の推論能力を向上させる新たな手法を発表しました。
最近公開(kāi)された論文によると、ディープシークは清華大學(xué)の研究者と協(xié)力し、「生成的報(bào)酬モデリング(GRM)」と「自己原則評(píng)価調(diào)整」という技術(shù)を組み合わせた手法を開(kāi)発しました。このアプローチにより、LLMが一般的な質(zhì)問(wèn)に対して、より正確かつ迅速に回答できるようになることを目指しています。
研究者らは、この手法を採(cǎi)用したディープシーク-GRMモデルが既存の手法を上回り、強(qiáng)力な公開(kāi)報(bào)酬モデルを活用することで「競(jìng)爭(zhēng)力のあるパフォーマンスを発揮した」と報(bào)告しています。報(bào)酬モデリングは、LLMを人間の好みに適合させるためのプロセスです。
ディープシークはGRMモデルをオープンソース化する意向を示していますが、具體的な公開(kāi)時(shí)期については明らかにしていません。
一方で、ディープシークの基盤モデル「V3」および推論モデル「R1」が世界的に注目を集める中、同社の次の展開(kāi)に関する臆測(cè)が飛び交っています。海外メディアは、ディープシーク-R2が間もなく公開(kāi)される見(jiàn)込みと報(bào)じました。ディープシーク-R1は、コストパフォーマンスに優(yōu)れた性能を持ち、既存のトップモデルと肩を並べる実力を示したことで、世界のテクノロジー業(yè)界に衝撃を與えました。
しかし、ディープシークはR2の発表については沈黙を守っています。
浙江省杭州市に本社を置く同社は先月、V3モデルを「ディープシーク-V3-0324」にアップグレードし、推論能力の強(qiáng)化、フロントエンドウェブ開(kāi)発の最適化、そして中國(guó)語(yǔ)の文章生成能力の向上を?qū)g現(xiàn)したと発表しました。その次なる一手に、世界中の関心が集まっています。(提供/CRI)
Record China
2025/4/8
Record China
2025/4/8
Record China
2025/4/7
Record ASEAN
2025/4/8
Record China
2025/4/7
Record China
2025/4/7
ピックアップ
we`re
RecordChina
この記事のコメントを見(jiàn)る