2026-03-12 21:02:19
近日,中國平安金融大模型PingAnGPT-Qwen3-32B 在行業(yè)權(quán)威大模型評測體系CNFinBench大語言模型公開榜單上綜合排名第一。本次參評模型陣容強大、競爭激烈,涵蓋DeepSeek-R1(671B)、Qwen3-235B-A22B、Kimi-K2(1000B)等開源大模型,以及 GPT-4o、Claude-Sonnet 4、Doubao-1.5-pro 等領(lǐng)先的閉源商業(yè)模型,代表當(dāng)前行業(yè)高水平。此次評測登頂也標(biāo)志著平安在金融大模型領(lǐng)域的技術(shù)能力已達(dá)到行業(yè)先進水平。

CNFinBench是由上海人工智能國家實驗室團隊聯(lián)合金融領(lǐng)域權(quán)威機構(gòu)打造的中文金融大模型綜合性評測基準(zhǔn),為當(dāng)前國內(nèi)極具權(quán)威性和行業(yè)認(rèn)可度的金融大模型能力評估平臺。本次測評中,PingAnGPT-Qwen3-32B在金融事實推理與計算、金融專業(yè)知識問答、金融合規(guī)與風(fēng)險控制等多項關(guān)鍵指標(biāo)表現(xiàn)卓越,展現(xiàn)出精準(zhǔn)的金融數(shù)值計算能力、嚴(yán)謹(jǐn)?shù)倪壿嬐评砟芰腿鹑陬I(lǐng)域知識體系的深度掌握,尤其在金融投研分析、風(fēng)險計量等場景具有重要應(yīng)用價值和安全可控優(yōu)勢。
評測方表示,此次登頂CNFinBench,體現(xiàn)了平安在金融大模型領(lǐng)域的技術(shù)實力。值得關(guān)注的是,中國平安參評的模型僅采用 32B參數(shù)規(guī)模,不足 DeepSeek-R1(671B)的5%及Kimi-K2(1000B)的 3.2%規(guī)模,卻實現(xiàn)了綜合性能上的超越,在模型效率與性能平衡上實現(xiàn)了重要技術(shù)突破。依托于"輕量高效"特性,該模型已支持產(chǎn)險車險報案、人事員服智能問數(shù)、客服實時質(zhì)檢、智能話術(shù)、集團財資費用審核等97個業(yè)務(wù)場景,并為其后續(xù)在私有化部署、場景化應(yīng)用提供了堅實基礎(chǔ)。
據(jù)悉,CNFinBench評測體系覆蓋金融專業(yè)知識問答、金融業(yè)務(wù)理解與分析、金融事實推理與計算、金融合規(guī)與風(fēng)險控制、金融內(nèi)生與應(yīng)用安全五大核心維度,全面檢驗?zāi)P驮诮鹑诖怪鳖I(lǐng)域的專業(yè)深度、業(yè)務(wù)理解力、計算準(zhǔn)確性、合規(guī)意識及安全可控性。
2025年前三季度,平安的數(shù)據(jù)庫已沉淀30萬億字節(jié)數(shù)據(jù),覆蓋近2.50億個人客戶;基于海量數(shù)據(jù)訓(xùn)練大模型,積累超3.2萬億高質(zhì)量文本語料,31萬小時帶標(biāo)注的語音語料,超75億圖片語料。以海量數(shù)據(jù)為基礎(chǔ),以科技公司服務(wù)技術(shù)開發(fā)與應(yīng)用,平安持續(xù)拓展場景應(yīng)用的深度和廣度,賦能金融業(yè)務(wù)優(yōu)體驗、控風(fēng)險、降成本、促銷售。2026年2月,國家知識產(chǎn)權(quán)出版社發(fā)布《金融科技行業(yè)2025年專利分析白皮書》與《醫(yī)療健康行業(yè)2025年專利分析白皮書》,中國平安再度攬獲2025年金融科技、醫(yī)療健康行業(yè)專利數(shù)雙榜首,并在多項核心技術(shù)與關(guān)鍵應(yīng)用場景中占據(jù)領(lǐng)先地位。
中國平安表示,通過打造領(lǐng)先AI能力,推進模型優(yōu)化迭代,深化場景化應(yīng)用落地,公司持續(xù)將技術(shù)優(yōu)勢轉(zhuǎn)化為服務(wù)價值,以高質(zhì)量的數(shù)字化金融供給,不斷滿足人民群眾對美好生活的向往,踐行"省心、省時、又省錢"的服務(wù)承諾,為金融強國建設(shè)貢獻平安力量。
(本文不構(gòu)成任何投資建議,投資者據(jù)此操作,風(fēng)險自擔(dān)。)
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP