世界快讯:实测得分超ChatGPT！百度文心大模型3.5版内测应用_产经时报网

(资料图片仅供参考)

6月20日消息，据内部人士透露，百度文心大模型3.5版本已内测可用。早在5月末中关村论坛上，百度创始人、董事长兼CEO李彦宏透露，百度大模型产品“文心一言”的“母本”将迎来3.5版本，距今时隔不到一个月。

最新版本文心大模型达到了怎样的实力？在公开测试集上进行的基础模型少样本（Few-Shot）评测显示，文心大模型3.5(ERNIE 3.5)在多个测试集的得分已超过ChatGPT。

三大评测基准综合评估

上万道考题“统考”主流大模型

为验证主流大模型的各项综合能力，评测在AGIEval、C-Eval和MMLU三个权威评测基准上进行综合评估。

AGIEval评测基准是微软研究院发布的、专门用于评估模型在“以人为本”的标准化考试中表现水平的测试集。该基准选取20种面向普通人类考生的官方、公开、高标准的资格考试，包括普通大学入学考试（如中国的高考和美国的SAT考试）、司法考试、数学竞赛、律师资格考试、国家公务员考试以及美国的GRE、GMAT等。

C-Eval评测基准是由上海交通大学、清华大学以及爱丁堡大学联合创制和发布的中文基础模型评测集。它包含13948个多项选择题、涵盖52个不同的学科，设置了四个难度级别，是面向中文语言模型的综合考试评测集。

MMLU是伯克利大学、哥伦比亚大学、伊利诺伊大学厄巴纳-香槟分校和芝加哥大学联合发布的一种大规模多任务语言理解的基准测试，用于衡量模型的英文跨学科专业能力。该测试包含57个科目，涵盖STEM、人文、社会科学等。

除了文心大模型3.5，评测的模型还有ChatGPT、GPT-4、ChatGLM、LLaMa系列大模型。评测可以看出大模型在能力上的优劣，同时对模型的迭代发展也有着很强的指导作用。

评测结果：

文心大模型3.5中文能力超GPT-4，综合能力超ChatGPT

在AGIEval、C-Eval等中英文权威测试集和MMLU英文权威测试集中，国产文心大模型3.5取得了超过ChatGPT和LLaMa、ChatGLM等其他大模型的分数表现，在中文评测项中超越了GPT-4。

推荐内容

世界快讯:实测得分超ChatGPT！百度文心大模型3.5版内测应用

2023-06-20
世界热门:俄外交部：黑海港口农产品外运协议将于7月18日结束

2023-06-20
世界短讯！民生领域反垄断执法专项行动推进座谈会在云南昆明举行

2023-06-20
“土拍常客”唱主角北京7宗宅地揽金189亿元全球资讯

2023-06-20
荔升级，买比萨免送费！

2023-06-20
外省人眼中的广西人_全球即时

2023-06-20
《广州市燃气用户供气卡》升级啦！

2023-06-20
天天快报!黄埔区率先探索药品流通数字化监管模式

2023-06-20
今热点：山河智能两款新能源旋挖钻机下线交付

2023-06-20
最具挑战的125个科学难题之一，将被破解！|全球热头条

2023-06-20
多金属氧簇领域研究获重要进展当前最新

2023-06-20
第六届全国定量遥感学术论坛在成都举行-环球快资讯

2023-06-20
当前观点：《2022年北海区海洋灾害公报》发布

2023-06-20
环球聚焦：多地公积金贷款额度提升购房需求有望进一步释放

2023-06-20
端午假期天气预报来了：前雨后晴气温起伏较大焦点热闻

2023-06-20
当前观察：【推动黄河流域生态保护和高质量发展】瓜果成熟季农民采收忙

2023-06-20
浙商银行配股缴款已进入第三天，错过缴款预计将除权损失6%_天天热闻

2023-06-20
中考第二天广州继续晴雨相间，端午假期有强对流天气世界今日报

2023-06-20
专家点评2023年广州中考物理化学试题

2023-06-20
快资讯丨广州抽检粽子 100%合格

2023-06-20
200场招聘！广州开展“百日千万招聘专项行动”-环球观焦点

2023-06-20
洛溪村一出租屋发现3具尸体，番禺警方通报

2023-06-20
《中国独角兽企业研究报告2023》发布|即时焦点

2023-06-20
《中国潜在独角兽企业研究报告2023》发布-世界最新

2023-06-20
夏玉米栽培技术入选农业农村部主推技术_天天视讯

2023-06-20
天天播报:猴痘病毒诊断试剂及中和抗体研发领域获新进展

2023-06-20
云南省科技厅公开征集2023年产学研合作需求

2023-06-20
通房开、北投置业分别拿下通州1宗地块总成交价40.2亿

2023-06-20
挪威政府计划向深海采矿开放部分北极水域瞄准绿色转型关键金属_世界播资讯

2023-06-20
【原油早报】近期重点关注盘面放量

2023-06-20
雷军武大致辞：28岁做金山CEO纯属意外

2023-06-20
国内首个高速公路水下互通立交主体成形深中通道东人工岛主体结构完工

2023-06-20
我国首单LNG储罐空间代储业务竞价交易成交

2023-06-20
江西出台制造业数字化转型实施方案_天天新消息

2023-06-20
雀巢婴儿营养电商京东媒介投放方案（完整版62页，建议收藏）

2023-06-20
我国已沦为美国第4大贸易伙伴，前3名都是谁？这意味着什么？天天播资讯

2023-06-20
【环球快播报】工人下班后“搬走”11吨钢材，黄埔警方迅速斩断盗销全链条

2023-06-20
名单已确定！广州电动自行车通行管理措施听证会将于7月10日召开全球观速讯

2023-06-20
青少年科技素养水平测试项目启动会召开-环球快消息

2023-06-20
中国学者绘制线虫禁食及过饱条件下精准氧化还原图谱关注

2023-06-20
港中大研究指全球小肠癌发病率与GDP有关

2023-06-20
蛋白质酰基化修饰与生物合成代谢研究再获新进展天天热头条

2023-06-20
【焦点热闻】华东理工大学成立卓越工程师学院

2023-06-20
临康广高速公路广通隧道全线贯通完善甘肃中西部路网功能和结构

2023-06-20
2023年端午小长假陕西铁路预计发送旅客225万人次

2023-06-20
每日快讯!端午档新片预售总票房破5000万：王宝强新片《八角笼中》跻身TOP3

2023-06-20
谁是新能源下一个未来 CTC电池底盘一体化？换电技术？滑板底盘？

2023-06-20
当前观点：国内首个高速公路水下互通立交主体成形

2023-06-20
国家网信办发布深度合成服务算法备案清单，阿里腾讯百度科大讯飞等在列

2023-06-20
刀剑封魔录上古传说攻略超详细（刀剑封魔录上古传说完美流程攻略）

2023-06-20
中小企业数字化转型城市试点工作将开展，中央财政对试点城市给予定额奖励

2023-06-20
“皇后之玺”数藏侵权？问题没那么简单！环球热点

2023-06-20
端午假期，去华南植物园体验“探险家”的乐趣

2023-06-20
广州边检：端午假期，这些口岸出入境客流预计增幅明显→_全球观热点

2023-06-20
天天热推荐：端午出行预测：明天中心城区出行高峰提前至16时前后

2023-06-20
每日短讯：中考期间，11个考点周边20个公交站点60余条公交线路临时调整

2023-06-20
一文掌握，这份端午假期交通“贴士”请收好

2023-06-20
基金委化学部召开国家杰青科学基金项目评审会议

2023-06-20
即时焦点：重庆市公示自然科学基金专项拟立项清单

2023-06-20
μ介子地下导航首测成功

2023-06-20
大宗交易：通富微电成交9440万元，折价3.99%（06-20）

2023-06-20
世界球精选！李世民儿子李恪身份十分特殊

2023-06-20
每日关注!正青春｜冉景丞：奔跑吧，冉跑跑

2023-06-20
【热闻】央行：一季度人民币跨境支付系统处理业务137.20万笔增长62.50%

2023-06-20
市场监管总局：大力支持老旧电梯更新改造

2023-06-20
收评：两市震荡整理沪指跌0.47% 机器人概念与军工股涨幅靠前

2023-06-20
观夏和瑞幸的粉丝吵起来了！到底谁在蹭“昆仑煮雪”的热度？|世界热推荐

2023-06-20
环球资讯：康冠携众多科技产品亮相InfoComm

2023-06-20
首届中国（佳木斯）冷水鱼烹饪大赛圆满落幕

2023-06-20
挂墙电视高度是多少（挂墙电视安装的高度多少合适）全球快报

2023-06-20
皮肤美白的方法（最快速最有效的皮肤美白方法）_世界播报

2023-06-20
黑柳彻子简介-黑柳彻子

2023-06-20
【焦点热闻】蹭热度+价格战库迪“烘焦”低价咖啡

2023-06-20
潍坊银行发放山东省首笔“植物新品种权”质押贷款

2023-06-20
焦点简讯:今年前5月销售额同比增长8.4倍，广州白云机场口岸免税业务火爆

2023-06-20
端午假期通关请注意！广州白云机场口岸将迎出入境客流“小高峰”|环球资讯

2023-06-20
关注：广州：多元研讨关爱精神困境家庭

2023-06-20
十年寒窗苦读填志愿却独缺证明，荔湾警方加急办证助学子圆梦

2023-06-20
研究发现，点燃燃气灶会增加与白血病有关的室内化学物质含量

2023-06-20
传欧盟将对Adobe(ADBE.US)收购Figma展开正式调查

2023-06-20
女白领坚持“补身体”，医生检查后吓一跳：密密麻麻全是

2023-06-20
古诗表达父爱句子有哪些关于“父爱”的古诗名句有哪些?_微动态

2023-06-20
鲜活饮品突击分红4.38亿，再募4.5亿被指圈钱

2023-06-20
“善变”的美图继续“蹭”AI 一口气推出7款新品_今日热讯

2023-06-20
环球微动态丨国家网信办发布境内深度合成服务算法备案信息百度、腾讯等国内互联网大厂均在列

2023-06-20
最高人民检察院依法对范一飞决定逮捕_资讯

2023-06-20
通讯！中油工程（600339）6月20日主力资金净卖出2055.66万元

2023-06-20
【速看料】阻力区域巩固后再突破！

2023-06-20
每体：德科将不再是拉菲尼亚的经纪人，巴萨计划7月正式让其上任-世界热点评

2023-06-20
【世界新要闻】佟大为吃水煮菜显老引争议，我看到一种“病态现象”在娱乐圈蔓延

2023-06-20
【热闻】沿途俱是风景！2022年“十大最美农村路”，哪条最让你心动？

2023-06-20
利洁时的衰退，从失去一个好CEO开始实时

2023-06-20
老铁打底、明星着色，快手娱乐打开新思路

2023-06-20
环球速讯：千亿公牛的新能源生意，能否成为下一个插排神话？

2023-06-20
长城汽车：拖车拉泰山，大头在后边热资讯

2023-06-20
每日速递：这块屏，藏着荣耀的野心

2023-06-20
当前速递！南海海洋所举办海洋地球电磁探测研讨会

2023-06-20
研究揭示南海西北陆缘孤立海底峡谷系统形成机理

2023-06-20
环球最资讯丨校长说丨莫做“光想青年”“略懂先生”“坐等过客”

2023-06-20
喜马拉雅冰川或将消融80%，影响20亿人每日快讯

2023-06-20