讯飞星火在一项评测中获评“最聪明”国产大模型_产经时报网

(资料图)

8月18日，在《麻省理工科技评论》中国（MIT TR China）发布的一项大模型评测报告中，讯飞星火认知大模型V2.0在6个大类中得分率排名第一，以 81.5 分（百分制计）的成绩在本次评测中获评为“最聪明”的国产大模型。

据介绍，该评测使用的测试集包含600道题目，覆盖了语言专项、数学专项、理科综合、文科综合、逻辑思维、编程能力、综合知识、安全性共 8 个一级大类，126 个二级分类，290 个三级标签，并针对问题的丰富性和多样性做了优化，力图从研发和商业化能力、外界态度以及发展趋势等维度全方位检测大模型的能力。

在题目类型上，为了兼顾定量、定性的评价与测试，MIT TR China在评测中设置了“单选”、“多选”、“填空”、“简答”4个题型，分别有 145 道、138 道、136 道和 181 道。其中，语言专项评测中包含对话理解、多语种、讽刺、古诗词理解、文本生成、要点总结、情感分析、语义判断等 61 个二级分类，题型则以主观题简答为主。

值得一提的是，大模型评测体系使用盲评方式，以客观评估国产大模型的“聪明”程度。

结果显示，讯飞星火在主客观题型评测中均有良好表现：主观简答题中讯飞星火凭借 83.98% 的得分率位居第一；而在客观题上，讯飞星火以 75.7% 的得分率排名第一。其中，讯飞星火在编程能力、理科综合、逻辑思维、数学专项、语言专项和综合知识这 6 个一级大类中表现十分出色，尤其是在代码生成、数学能力、理科与逻辑等方面优势明显，是本次评测中“最聪明的理科生”。

在刚刚过去的8月15日，讯飞星火认知大模型V2.0如期发布，进一步突破代码能力和多模态能力；技术获得重大突破的同时，搭载讯飞星火V2.0核心能力的应用和产品也越来越丰富。此外，科大讯飞还和华为联合发布星火一体机，宣称要“让每一家企业都有机会构建专属大模型”。

推荐内容

讯飞星火在一项评测中获评“最聪明”国产大模型

2023-08-18
人民银行分支机构今日举行挂牌仪式，恢复省分行制度

2023-08-18
戒台寺景区：8月19日起有序恢复开放

2023-08-18
浙江东日(600113)每日收评(08-18)

2023-08-18
卢卡申科被问“瓦格纳事件”是表演吗：只有“疯子”才会说这是表演具体是什么情况?

2023-08-18
农业农村部：全国农产品批发市场猪肉平均价格比昨天上升0.7%

2023-08-18
整治低价竞争！上海多部门联合约谈20家网约车平台、打车平台

2023-08-18
3年超5亿学术推广费，1.3亿元转贷资金，被行政处罚的知原药业冲击上市

2023-08-18
水上玩具今夏增长6倍淘宝新手如何抓准“玩水经济”风口？

2023-08-18
外汇天眼：网络交友不可信！高富帅甜蜜的谎言背后是杀猪盘！

2023-08-18
暴风雨前的平静？比特币和以太坊波动性创历史新低！

2023-08-18
正大国际期货：挑选外盘期货公司看哪些方面？

2023-08-18
收到教育退费文件包裹？小心骗局！已有街坊被骗9万余元

2023-08-18
小心防御！今明两日广州局部有暴雨或大暴雨

2023-08-18
中国天眼发现“矮脉冲族群”

2023-08-18
Jupyter大升级：各种大模型都能连，聊天就能生成代码、错误修改

2023-08-18
清风头条丨嘉禾县：加强干部队伍建设锻造纪检监察铁军

2023-08-18
探访三亚“超级空调”：区域集中供冷降成本更环保

2023-08-18
青岛警方通报“主播编造剧本进行摆拍直播”：其账号已被平台无限期封禁

2023-08-18
超30家科创板公司董事长已提议回购自家股票

2023-08-18
气场不输凯雷德，英菲尼迪QX80 Monograph概念车亮相或换装V6混动

2023-08-18
医院回应花费66万买门牌石：合同价，符合招标采购程序

2023-08-18
国际漫评｜靠信用卡还能撑多久？

2023-08-18
国家统计局首次增加发布服务零售额数据服务消费支撑作用持续显现（锐财经）

2023-08-18
总投资1.36亿！山东烟台新建时产500吨砂石同出生产线

2023-08-18
短视频之王！矩阵系统绝世霸主现身！

2023-08-18
免费洗头、夜市摆摊……海底捞到底还有多少“奇招”？

2023-08-18
李嘉诚基金会捐款支援内地防汛赈灾李泽楷吁各界向灾区提供支持

2023-08-18
去“地铁读书吧”，2023南国书香节地铁分会场同步开启

2023-08-18
差评后遭商家索赔？法院：应容忍合理范围内的负面评价

2023-08-18
电力线路地下“安家”，白云机场三期扩建工程再提速

2023-08-18
广州市越秀区、天河区、海珠区暴雨黄色和雷雨大风黄色预警信号生效

2023-08-18
海南省科技厅公示外国专家项目形式审查结果

2023-08-18
养生馆疑致老人死亡吸氢气真能抗癌？别把氢气当“神气”

2023-08-18
海外市场需求刺激出口业务规模增长近四成天润工业上半年净利同比增61.91%

2023-08-18
洪涝灾害后电梯浸水怎么办？河北省市场监管局发布重要提示

2023-08-18
谁在京东买汽车？

2023-08-18
物流行业样本蝶变：质疑、理解、和成为

2023-08-18
大跌18.64%！价格战再起，零跑汽车胜算几何？

2023-08-18
晨光卖笔，成了差生？

2023-08-18
李彦宏，不造车了

2023-08-18
南沙区南沙街暴雨预警信号升级为红色

2023-08-18
中国专家研发针对国人肝癌预测模型

2023-08-18
2023台州七夕结婚免费登报什么时候报名？

2023-08-18
盟固利：8月17日融资买入9986.96万元，融资融券余额1.18亿元

2023-08-18
梁朝伟刘德华二十年后再合作《金手指》称“互为首选”

2023-08-18
电影《孤注一掷》被指侵权

2023-08-18
城投控股：公司具有城市历史风貌保护街区功能性开发、城中村改造、保障房建设等经验，并积极关注相关政策

2023-08-18
新股上市之宏裕包材：为消费食品领域提供彩印包装材料的国家级小巨人

2023-08-18
【酒道快评】《董香型白酒》团体标准征求意见

2023-08-18
皓天科技应收账款回款率2022大降：现金流承压，项目投资额还差5.4亿

2023-08-18
脑动极光持续亏损13亿：毛利率波动剧烈，大客户依赖明显

2023-08-18
迪阿股份上半年营收净利润大降：客户数量减少超40%，销售费用率远高同行

2023-08-18
税务总局驻广州特派办：推动湾区税收营商环境持续优化

2023-08-18
黄埔新地标封顶！沙步旧村改造项目又有新进展啦！

2023-08-18
广东省生态学会举办生态文明建设与乡村振兴论坛

2023-08-18
王河在全国节能宣传周碳中和高峰论坛上作报告

2023-08-18
广州分院与连南县召开“百千万工程”工作对接会

2023-08-18
2023年湾高赛在广州南沙启动

2023-08-18
中国天眼发现脉冲星辐射新形态——矮脉冲族群

2023-08-18
湖南日报丨安仁县开展交通宣传志愿活动

2023-08-18
揭秘诈骗套路宣传反诈知识浦发银行西安分行邀请客户观看《孤注一掷》

2023-08-18
深圳力争5年打造3个气象产业科学中心

2023-08-18
尘白禁区--风景百物--泰古通达停机坪

2023-08-18
2023年8月总票房破50亿

2023-08-18
四川内江市市中区发生4.0级地震

2023-08-18
“周一下单、周末收货” 菜鸟国际快递英国专线“升级版”来了

2023-08-18
品牌再进化，利郎破局中国男装品牌下半场

2023-08-18
“超预期”业绩下的冷思考：腾讯新的增长点在哪？

2023-08-18
昱能微讲堂丨光伏系统接地如何实现？（内附微逆三种接地方式）

2023-08-18
合肥大众汽车布局探析

2023-08-18
广州地化所科普基地获颁国家生态环境科普基地

2023-08-18
研究发现牛虻可能是登革病毒一种新的传播媒介

2023-08-18
甜玉米籽粒货架期研究获新进展

2023-08-18
《中国教育故事2023（英文版）》新书问世

2023-08-18
鼎湖山保护区开展全国生态日观鸟科普活动

2023-08-18
显微镜都会用了！这一个月让孩子们体验真实科学实验

2023-08-18
南方优品名特优产品产销对接会举行

2023-08-18
工银澳门开通 “珠海公交乘车码”服务

2023-08-18
广州举办庆“8·19”中国医师节活动

2023-08-18
中山代表队收获3金5银

2023-08-18
悠悠球怎么玩入门（悠悠球的绳子怎么绑）

2023-08-18
中国华融：华融融德共计解决2044套房产交付问题

2023-08-18
今日上市：威马农机、锴威特、宏裕包材

2023-08-18
重庆保供一线职工直面“烤”验守护“清凉”

2023-08-18
【赏析】 | 十年藏石乐融融 | “石痴”吴福洪的奇石大观

2023-08-18
“二房东”的狂欢落幕，共享办公等待救赎，昔日独角兽WeWork自曝快撑不住了

2023-08-18
义乌商人盯上民族风生意，爆卖10多万件这个，被抢断货

2023-08-18
粤西第一城，够猛！

2023-08-18
青海盐湖所在囊谦盆地油页岩的干馏实验成功获得页岩油

2023-08-18
海洋塑料每年增加4%，存续时长超预期

2023-08-18
全国太阳能光化学与光催化会议召开

2023-08-18
综述文章分析了可充电碱性锌基电池负极

2023-08-18
体心立方金属韧脆转变定量模型研究取得进展

2023-08-18
性价比炸裂！8GB DDR4内存条仅需85元

2023-08-18
国金证券：集采不改变配方颗粒行业发展逻辑

2023-08-18
新能源产业技术创新大赛新闻发布会举办

2023-08-18
8月18日生意社彩涂板基准价为7033.33元/吨

2023-08-18
去年收入翻倍，一季度15亿美元收入、5500万美元利润！SpaceX财务数据罕见曝光

2023-08-18
国泰君安：多家公司Q2业绩亮眼家电出口小幅下滑

2023-08-18