智谱 GLM-4-Plus 在中文大模型基准测评中位居国内首位
11 月 8 日, 中文大模型测评基准 SuperCLUE 发布《中文大模型基准测评 2024 年 10 月报告》, 智谱 GLM-4-Plus 凭借出色的能力表现, 在 43 个国内外大模型中位居第一梯队, 总得分位列国内大模型首位。

SuperCLUE 中文大模型基准测评旨在通过多维度综合性测评, 对国内外大模型的发展趋势和综合效果进行实时跟踪。本次 10 月报告聚焦通用能力测评, 选取了国内外有代表性的 43 个大模型, 采用多维度、多层次的综合性测评方案进行测评。测评结果显示,o1-preview 的推出进一步拉大了与其他模型的差距, 国内大模型第一梯队竞争激烈, 持续迭代表现不俗。其中国内闭源模型 GLM-4-Plus、SenseChat 5.5、AndesGPT-2.0 表现优异, 与 ChatGPT-4o-latest 相距 2 分以内。基于大模型在基础能力和应用能力的表现, 共有 23 个国内大模型入选 SuperCLUE 模型象限。智谱 GLM-4-Plus 位居【卓越领导者】, 代表模型在基础和场景应用上处于领先位置, 引领国内大模型发展。
11 月 14 日, 在司南 OpenCompass 公布的大语言模型对战榜单 Compass Arena 中, 智谱 GLM-4-Plus 的竞技场评级分数位列榜首, 领先 GPT-4o-20240513。
Compass Arena 大语言模型对战榜单致力于构建一个完全基于用户真实反馈的公正、开放、透明的榜单。用户根据与大模型的真实对话体验进行投票, 依据投票结果, 使用 Elo 评分系统对大模型进行排名。
据悉,GLM-4-Plus 是智谱全自研 GLM 大模型的最新版本, 它标志着智谱继续瞄准通用人工智能, 持续推进大模型技术的独立自主创新。作为智谱最新旗舰模型, 在语言理解、逻辑推理、指令遵循、长文本输出方面都有较大突破。GLM-4-Plus 成为智谱全模型家族坚实的能力底座, 在代码计算、数据分析、图像 / 视频特征识别等领域均实现性能的大幅提升, 及成本的大幅下降, 目前已上线智谱开放平台 bigmodel.cn。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
相关文章
- 属猴人旺财指南:佩戴这些吉祥物,提升你的财富运势
- RODE 罗德麦克风新品 Wireless Micro 口袋无线领夹麦克风上架京东,995 元起售
- 献血 100 次才能免费吃自助餐?滑雪场对 65 岁以上老人免门票滑雪,你怎么看?
- 2024 中国文学盛典·骏马奖之夜在广西南宁启幕,展现少数民族文学丰富收获
- 樊振东、马龙、陈梦退出 WTT 福冈总决赛,教练组回应背后原因
- 学生指责学校有钱建草堂没钱修宿舍,云南富宁成立调查组
- 【博物馆里看宝藏】探寻湖北省孝感市云梦县博物馆的历史变迁
- 民主党参议员要求五角大楼和执法机构调查马斯克与俄官员通话报道
- 属龙人必备!这些吉祥饰品助你提升财运和整体运气
- 2024 年蓉品出川成都特色食品消费券活动即将开启,快来领取
猜你喜欢
-
2025 年 5 月 20 日晚上海大剧院江禹杉羽管键琴独奏音乐会精彩上演
2025年5月20日夜晚,上海大剧院的中剧场内,一场名为“谐调之琴·巴赫《平均律键盘曲集Ⅱ》”的江禹杉羽管键琴独奏音乐会正式拉开帷幕,吸引了众多古典音乐爱好者的...
-
长三角区域无线电发射设备管理普法宣传活动在苏锡举办
11月14日至15日,以“智慧测试筑基石,联合管理护远航”为主题的长三角区域无线电发射设备管理普法宣传活动在江苏苏州、无锡圆满举办。 活动中,市经济信息化委执法稽...
-
香港演员谢志华去世,曾参演少林足球等 20 部电影
25日,据港媒报道,香港演员谢志华因心肌梗塞于10月22日去世,终年64岁。 谢志华因出演周星驰电影《少林足球》中酒吧老板一角而被观众熟知。 他在片中和周星驰、黄一...
-
徐汇滨江的龙美术馆(西岸馆):工业风与艺术的完美融合
在徐汇滨江,一座工业风的建筑,静静伫立在龙腾大道3398号,清水混凝土的材质,低调但充满了力量的美感,这就是龙美术馆(西岸馆)。 这里曾经是北票码头,历经风雨,见...
-
第 14 号台风普拉桑登陆浙江岱山,将影响浙北地区,上海发布黄浦江高潮位黄色预警
浙江省气象服务中心最新消息,今年第14号台风“普拉桑”已于19日18时50分在浙江岱山登陆。登陆时中心附近最大风力10级(25米/秒),中心最低气压为990百帕。...

