智源最新评测:豆包视觉理解模型排名全球第二
12月19日,智源最新智源研究院发布最新一期大模型综合及专项评测结果。评测排名在覆盖国内外100余个开源和商业闭源大模型的豆包第评测中,豆包通用模型pro获得大语言模型主观评测最高分;在多模态模型评测中,视觉豆包视觉理解模型排名视觉语言模型第二,理解成绩仅次于GPT-4o;豆包文生图模型、模型豆包视频生成模型(即梦P2.0 pro)也分别在相应测试中获得全球第二。全球
据智源研究院介绍,智源最新大模型评测平台FlagEval联合了全国10余家高校和机构合作共建。评测排名此次公布的豆包第榜单中,大语言模型主观评测重点考察的视觉是模型的中文能力,多模态模型评测榜单中,理解视觉语言模型主要考察的模型是模型在图文理解、长尾视觉知识、全球文字识别以及复杂图文数据分析能力。智源最新FlagEval大模型角斗场则是向用户开放的模型对战评测服务,反映了用户对模型的偏好。
在大语言模型主观评测中,豆包通用模型pro的知识运用和推理能力均获得最高分,简单理解、数学能力、安全等项目也排名前三,最终综合成绩排名第一。在FlagEval大模型角斗场榜单中,基于模型对战的用户投票结果,豆包通用模型pro得分排名第二,仅次于OpenAI的o1-mini。
在多模态模型评测榜单中,GPT-4o在视觉语言模型中排名第一,豆包视觉理解模型获第二。在中文的通用知识、文字识别中,豆包表现突出,相比国外模型有较大优势。在文生图测试中,混元和豆包排名前两位;在文生视频测试中,国产模型更是优势显著,可灵1.5高品质版、即梦P2.0 pro、爱诗科技PixVerse v3和海螺AI排名前列。
据悉,豆包视觉理解模型在不久前的火山引擎Force大会上首次发布,现已对企业客户开放使用。火山引擎方面表示,豆包大模型通过算法、工程、软硬件结合的技术创新,大幅优化使用成本,让每一家企业都能用得起,推动AI技术普惠和应用发展。
相关文章:
相关推荐:
- [流言板]图片报独家:拜仁有意西班牙国脚威廉姆斯,解约金6000万欧
- 《魔农传记 FARMAGIA》预告片介绍游戏登场角色
- 穆斯卡特:天气、身体和情绪可能对我们是挑战,保持我们的打法
- 达洛特:不知阿莫林是否会执教曼联,我们看到的消息和你们一样
- [流言板]起飞!希罗突破吸引包夹,助攻篮下韦尔空接暴扣得手
- 传闻:《刺客信条:黑旗》重制版原定2025年11月推出 已被延期
- 梅西登顶!南美射手榜:梅西戴帽6球居首,努涅斯两场球荒5球第2
- Windows 11 24H2更新开始推送 引入新的AI功能
- 特斯拉发布年度视频:正加速无人驾驶出租车、人形机器人的发展
- 还能带三场!阿莫林11日上任,范尼带队周末战切尔西,10日战蓝狐
- 哈哈,往死整hym和崔71啊,给人家去下家的口啊,饭圈粉是真tm的狠!
- 罗德里戈本场数据:1球1助,3次射门2次射正,4次成功过人
- [流言板]泰山压顶!马绍尔突破送出助攻,加福德隔扣祖巴茨打成2+1
- 续两月销量过万!智己汽车累计交付量突破100000大关
- 4aM阵容,longz+bobo+godv+xxlu,zpy替补,hs出走pero实训走过场基本确定要走。
- 《小丑牌》移动版击败《我的世界》登付费应用榜首
- 尤文vs威尼斯首发:麦肯尼出战,DV9、伊尔迪兹、维阿先发
- [流言板]抢疯了!火箭一回合抢下四次前场篮板,目前50
- 罗马诺:在代表一线队首秀后,17岁亚涅斯与皇马完成续约
- 89元起!小米推出米家面板灯系列:自带人在、光线传感器