您現在的位置是:百科 >>正文
挑战高考数学完胜!WhatsApp%E3%80%90+86%2015855158769%E3%80%91little%20mermaid%20bubble%20tea%20set商汤日日新多模态大模型权威评测第一
百科872人已圍觀
簡介剛剛,商湯科技日日新SenseNova多模態大模型,在權威綜合評測權威平臺OpenCompass的多模態評測中取得榜單第一。OpenCompass多模態大模型評測排名商湯日日新平均得分達到77.4,領 ...
刚刚,挑战商汤科技日日新SenseNova多模态大模型,高考在权威综合评测权威平台OpenCompass的数学商汤WhatsApp%E3%80%90+86%2015855158769%E3%80%91little%20mermaid%20bubble%20tea%20set多模态评测中取得榜单第一。?
OpenCompass多模态大模型评测排名
商汤日日新平均得分达到77.4,领先GPT-4o、新多型权Claude 3.5 Sonnet以及国内所有不同尺寸的模态开源和闭源模型。尤其在涵盖算术、大模统计、测第代数、挑战几何、高考数值常识、数学商汤科学和逻辑的完胜威评WhatsApp%E3%80%90+86%2015855158769%E3%80%91little%20mermaid%20bubble%20tea%20set权威数据集MathVista维度上,取得78.4?分的日日最高分,展现了领先的新多型权“数理”能力。
?
OpenCompass 多模态评测包含八个核心数据集,从多种视角客观量化多模态大模型的能力。此次评测中,商汤日日新在几乎所有维度上都达到或超过GPT-4o水平,其中四个维度上(MMStar、MathVista、OCRBench、MMVet)排名全球第一。
?OpenCompass大模型開放評測體系是上海人工智能實驗室推出的,擁有完整開源可復現的評測框架,定期發布對各類大模型的評測成績和排名。體系覆蓋了語言與理解、常識與邏輯推理、數學計算與應用、多編程語言代碼能力、智能體、創作與對話等多個方面,是對大模型真實能力各個維度的全面診斷。
小试牛刀,商汤多模态进阶
作为计算机视觉领域的先行者和领军企业,早在几年前,商汤就确定了多模态大模型的研究方向,并在研发中,融合积累的领先算法、丰富数据和场景认知建立起核心优势。
2023年4月,商汤率先发布了行业领先的多模态大模型;
2024年2月,基于商汤日日新4.0的多模态大模型,在当时权威评测基准测试集MME Benchmark上位列第一,综合得分达2199.5(超过GPT-4V的1926.57),并应用到智能驾驶、智能车舱、电力行业等多个场景;

2024?年7?月,商湯發布國內首個交互體驗上對標GPT-4o的大模型——日日新?5o,實現無延時的實時流式交互。
全新阶段,跨模态深度融合
今年三季度以来,商汤已跨越初期探索,进入了多模态大模型的研发新阶段——实现跨模态深度融合。以此目标,商汤打造了全新原生多模态大模型——日日新SenseNova多模态大模型。
跨模态深度融合指能够跨越不同模态(自然语言、代码、语音、图像、医疗影像、视频等)之间的鸿沟,充分利用不同模态的信息,通过跨模态逆渲染、多模态思维链等技术创新,实现数据之间的集成和交互。由此,模型的感知和理解能力将得到极大增强,并支持多模态融合推理的实现。
跨模态融合有多种方法。例如,通过融合预训练以及后训练技术,商汤日日新多模态大模型大幅增强了数理逻辑和推理能力。
评测中,当我们从“五年高考,三年模拟”里随机抽取几道高考数学题,日日新多模态大模型都可以轻松应对。
提问:这道选择题要怎么做?
?
?
商湯日日新輸出結果,并給出詳細解題過程:?
?
提问:这道题要怎么解?请告诉我详细的思路
?
商湯日日新輸出結果:?
?
商汤日日新再次输出正确结果。
数学回答满分,再来看看物理。

商湯日日新輸出結果:?
?
物理题也答对啦~
此外,通过多模态融合并对模型进行定向优化,商汤日日新多模态大模型还大幅提升了对统计图表和多模态文档的理解能力。
评测中,当难度提升,让我们看看结果如何。
提问:使用下表中的数据,计算2011年每股FCFE的金额。

商汤日日新输出推理结果:
?
商汤日日新成功输出推理结果,效果令人惊叹。
随着融合模态有效提升AI大模型性能,多模态融合未来可广泛应用于诸多场景,例如在线上教育、语音客服等场景,结合语音和自然语言来提升交互体验;在自动驾驶场景,融合视觉及多种模态数据,来提升感知精度和决策能力等。
数理还只是起点。目前,日日新SenseNova多模态大模型已经可以通过API调用,即将开放普通用户体验。
Tags:
轉載:歡迎各位朋友分享到網絡,但轉載請說明文章出處“呼來喝去網”。http://www.oralife.cn/news/76a390796016.html
相關文章
OPPO首发量产40W无线闪充 充电时会有辐射吗?
百科4月13日,OPPO在线线上发布了Ace2手机,相比上一代产品来说,这已经是他们一个新的独立的产品线,对于这样的定位,发布会结束后,OPPO的Ace2的产品经理吴荻接受群访时表示,Ace独立有两个原因 ...
【百科】
閱讀更多《黑暗之秋》5月登陆Steam 英雄角色扮演城市建造
百科SquareNite开发,一款英雄主题角色扮演城市建造新游《黑暗之秋》已经登陆Steam,预定5月8日正式推出,本作支持中文。《黑暗之秋》:Steam地址《黑暗之秋》是一款以英雄为重点的角色扮演城市建 ...
【百科】
閱讀更多斯基拉:曼城正在努力与瓜迪奥拉续约至2027年
百科10月22日讯 据知名转会记者斯基拉报道,曼城正在努力同瓜迪奥拉延长续约至2027年。瓜迪奥拉自2016年便开始执教曼城,已帮助球队获得包括欧冠冠军、6次英超冠军在内的多项荣誉。 ...
【百科】
閱讀更多
熱門文章
最新文章
友情鏈接
- 中国中小企业服务网正式上线
- 全国首条量子科普研学游线路在合肥发布
- 中国中小企业服务网正式上线
- 上半年跨境电商进出口1.22万亿元
- 繁昌窑国家考古遗址公园博物馆项目开工
- 第四届芜湖铁画创意设计大赛拉开帷幕
- 安徽本土“生长”的戏曲泗州戏传唱两百年
- 全国高等美术院校附中校藏速写巡回展
- 《最美滁州我家乡》斩获“词曲中国”大赛银奖
- 科技题材美术作品展在中国美术馆开展
- 地区经济运行总体平稳
- 陕西演艺创排的音乐偶剧《谁当冠军》将来肥演出
- 话剧《宝岛一村》专属版在肥深情上演
- 精美文物鎏金银壶在上海亮相,承载古文明辉煌
- 铁路货运市场量质齐升
- 方寸之间感悟文化之美
- 铁路暑运已发送旅客4.23亿人次
- 铜陵市青年歌手大赛暨长三角青年歌手邀请赛启幕
- 宿州市第三届民间艺术精品展在市博物馆开展
- 近60件湖南永州摩崖石刻拓片将在国博展出
- 这张清末“官契”里,“藏”着一位历史名人
- 新青年如何以美术创作回应时代
- 黄山徽州区举办首届“徽声青语”青年宣讲活动
- 方寸之间感悟文化之美
- 这张清末“官契”里,“藏”着一位历史名人
- 南京城墙博物馆试开放运营 展示2000多件(套)精品文物
- 上半年跨境电商进出口1.22万亿元
- 二季度末普惠型小微企业贷款余额同比增17.1%
- 66件辽博馆藏经典立轴山水画带人们感受生命的和谐畅达
- 五大剧种吟秋颂,乡土舞台绘振兴
- 安徽“百大镇馆之宝”评选浏览量破千万
- 铜陵白姜:非遗传承融匠艺 姜香萦绕满庭芳
- 全国人大代表李群:办人民满意的博物馆
- 长三角C9联盟推进多个共建项目
- “江淮第一水圩”刘大圩古韵犹存
- 庐剧“十一”将亮相中央广播电视总台
- 五大剧种吟秋颂,乡土舞台绘振兴
- 铜陵白姜:非遗传承融匠艺 姜香萦绕满庭芳
- 这张清末“官契”里,“藏”着一位历史名人
- 芜湖市孙村镇中分村非遗展示馆建成开放
- 联手抗疫,习主席打了哪些“国际长途”?
- 最健康的减肥计划由“热量赤字”来降低体重
- 初中生遭遇抢劫反抗被砍断四根手指
- 塔吊吊臂垮塌砸穿4间平房
- 黔西南州G246业主办举办首次工程项目施工现场整改会议
- 动手高玩展示自带屏幕魔改PS5 仅重2.8Kg手提可走
- 新一代中国操作系统!银河麒麟V11正式发布 兼容国产主流CPU、GPU
- 一个月瘦20斤或30斤的方法请慎重
- 莆田仙游鲤南一安置房电梯故障 两名老人被困
- 懒人瘦肚子的最快方法一个动作五分钟瘦10斤