易搜小说网

手机浏览器扫描二维码访问

sensenova-si:ai终于能看懂三维空间了(第1页)

先给你一个总览:SenseNova-SI是商汤2025年11月开源的空间智能大模型,有2B、8B两个轻量版本,在VSI、MMSI、MindCube、ViewSpatial四大权威测试里,8B版平均60.99分,把GPT-5(49.68)、Gemini 2.5 Pro(48.81)甩在身后,靠的是不堆参数堆方法,用原生多模态架构+空间专项训练,让AI真正理解三维世界,而不是只会“看图说话”。下面用大白话掰开揉碎了讲,保证你看完就懂。

一、为啥说“空间智能”是AI的命门

- AI的“老盲症”:以前的AI就是个“睁眼瞎学霸”——读书万卷、写文一流,但看三维世界一塌糊涂。比如给它一张桌子的图,它分不清哪个是正面、哪个是侧面;自动驾驶场景里,它可能把“旁边车要右转”判成“静止”,这就是行业里说的“空间认知短板”。

- 问题出在哪:传统大模型用的是“拼接式架构”,先把图片转成文字信号再解读,就像把3D电影转成2D剧本再讲给你听,中间大量空间细节全丢了,相当于让盲人靠听描述去想象魔方结构,怎么可能对。

- 为啥现在必须解决:AI要落地到自动驾驶、机器人、工业制造、3D设计这些领域,必须能跟物理世界交互,空间理解是底层能力。没有它,具身智能就是空话,机器人拿杯子会摔、自动驾驶会撞、数字人做直播动作会飘,根本没法商用。

二、SenseNova-SI到底牛在哪(数据说话)

- 核心成绩:8B版在四大空间测试中平均60.99分,比GPT-5高11+分,比同级开源模型(如Qwen3-VL-8B)高20+分;2B轻量版也照样领先不少,不是靠堆参数,是靠方法对路。

- 六大空间能力全拉满:商汤把空间智能拆成6个维度,SI模型在每个维度都有硬提升:

1. 空间测量:能算物体长宽高、距离角度,误差比GPT-5小42%,工业质检、AR测量直接能用。

2. 空间重构:给正面图能脑补侧面、背面,像搭积木一样,跨视角预测准确率比传统模型高37%,3D建模不用再拼半天。

3. 空间关系:分清“杯子在桌子上”“桌子在杯子下”,复杂场景里错误率降42%,机器人导航不迷路。

4. 视角转换:换个角度还认识同一个物体,自动驾驶里识别侧面来车更稳,不会误判。

5. 空间形变:知道物体挤压、折叠后会变成啥样,工业仿真、游戏动画制作效率翻倍。

6. 空间推理:能解决“把红色方块放蓝色方块左边,再把黄色方块放红色方块前面,黄色在蓝色的哪侧”这类问题,逻辑链比传统模型长3步以上,具身智能决策更准。

- 轻量还能打:2B、8B的参数规模,用消费级显卡(如RTX4090)就能跑,不用千亿参数的超级计算机,这才符合“工业红线”——用的成本低于创造的价值,能大规模落地。

三、技术揭秘:不堆参数,怎么实现碾压

- NEO原生多模态架构(底层革命):不是先把图片转文字再解读,而是从Transformer底层就让视觉和语言同步处理,像人的眼睛和嘴巴一起工作,不丢空间细节。关键创新有三个:

1. 原生图块嵌入:图片像素直接映射成语义词元,不压缩、不丢细节,比传统“翻译式”架构保留**90%+**空间信息。

2. 三维旋转位置编码:视觉信号用高频编码(抓细节),语言信号用低频编码(抓逻辑),两者不打架,模型能同时“看”和“想”。

3. 混合注意力机制:每层推理都让图文信息互相“盯紧”,不是各干各的,理解更连贯。

热门小说推荐
林晓的生活

林晓的生活

林晓的生活情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的网游动漫小说,林晓的生活-星语哲思-小说旗免费提供林晓的生活最新清爽干净的文字章节在线阅读和TXT下载。...

太后今天开窍了吗

太后今天开窍了吗

太后救下了被折磨的质子,朝野皆知质子与被太后亲手杀死的先帝眉眼有几分相似。有传言称,高高在上的太后娘娘拿大周的质子当了先帝的替身,千娇万宠,无所不应。后来,太后娘娘倚着宫中长长的柱子,笑的开怀又疯狂,全然不见平时半点风范,她蛊惑道:“殿下可要回去,把大周皇位拿下送给我?”对面的质子眼中带笑,黑沉又温柔:“娘娘所愿,......

[SK]冷

[SK]冷

一年生sotteaeraya本該一開始便注定幸福的,卻以折磨為開始,而最終是否能有個幸福的結尾?"原諒我好嗎?""……放了我好嗎?"o18「o18ui」...

每天抽卡超能力

每天抽卡超能力

我的名字叫做影山真桃,转生到二次元之后成为了一个超能力者。 上辈子靠运气玩抽卡游戏,这辈子用个超能力都要靠运气。 我的超能力可以称作:“超能力抽卡机”。 每天抽出一个超能力,想要不想要都会硬塞给我,抽出什么全靠运气。 有的能力相当有用,比如说可以防止迟到的[瞬间移动]、可以用来补作业的[时间暂停]、可以去参加大胃王比赛的[怎么吃都不会撑不会胖]、能听见别人在想什么的[读心]、能做出各种发光料理的[超级厨艺]…… 听起来很棒,但是当我见到了那个超能力多到数不清的二次元之神,就完全不觉得自己有什么厉害的了。 这个世界的超能力者也不少,我的堂弟还是个爆发时能毁天灭地的超能力者呢……我只是能力的种类和花样比较多罢了。 有时候抽出的能力还相当给我添麻烦,屁用都没有。 今天抽到的是[灵视],对着充满各种奇怪“生物”的世界我陷入沉默。 今天抽到了[万人迷属性],出个门就遭人“追星”式围堵的我一脸懵逼。 今天抽出来了[穿越时空],被迫穿越之后能力陷入冷却穿不回去,也没持有任何攻击能力的我,只能在高危的异世界瑟瑟发抖了。 我是真的会谢!求求了,欧皇在上,明天给我个攻击能力,不然就让我抽出[召唤术]吧!我有很多外挂天花板朋友可以召唤的! —— *日常向沙雕爽文,偶尔开个副本去冒险、救救人 *正文第三人称,cp未定 *女主苏苏苏,天然渣属性,单箭头多。抽卡是欧洲人,能力原因时强时沙雕...

寻踪天官墓

寻踪天官墓

少年读书郎意外踏入阴阳师的神秘领域,跟随师父历经重重艰难险阻,小命在无数次的冒险中摇摇欲坠。从稚嫩孩童成长为沉稳中年,从探索天官古墓到勇闯葫芦岛险境。目睹了江湖的恩怨情仇,品味了人间的酸甜苦辣,金盆洗手,回归自然生活!......

都市之绿帽兵王

都市之绿帽兵王

亚马逊丛林深处,弱肉强食,遍布危机是这片丛林的法则。在丛林某一处,阳光透过树叶,洒落在铺满腐败落叶大地上。在这些落叶的底下,一只红甲的千巨型蜈蚣,静静的潜伏着。能在亚马逊深处存活的蜈蚣注定不是凡物,千足展开,接近30厘米的宽度,足足13米的长度。配上尖锐的毒牙,数以千计的截足,能使看到他的人类毛骨悚然。可惜,在亚马逊丛林深处,注定不会有平常的人类踏足。蜈蚣潜伏在落叶中,静静的等待。等待着属于他的猎物,落入这片必死的陷阱。一丝清风,透过亚马逊茂密的树林,缓缓拂过。拂过湿地沼泽,带走一丝腐烂的气息。流进那青绿的树林。...