趣书网

手机浏览器扫描二维码访问

sensenova-si:ai终于能看懂三维空间了(第1页)

先给你一个总览:SenseNova-SI是商汤2025年11月开源的空间智能大模型,有2B、8B两个轻量版本,在VSI、MMSI、MindCube、ViewSpatial四大权威测试里,8B版平均60.99分,把GPT-5(49.68)、Gemini 2.5 Pro(48.81)甩在身后,靠的是不堆参数堆方法,用原生多模态架构+空间专项训练,让AI真正理解三维世界,而不是只会“看图说话”。下面用大白话掰开揉碎了讲,保证你看完就懂。

一、为啥说“空间智能”是AI的命门

- AI的“老盲症”:以前的AI就是个“睁眼瞎学霸”——读书万卷、写文一流,但看三维世界一塌糊涂。比如给它一张桌子的图,它分不清哪个是正面、哪个是侧面;自动驾驶场景里,它可能把“旁边车要右转”判成“静止”,这就是行业里说的“空间认知短板”。

- 问题出在哪:传统大模型用的是“拼接式架构”,先把图片转成文字信号再解读,就像把3D电影转成2D剧本再讲给你听,中间大量空间细节全丢了,相当于让盲人靠听描述去想象魔方结构,怎么可能对。

- 为啥现在必须解决:AI要落地到自动驾驶、机器人、工业制造、3D设计这些领域,必须能跟物理世界交互,空间理解是底层能力。没有它,具身智能就是空话,机器人拿杯子会摔、自动驾驶会撞、数字人做直播动作会飘,根本没法商用。

二、SenseNova-SI到底牛在哪(数据说话)

- 核心成绩:8B版在四大空间测试中平均60.99分,比GPT-5高11+分,比同级开源模型(如Qwen3-VL-8B)高20+分;2B轻量版也照样领先不少,不是靠堆参数,是靠方法对路。

- 六大空间能力全拉满:商汤把空间智能拆成6个维度,SI模型在每个维度都有硬提升:

1. 空间测量:能算物体长宽高、距离角度,误差比GPT-5小42%,工业质检、AR测量直接能用。

2. 空间重构:给正面图能脑补侧面、背面,像搭积木一样,跨视角预测准确率比传统模型高37%,3D建模不用再拼半天。

3. 空间关系:分清“杯子在桌子上”“桌子在杯子下”,复杂场景里错误率降42%,机器人导航不迷路。

4. 视角转换:换个角度还认识同一个物体,自动驾驶里识别侧面来车更稳,不会误判。

5. 空间形变:知道物体挤压、折叠后会变成啥样,工业仿真、游戏动画制作效率翻倍。

6. 空间推理:能解决“把红色方块放蓝色方块左边,再把黄色方块放红色方块前面,黄色在蓝色的哪侧”这类问题,逻辑链比传统模型长3步以上,具身智能决策更准。

- 轻量还能打:2B、8B的参数规模,用消费级显卡(如RTX4090)就能跑,不用千亿参数的超级计算机,这才符合“工业红线”——用的成本低于创造的价值,能大规模落地。

三、技术揭秘:不堆参数,怎么实现碾压

- NEO原生多模态架构(底层革命):不是先把图片转文字再解读,而是从Transformer底层就让视觉和语言同步处理,像人的眼睛和嘴巴一起工作,不丢空间细节。关键创新有三个:

1. 原生图块嵌入:图片像素直接映射成语义词元,不压缩、不丢细节,比传统“翻译式”架构保留**90%+**空间信息。

2. 三维旋转位置编码:视觉信号用高频编码(抓细节),语言信号用低频编码(抓逻辑),两者不打架,模型能同时“看”和“想”。

3. 混合注意力机制:每层推理都让图文信息互相“盯紧”,不是各干各的,理解更连贯。

热门小说推荐
脆弱性

脆弱性

生意场上的仇家不幸病逝,商行箴使手段让对方的儿子时聆自觉找上门,并趁机把人困在自己家里,打算用尽法子在时聆身上泄愤。 以防时聆深夜逃跑,商行箴每晚都把工作搬到对方卧室加班,确保时聆入睡才离开。 某天回家晚了,商行箴推开房门,时聆睁着眼看了他一会,然后乖乖把脸埋进枕头里。 后来有一次,商行箴在房门外打了好久的工作电话,挂线进屋后时聆已经睡了,他坐在床畔看着时聆的脸,暗想防备心真低。 事情转折发生在一场酒局后,商行箴带着一身疲惫归家,念在时聆从未有过出格行为,他没往对方卧室走,直接回了自己的房间。 谁料半梦半醒间,商行箴察觉床褥微沉,他骤然睁眼,只见时聆窝进他怀里,在黑暗中注视着他:“今天怎么不哄我睡觉?” -- 大尾巴狼强势攻×会装乖的心机受 商行箴×时聆 一个本想拼命折腾对方结果反被吃得死死的,一个随便对方要亲要抱爱咋样咋样看似不上心其实已经离不开,双方非完美人格,都挺偏执挺病态。...

虚情假意

虚情假意

纯情Alpha被Beta渣之后黑化了 ———以下本文 *前高岭之花后黑化Alpha攻X没心没肺Beta受 余嘉艺是个beta,却爱去招惹那些小甜O,还总能把人哄得晕头转向。 但他又是个喜新厌旧的人,厌倦后就毫不犹豫地把人踹掉,无辜地道:“我只是一个Beta而已,需要负什么责?” 后来,他碰上了一个比omega漂亮无数倍的Alpha,他使上了浑身解数才把人追上。 Alpha在答应他之前,问道:“你会一直喜欢我吗?” 余嘉艺愣了一下,轻巧地点头,眼睛笑得像个月牙:“当然会的,你那么好看。” * 这次一谈就是好几年,本以为是海王收心,但结果还是死性难改。 他被Alpha的占有欲闹烦了,又想一脚把人踹了,满脸不耐地道:“我只是一个Beta,你上我需要负什么责?” 余嘉艺翻车了,他被面色阴郁的Alpha抓了起来,关在一间不见天日的别墅了。 他感到惊恐与无助,Alpha却站在他的面前,掐住他的下巴,迫使他抬起头来。 Alpha的手里拿着针管,镇定地问道:“那把你变成omega,在你的身上留下标记,你就会负责了吗?” 【指南】 1:受不会变成O 2:不好这口快跑 标签:年下AB恋渣受HE小小的狗血强制...

七根凶简_尾鱼

七根凶简_尾鱼

《七根凶简_尾鱼》七根凶简_尾鱼小说全文番外_一万三曹严华七根凶简_尾鱼,???-----------w--y--c-------??-----d--j--z--l---------------????-----------w--y--c-------??-----d--j--z--l---------------??《七根凶简》全集作者:尾鱼☆、引子重庆,解放碑。万烽火在这片重庆最繁华的地界走着,不...

地脉纵横录

地脉纵横录

一段横跨半世纪的玄学史诗,一场裹挟全球的文明暗战。当七星再度垂野,地师最后的手段,是在黄道十二宫的星轨中,以天下龙脉为筹,与密宗诸派赌一场五千年未有的棋局。......

修行从科学开始

修行从科学开始

突如其来的海市蜃楼使得两个不同的文明相互联系起来,一边是修行文明,一边是科技文明。陈嘉熙走上了一条科技修行的道路。“师兄们,帮我拦着外面那帮人,实力和我差不多的就放进来,让他们看看我是怎么一点点把靖国神厕给拆了的。”......

寂寞的鲸鱼

寂寞的鲸鱼

声明:不接受剧情和人设可以点叉,写文看文双向选择,请互相尊重。 占喜找对象的要求历来简单,对方不用高,不用帅,身体健康,有稳定工作,关键是必须要足够有趣,能说会道逗她笑,谁让她是个无趣的人呢? 结果找来找去,找到一个半点儿不符合要求的人。 这人又高又帅,靠做手工小饰品为生,总是微笑着看她,不说话。 占喜:忍了。 骆静语:? 占喜:认了! 骆静语:? 占喜:好吧,爱了爱了。 骆静语:^_^ 无聊小姐vs寂寞先生 1V1,双C,HE,男主是听障人士,都市酸甜小恋曲。 文中涉及手作烫花工艺及其他手工制作内容描写,有技术支持,也有部分私设和艺术夸张,一切皆为剧情服务,请勿考据。 2014年写的文案(留着吧,为了情怀): 骆静语给占喜讲过一个故事。 很久以前,海洋学家在大海中追踪到一头鲸鱼的声音,它很健康,但是身边从没有同伴、配偶或孩子,这令海洋学家们非常好奇。 原来,普通鲸鱼发声频率在12-25赫兹,而这头鲸鱼的发声频率却有52赫兹。这就导致普通鲸鱼都听不到它发出的信号。 这头孤独的鲸鱼被天性驱使着,每年在北极和赤道间往返迁徙,在茫茫大海中唱着寂寞的歌,却从未遇到过一个同类。 占喜托着下巴看向骆静语,看他漂亮的手在身前划出一串串优美的符号。 她突然觉得,他就是那头寂寞的鲸鱼,一直在寻找那个能听懂他唱歌的人。 微博名:作者含胭...