134. 【数据的综述】和谢晨聊，新时代的石油、历史、版图、数据金字塔、定价与Recipe

158m 22s

本次访谈主要探讨了数据在驱动人工智能，特别是大模型和机器人（具身智能）两大领域发展的核心作用与当前挑战。嘉宾谢臣基于其在自动驾驶仿真和机器人合成数据领域的创业经历，指出数据问题本质上是智能的“教育”问题。他认为，对于大模型而言，互联网预训练数据已相对充足，当前瓶颈在于如何通过后训练和高效评测（类似“因材施教”）来提升模型能力，这需要越来越多领域专家提供高质量反馈。而对于机器人产业，数据则处于“荒漠”阶段，严重缺乏物理世界的预训练数据和规模化、低成本的评价能力。他提出，仿真和合成数据是解决机器人数据瓶颈的唯一规模化路径，并将从“加速器”演变为产业发展的“前提条件”。访谈还分析了产业格局，认为大模型团队更关注通用智能和零样本泛化能力，而机器人公司更专注于具体场景落地。长远来看，可能形成大模型商提供“大脑”、数据商提供“教育”与评测、本体商和场景商负责落地应用的四方协作生态。总体而言，数据，尤其是高质量、可规模化的合成数据与评价体系，正成为制约AI，特别是具身智能迈向下一阶段的关键瓶颈与破局点。

Transcription

4585 Words, 50149 Characters

Chinese

Hello 大家好,我是小郡 2016年除了嘉宾访谈我们也很希望推出一些由内部人事带来的产业单级那今天就是这样的一次尝试我们知道数据算力算法是驱动人工智能的三架马车今天这期节目我们邀请我们的反场嘉宾光轮智能的创神监CU现成这图通过一级节目来完整的聊聊着其中的一架马车数据问题我们尝试来做一个数据的产业总数大约模型的数据遇到的是壮强的难题机器人的数据則处在一片荒漠之中数据产业究竟是如何硬转的一些人正在探索的仿真数据数据进去的有将如何改变产业的格局呢? 那接下来就是我对谢臣的访谈如果大家对更多的产业化题感兴趣欢迎在评论区里留言起来我们在二零二六年和AI共同进步从你的视角告诉我们谁变得更激进了? 我觉得自己肯定是更激进了我觉得阿里也我觉得偶盘人爱我觉得地卖也觉得更激进了对我觉得因为答我觉得也更激进了这是五家绝诸机型大脑的采对对其实某种层面上我人派也应该属于这一类其实最有效的数据是先失败再成功的数据我觉得就是说到了中局可能整体上来讲就跟马斯克说的咱们人可能就在一个仿真里头 Hello Steve先给观众朋友们打个招呼谢谢小郡的邀请我叫 Steve 朱文明叫谢臣我是光轮智能的创神C.O Steve其实之前来过我们的博客节目但是因为我们今天是第一次录视频博客所以还是请 Steve先给我们做个自我介绍并且讲讲共产的经历我最早是在北大物理读的本科然后去个人表大学的商学读了一个量化金融的博士然后与很多我觉得在科技圈尤其是在巨身圈创业的力量不一样我其实刚撇了以后的经历有一些复杂其实在电商做过动态定价的AI算法的负责人电商哪家公司其实当时叫摘刀抗它是一个希望去颠覆雅马迅的一家新星的创业的公司然后很迅速的取融了很多钱最后其实被沃尔马受购那当然在这个之后其实我还做过产品经理就也负责过产品所以其实我一直是在算法以及落地之间就再去思考我的下一步直到2018年的时候我特别幸运去了归谷加入了Cruise 那是当时可能最领先的或者最领先的维尔的两家一家是微贸一家是Cruise的L4的自动价值公司去Cruise去负责自动价值的访真那这也是我第一次在整个行业真正的去验证了访真以及合成数据他们并不是一个玩具他们真正可以有效的去支持到算法的眼睛在这个之后我去了这个音伪达在音伪达负责自动价值访真其实也就是在音伪达的时间也就是2021年我刚加入我就发现了一个可能很颠覆我的一个认知我发现在音伪达他们就是在车端的芯片 Orin最大的客户不是微贸和Cruise 而是魏晓宁这个给我的一个很大的一个震撼让我意识到可能自动价值的下一代不会在美国不会在归谷而会在中国那我必须要回国所以其实刚刚加入音伪达六归月的时间我就鞋家戴口回国加入了未来到未来去负责他的自动价访真在这我也特别感谢我的太太他当时给我很大的一个支持就抛弃了可能在美国的很多的工作朋友经历然后和我一块回国那当然就是说回国了以后我再未来真正的去从一个主机场的角度去实践这个访证把它搭建成了一套的这个数据庇还可以支持到比方说自动价是算法的合成数据训练以及大规模的评测合落地那当然这个时候我也产生了很多的一个思考就是说访真他到底只是一个加速器的一个作用是一个紧张天花的一个作用还是说他是一个更加偏第一性的他是一个更加偏一个前提条件我那个时候就越来越感觉到自动价时可能访真更多的是一个加速器而对于机器人剧身制等他可能更会是一个先学条件有了这个思考了以后特别是赶上了大模型的这个眼镜那么在2023年我后的连创严海波一起决定成立过温智能那其实出发点就是希望用这个访真用合成数据来加速机器人这个产业为什么你刚毕业的工作经历会相对其他人也更砸一些你当然在寻找什么很好的问题我觉得其实我个人也在寻找就是说我能够对哪一个行业对哪一件事能够产生最大的一个贡献这贡献可能不是一个紧张天花而是说我真正可以成为一个前提条件来真正改变一个行业那我其实本科是学物理的物理其实很难我刚加入北大物理的时候是年纪100世名我可能花了三年的时间每天晚上可能两点钟睡觉包括韩属价都没有回过家都在学校最后可能是进了年纪前五这个经历给我的感受就是说第一确实是通过努力你确实是可以去做得更好但是第二的话其实天赋还是最关键的我觉得我可能还是缺少了对于物理的天赋后来去金融也是看到了当时可能从物理从数学走的最好的这些同学可能都去了金融这个行业但是真正去读了博士里好财发现这个行业其实开始欠缺了一些创新且对这个社会可能没有太大的一个从我角度来讲真正的一个贡献那我希望更加投身到一个科技行业那么去了科技行业了以后其实我也是在寻找我最有价值的地方我认为从产品端来讲的话我特别希望去做一件事真正能让他有效的去做地就是给用户来提升价值但是其实做了一段时间又发现这件事可能缺少了一些技术的难度一些实质的挑战不够颠覆形所以确实是抱着这些的想法我在不断地去寻找那当然我觉得我最幸运的就是可能从18年开始我真正地找到了我觉得最有意义的事情且我认为他可能能够成为一个产品能够成为一个商业模式那这个就是访真我记得我好像见过你的某一个师兄弟应该也是北达武力系的然后他说你是很少见得在北达武力系读了本科然后很快就去个人比达读商学院的你觉得你的特质跟你同龄人有什么不一样我觉得我的特质的话就是说我可能希望做一件事要不然就不做要做就能够做到最好这个最好是一个可能在国际上能够做到第一名第二名或者说除了我之外就没有人能够做得更好这样一个级别另外就是说我觉得还有一个特质就是我比较希望去找一个区分部去哥伦比达大学商学员其实一方面是因为我的学习各方面可能确实是比较好但是其实最主的原因是我想清了我不是合作物理那我其实觉得在那个时间点和我的同龄人比的话我觉得可能我的思考会更多一些因为我不断地再去找就是说我在哪一个方面可能能够有真正的一个优势能够与别人不一样你找到了吗我认为其实当时是没有找到那我认为现在我找到了其实我没有讲的是我在本科的时候也创国业我在博士的时候也创国业我在本科其实经历更加复杂一些在大三的时候到了年纪前五了以后我就开始放飞了因为我觉得就是这个他飞到了年纪前五对这个成绩足够我来去出国申请一个名校那后面的成绩就没有那么关键了那这个时候我就再想那我确实的是什么我确实的可能是真正的这种设团的体验国际的经历因为我可能寒窗苦度我在这个三年的时间而我的同学们可能就都有各种各样的不一样的经历那所以呢我就当时就申请去哥伦比较大学去交换了一年那在那一年其实是给我感受很深当时是金融危机那我确实也08年的时候那确实也是这个感受到了很多不一样的这个世界学到了很有意思的课程教了很多的朋友同时也让我看到像我这样的人很希望去有这种在本科出国的经历那很有可能北大、清华很多这种高校的同学们他们也都希望有这样一个经历能够在本科的时候就希望好地就感受一个这个世界找到他们下一步的方向所以我当时就组织了这样一个学习团教练团那么等于是在北大的时候当时就半个几次带了很多的同学们当时出国当美国包括其实在博士的时候我当时也有点先不住也创了个也在博士的时候当时就是我养了一只狗他的名字叫土豆他是一个特别可爱的一只八哥在他三个月的时候被查出来有新疆病让我就很伤心由于对他的爱然后也由于就是说跟很多的狗友去交流我发现可能一方面为了土豆一方面为了狗友这个社区可能需要一个应用一动应用来帮助大家更好的去维系大家之间的关系也让大家更好的去维系他们跟狗这样的一个人间所以我当时就下载了很多的APP 可能下载了有500多个APP 在我的手机上然后一个一个的去尝试自学设计自学鞋带码然后把这个APP开发出来第一次科技创业第一次科技创业然后做了一个狗友的应用当时这个狗友应用其实还在北美是拍明可能是前三的狗友的社交应用基本上都是五分的这个类伴其实还是比较火的但是我觉得一个问题就是我当时其实没有去思考商业模式所以做完了以后其实也很难去商业化其实当时有几个规矩的VCE 给我TermShit 希望给我这个投资但是当时我也接近这个博士的毕业我想了想就还是算了因为可能这个确实也不是我一生希望去追求的一个方向同时我觉得没有一个商业模式我也不希望去拿投资人的钱去浪费他们的钱也浪费自己的时间所以我后来就把这个公司给关掉了做了多少时间这个公司这个公司大概做了三年的时间三年到不是毕业到不是毕业以前面工作经历非常的仔是不是因为你一些PASS很多事情你发现很多事情写不适合自己没错其实我觉得不同的人不一样我举一个例子我觉得可能巴菲特和狼狼他们很幸运一方面我觉得他们很棒他们能力很强一方面他们很幸运他们可能在十岁的时候就找到了他们擅长什么对吧可能巴菲特在十岁的时候发现他特别喜欢股票他也擅长投资狼狼可能在十岁的时候发现他擅长谈谈钱我觉得我其实花了很多的时间发现自己不擅长什么我必须得去通过试错才能知道自己不擅长什么但是我可能就没有那么幸运我可能花了很长的时间才真正发现自己擅长什么擅长的是我认为我擅长的是基于一个更加颠覆性的技术科技打造一个产品并且用这个产品去真正的支撑一个产业我觉得这个是我擅长的为什么你最后选择在访真这个领域算是深耕吧而且也很快从去领委达只有六个月然后就加入未来其实你后面换的其实也挺快的就是在每个公司工作时间都不久是的我觉得首先是我相信访真的魔力这个其实是我当时去Cruise的时候发现的在我去领导Cruise的访真之前实话是说访真是一个玩具或者说它更多的是Cruise 给投资人展示的一个Diamot 那么它其实是用这个游戏引擎用这个比较传统的这套的技术美术去打造了这个看起来很真的一个世界车然后用它去生成了很大量的数据但是这个数据的其实算法的团队比方说当时感知的团队并没有办法有效地去用到它或者说其实用了以后其实效果训练出来的模型的效果是降低的而不是升高的其实Ciu也比较转的一个人它叫Cao 它比较转的一个人它拉我过来就是希望让我去解决这个问题当时给我的时间可能是三个月的时间那当时其实压力也比较大第一步其实我可能跟别人不一样就说我的背景比较复杂一些我借物理的背景我有量化我还有AI的背景所以我第一步做的事其实不是去提升访真而是去评价访真得到了一套评价的准则的以后第二步才真正地用声称是AI 以及访真的一个集合真正地去提升它同时与算法有效地去迭代真正地去把这个数据味道了算法了以后真正看到了一个提升这个点是我真正地看到的一个很特殊的一个时间点它让我真正地相信了这件事当然我当时为什么去因为打是因为当时一方面就是说因为打老黄他们确实看到了我在自动前方访真做得不错他们确实在找这样一个负责人但是第二就是说从我的角度其实我也在不断地给自己抛反力也在设论之自己就是凭什么我就认为我是访真做的最好的因为其实当时那个阶段微贸有微贸自己的做法 Cruise有Cruise自己的做法整个行业还没有完全收链所以也很难说谁对谁错我觉得因为打他的优势就是他作为一个供应商我认为我从一个我认为我已经具备了L4的这个角度了我在去微贸可能意义不大但是我如果去一个供应商我能够从供应商的角度去看应该怎么去做法征所以这个时候我去21年的时候那个时候可能一万人但是他的自动价是团队已经发展了几年的时间了其实因为打在自动价史上投入还是比较高的那时候从Cruise调到因为打是一个主流选择吗其实当时我觉得很多人还没有看懂因为打实话是说我当时也没有那么看懂知道我进入了因为打我才看懂他现在后悔离职吗没有后悔离职对但是就是说我确实当时在因为打内部的时候当时真正让我感觉到因为打是一家极其硬科技的公司我当时记得我跟我太太说我说其实不要小看因为打他不是一个游戏卡的公司他不只是一个GPU的公司他是一个加速计算的平台的公司他是一个全站的一个公司这个是我当时真正在内部的时候看到的那当然就是说我觉得在因为打其实让我看到了从供应商角度应该如何去做法征但是我为什么去未来一方面我觉得是会过另外一方面我觉得我希望从一个客户角度从一个因为如果说我认为将来最大的访真的需求会是来自于主机场因为他们都会自言自己的自动价史那么我应该从一个主机场角度真正看应该如何去利用访真同时我觉得我也很难去回答我自己另外一个问题就是为什么这件事一定要出来做是不是在理好做就够了所以我觉得我需要从多方的视角真正让我自己真正的理解透这件事真正在外部做有这么一个机会你说访真不是玩具那访真是什么呢这是一个很好的问题实话是说我最早的时候我一直关访真叫时间机器假如说没有访真可能自动价史要花 15年的时间有了访真每周五年的时间可以达到我以为他是一个家促器为什么这么说因为自动价史最主要的数据来源还是来自于真实的时间来自于车开回来的数据他的数据好才急他的数据很好才急他其实本质来讲是一个被动的因为都是买了车的司机对吧然后开回来的数据他其实更加希望通过访真做的是两件事一件事是补充一些编较的场景就是俗称的Corncase 那么可能是路上的一些比较偶发的事件还有一个是用访真去做一些评测因为在访真里头可以有更好的一个重复性那么可以重复地去验证他们算法的有效性做回归的测试但是我当时的想法是访真难道只可以作为一个时间机器吗有没有可能他对于AI对于后面AI的发展会类似于英伟达的卡一样没有英伟达AI就不会发展而不是说有了它它只会发展得更快在这个时间点上我就开始去看机器人这个产业当时其实我觉得在英伟达因为我出动很大的一件事就是我当时有机会跟Jansson当时有机会跟因为达的可能Alpnews的几个Leader 有不要深入的交流我当时感受到其实因为达在下一盘大棋它其实真正测众的是机器人的访真这件事它把它做成了一套平台因为它特别相信通过合成数据通过访真这个是唯一的路径来真正的让机器人将来可以部署到世界各地我当时其实也越来越认为这个确实是后面的一个大棋事在这样一个阶段我认为就是说我真正应该出来去创业做的不是一个自动架式的访真合成数据而是去真正作为整个机器人产业的数据的这个基建整个机器人产业的数据的这个眼情为什么要在外面做为什么不去在某一家公司做为什么这些机器人公司不是自己来做这件事情怎么说呢其实我也是花了很长的时间去理解我觉得在这其实更多的还是要去想这件事的难度它的市场的机会以及我觉得可以于比方说这个行业的一些公司去类比比如说像SKAYO AI这样的公司去类比我认为当这个市场的机会足够大它的难度相对的大在这样的一个情况的时候我仍然在外部做其实有更大的优势为什么因为其实你可以招到更好的更优秀的人人才举一个例子就是在Cross可能最好的算法的人才很难给到访真团队他一定会给到感知的团队或者当时的预测的团队对吧那么在WeMo可能最好的数据的人才并不见得会给到数据的基建团队可能会给到算法团队而在SKAYO AI 对吧他会吸引到全世界最优秀的算法的人才和数据的人才来为他去打造一套数据的飞轮我觉得一样的道理就是我认为其实只要这件事足够的难这件事他的商业的机会足够的大我认为他就应该在外面做除非就是说这件事可能比方说如果他只是一个自动架式的访真对吧那我觉得确实有可能这件事并不值得完全全在外面去做这件事其实我们今天这个节目是想聊一个很专业相对逆迟但是也很本质的一个话题就是数据因为现在不管是大约模型还是区生质还是说Botics都非常关切数据问题不过两边的阶段可能是不一样的大约模型遇到的是数据状强了没有更多的数据了互联网数据都已经吃完了那对于Botics来说数据仍然是一片荒漠在你看来你觉得数据问题有多重要他是本质问题吗数据的问题其实我认为他对于AI是一个本质的问题我觉得如果从第一项原理上去思考的话我其实认为数据可能应该跟人的教育的行业去类比就是数据对于模型或者数据对于智能我觉得有点类似于教育的行业对于人的学习数据约等于教育我认为数据对于智能是极其关键的因为我认为就是数据对于智能就要类似于咱们人去获取知识来不断地去自我提升我认为知识对于人的智能是极其关键的第一性的需求所以同理我认为数据对智能至关重要的一件事你会怎么定义数据我觉得我可能更多才是从AI数据发展的不同阶段来帮助咱们去想一下怎么去定义AI数据这件事我认为最早的数据更多的类似于是在最早的机器视觉的阶段当时李菲菲教授去定义了Image Knight 这个时候的数据更多的是一个数据级对吧他是一个静态的包括图片包括相对的真值标注的一个数据级这个是最早的一个阶段他是一个静态数据级的一个阶段那么我觉得与人的教育类比的话他其实可能更多的是一个偏一次性的填压式的一个教育比方说一次性的买了一些教材提供给了一些同学们去学习在后面的时候其实我觉得就到了SKAY OAI真正的去工业化数据的生产这件事这个时候我觉得数据可能更多的是一个基于大规模的工厂式的流程包括后面的工艺对吧把它相对高时效性的大规模的保证质量的去生产出来所以它更多的是一个工厂的生产大规模数据的一个流程在这个时候我觉得油道类似于是一个偏量饭式的教育再往后其实就到了我觉得大远模型的时代那大远模型的时代我人数据由于可能预讯练已经把整个后原网的数据都给用够那么数据的重点开始转移到后训练以及评价这个阶段那么更多的是基于越来越多的高阶的这些人比如说能力很强的工程师物理学家数学的金牌律师医生那么基于他们一方面来说去出体然后提供评价标准二基于这些体就以及考核这个大模型的这些反馈发现相应的问题又针对这些问题去给他们更多的信息给他们更多的经验传授帮助他们去提升在这个时候我觉得数据就更加类似于是比方说教育的这个更加高阶的一个阶段就是这个诗者所以传道受业结构也那是一个老师根据你的这个因材识教根据的能力根据你的阶段基于一些对你的评价发现了一些问题并且基于这些问题给你足够的有经验的传授反馈来帮助你去提升所以我认为这个其实是数据的一个演变那当然我认为从据身来讲的话它的数据又更加的复杂比如说在大元模型的时候数据可能是更多的是在数字的世界那么基于从评价的角度出发给到这个模型更多的反馈而据身其实我认为来讲可能更多的会在物理的世界那无论是在真实的物理的世界还是在访真的物理世界基于评价基于信号提供更有效的经验的传授以及反馈对那么这个我认为可能是数据发展的不同的阶段那么从这个角度来讲我觉得数据可能更多的应该被定义为它是一个能够帮助你去学习的信号以及相应的这些经验的传授所以它从一个近海的数据可能慢慢的变成一个教育的系统对我觉得这个其实也很有意思比如说我还记得最早的时候我在自动价史当时其实数据的团队他们提供的数据级其实是没有什么反馈的没有什么反馈的比如说可能更多是算法团队提出了一些需求对吧然后数据的团队去交付然后算法团队后面再提出更多的需求对吧咱们去看现在的很多的数据标注业自动价史的数据标注业我觉得还是在这样一个阶段对吧其实这些数据的厂商公司或者说内部的团队他们其实对算法的状态是没有了解的他们更多的是被动性的去接受算法提出的需求并且提供相应的数据的交付但是咱们再去看比如说大元模型这个产业当然一个是scale 但是后面的比较说像mokr 像search 他们更多的是找了更多高级的人去给他的模型的客户的算法提出了更多的评价通过这些评价去给这些他们的客户提供反馈并且继续这些反馈针对性的提出了更多刺激了更多的数据的需求又帮助这些客户提供了更多的这些数据的需求来帮助他们的算法去提升这样的一个庇还在这个阶段其实数据商是对客户的算法是我觉得是很了入之长的因为其实真正的评价方变成了数据商所以我觉得这个其实就很像学生和老师的关系对吧比方说如果是一个量饭式的教育那么可能老师对学生可能并没有太多的了解它只不是一个填压式的一个教育而对于一个更加高级的比方说大学的教授或者是比方说物理奥塞班的这个老师与学生的关系那他们可能是更加有针对性的知道我认为数据其实在朝有针对性的知道这个方向去眼睛我们经常会在行业里听到几句话一个教授就标注一个是有多少人工有多少数据你们给大家形象化的解释一下这两句话背后所运喊的工作量就是它的工作具体包含哪些事情它是一个怎么样的工作流程我想说就是说数据其实也在演变它可能从最早的数据标注到现在的可能是更多的数据的采集那我在这儿我可能举一些例子比如说从数据标注业来讲的话比如说最早的SKLA去提供自动价值它这个数据那它可能是哪到了客户的比方说它的各种传感器的信息那它可能做了更多的清洗的工作更做了更多的切片的工作在这个基础上它可能有自己的一套工具链那当然可能还更多的是一个人为主的一个流程去积预这些工具链积预它的一些规范流程比如说这里画个寬这个是自行车那个是行人包括可能更加实序性的这些数据把他们标注出来然后可能经过层层的标注再往后发展可能是首先是自动化的标注其次是人在还的这个致减这样最终把数据生产出来这个可能是一个比较传统的自动价式的算法标注这样一个产业它需要多少人历啊它需要很大的一个人历包括现在其实我觉得自动价式的标注行业其实还是当然我觉得它从客户端已经有很多的自动化的算法了但是其实咱们比较说去看整个产业可能有很多的基地可能很多的省市都有很多的标注基地每个基地可能就有这个成千上万人在做这个标注行业所以整个市场上我估计可能会有我撥去我估计可能会有十万人几十万人再做人工标注这件事情我这么多人对是很多的人当然就是说这个我实话说我认为还是在上一代的这个数据它更多的是基于套规范准则让人去基于这套准则去提供标注信息但是我人下一代的数据提其实人在这里头提供的是经验的传说我举一个例子并说大元模型的数据无论是mokr还是sir制这个可能是翻去的两个现在比较新新的数据商那么他们是为大元模型提供后训练以及评测的数据包括BTSR1Hive 就是包括不断地去模型去交互给他们去提供反馈以及他们去出很多的体系又给一些答案来让客户的算法一方面去评价他们一方面让他们去用更好的RL的翻评去提升自己在这个时候其实这些人都是很有经验的人或者说很贵的人你可以看他们的时期都是在100美金以上的时期他们提供的更多的是一个元式的数据他们提供的不是一个标注并不是说在有的数据上他们在提供一层标注而是说他们直接的去给这个数据去提供反馈或者说直接去生成新的数据那能举个例子举个例子比如说就是一个问题你对AI的数据的看法是怎么样的对吧那么可能算法先生成了自己的看法比如说可能GPT 先生成了自己的看法那么如果这里还有一个数据的专家那么它可能就会根据 GPT的看法给它提供相当的反馈对吧同时它可能还会去出更多的体更多的男士的角色没错它是一个老师的角色它会出更多的体同时它可能还会提供更多答案包括比如说举一个例子向编程你可能有十重方式能够把这段程序给它编出来那哪一个是好的哪一个是坏的哪一个是模糊的两壳的这些都要相应的给它体验出来给到算法所以这个时候就跟之前的数据就很不一样之前的数据比如说自动价史或者说最传统的机器视觉的数据可能你需要提供的都是正确的信息对吧就完美的正确的信息这是最好的但是其实在现在的数据比如说大元模型或者巨身其实没有严格的正确也没有严格的完美每个人可能它的回答都是不一样的对吧但是可能这些不同人的这些的分布这些多样性以及它的里头的这些逻辑的关系以及甚至是的一些错误的数据都会是机器有价值的我举一个例子就是我们服务巨身客户的这个数据最早的时候可能包括我们的客户也是全球最顶尖的巨身的大脑的公司他们可能给我们的需求就是你要提供完全正确的完美的进于访真机器人去执行一个常常的任务比如说做一个披萨从冰箱里头把这个冰拿出来然后往上面去放各种各样的调料以及各种各样的水果这个蔬菜肉 Taste等等最后把它放到烤箱的口去按键你要把它完美的做出来这一个常常的任务是一个有效的数据但是后来我们的客户包括我们一块通过迭代发现其实最有效的数据是先失败再成功的数据比如说我在里头我可能要放一片模糊但是我拿出来模糊我切片了以后我没有抓牢这个模糊掉到桌子上了我在把它减起来再放回到这个披萨上这个数据我们可能可能叫复样本或者要纠正的数据这个数据往往是更有效的所以其实当模型的放化能力提升了以后它更可以从促踪去学习这些任势回来它更接近于人的学习过程没错它更基于人的学习过程前段时间我们有一个播客聊过一个观点就是广密说他们认真化时间研究了给Frontier Lab 鬼谷那些Frontier Lab做数据标注的公司最大的提干是如果模型数据分布里面没有这类数据这类任务就是不成功的只有压缩过这类数据可能才会成功所以今天的模型还是一个巨大的压缩去所以它提出数据级模型模型及应用你政客这个观点就是说所有的数据都应该持续练到模型的压缩过的我认为就是说在这其实广密提到了一个很好的一个我觉得现在现阶段的一个问题就是模型的放化能力还是不够的怎么去定义放化能力我觉得就是英文叫Jeroshoot 中文其实就是零样本的能力零样本的学习的能力就是我没有给你看过这个样本没有见过没有见过但是你能够把它做出来对吧比如说假如说你的机器人的训练里头并没有见过做Pissar的视频但你可能见过并不是说切菜的你可能接过做汉堡的但是给你做Pissar的任务你能够给它做出来这个是零样本的能力现在我认为从巨深的角度来讲的话零样本的能力还是比较欠缺的在这样一个情况下确实你需要什么样的任务的执行率你就需要去补充什么样的任务的数据在现階段是我认为这个是合理的但是我认为就是说数据及模型这个观点我认为在长期我认为可能它不是一个本质的一个观点因为我认为本质上来讲模型的架构还是需要去提升的我认为一个模型如果不具备架构上如果不具备零样本方化的能力我认为这个模型它不是一个真正通往通用智能的一个模型那我在举一个例子其实人的算法也是不一样的举一个例子可能普通人的学习的算法和马斯克的学习的算法也是不一样的马斯克的学习的方式可能是更多的是从第一程原理出发基于它可能比较广播的知识以及举它的实践去迅速的去千亿新的知识出来来帮助它去更好的理解这个事物我认为它的模型可能会比普通人的模型要更加的有效很多在我看来就是说智能其实现在一方面我认为肯定是需要更多的有效的高质量的数据但是另外一方面我觉得还是在模型上需要更多的提升所以这里讲的是加过和算法的问题本质上还是它不够聪明本质还是它不够聪明我认为就是奋化性还是需要算法的加够来带来的当然就是说存在一个Skating Law的模式时间点就是说可能你的数据量必须得堆道一定很大的一个数据量才能够看到它的奋化性的出现就是足够聪明了其实我们现在也服了可能全世界最大的几个大模型的团队那么通过我们跟他们的合作我们其实是发现在剧身这儿我认为就是说这一段哨头脑力就是零样本的这个能力我人已经逐步地开始出来了所以我认为在这的话其实我还是不要乐观的在哪些场景会出现这种零样本的趋势对我觉得可能倒不是场景倒是团队我大概说一下我的看到的一个不同点可能比方说在六个月以前我们的大模型的客户和我们的机器人的客户他们可能对于数据的需求无论是从量从他们的具体的定义角度来讲都是不要相近的但是可能最近这六个月可能发生了制的变化那么我发现大模型的客户他们可能最关注的现在就是零样本的能力他们怎么去他们相信的是什么他们相信的是Skeleton脑他们相信的是用一个足够有效的算法用足够多的高质量的数据可能这个数据更多是一个本体无关的访真以及人类数据基于访真的评测大规模的评测来帮助他们去实现一个相对简单的笨题比如说机械并都不是轮式底盘的机器人或者是这样说这个族式的机器人就是机械并加转是否可以实现足够有效的零样本的潜艺的能力大模型团队大模型团队为什么要去做硬件相关的事情他们其实恰恰是因为不想做硬件相关的事情所以他们选择的是最简单的机械并比如说你要去做人型或者要去做这个轮式其实会复杂很多因为你要去有很大的维护的工作每一个本体其实都有很大的一个调试但是大模型团队用机械并用来做什么其实现在最主要的这几个大模型团队都在做剧身的标诶大模型团队也在做标诶大模型团队才做标诶不是只有居身智能或者是宗教省团对战作为要对这个其实是我觉得最关键的一个点就是咱们去看比如说D-Mine 就是坦姐对吧比如说因为打比如说OPEN AI 他们作为要想通往哪里我认为他们肯定是最高优的关注在通用的智能这块他们的底层左击就是要做居身的大脑首先一定要有放画性对吧不见得这个大脑的能力那么强比如说我一定要是一个零槽手可以去上一个螺丝丁但是我应该是能够做出来一个大脑他比方说在十种一百种不同的任务上讯息量以后有另外有五个任务没有见过他可以去做内部另外五个任务这个我认为是大模型团队他们对这块的一个关注点他们关注的是零样本的放画的能力对而另外一方面从机器人客户来讲的话他们其实越来越多的去落一刀具体的场景对吧在这个上面他们很关注到自己的本体对吧本体的复杂性可能是有轮式可能是有足式可能有手手上可能还要穿感器那么他们可能很关注在是否可以把这一些具体的任务给他置信好给他落地好所以这两类客户他们其实从最早的时候关注点可能比较类似但是现在其实关注的点其实很分化包括在举一个例子比如说大模型团队他们可能首先关注的是这些最容易获取到的数据比如说家居的比方说其他的一些商超等等之类的场景可能一些工厂来帮助他们去提升这些放花线的认知对吧而这个机器人的客户可能他们有具体的落地的路径他们可能有的是去酒店有的去不同的工厂的这些车间比较车辆的工厂的车间他们有的可能比方说是去杀墨去给太阳能去换太阳能板他们更多关注的是在具体的业务场景的这些数据我是要为有一个认知缺口就是大模型团队这些做VA的团队和大模型团队做LM团队应该是两个团队对吧他们之间是什么样的协作关系其实不同的公司不一样往往是两个不同的团队但是其实他们是一个我认为合作极其紧密的团队其实在这我觉得可能会包括大模型的大原模型的团队大模型的世界模型的团队还有大模型的VA的团队那么他们其实是一个我觉得极其共生协作的一个关系比如说VA其实往往会用到一个基础的模型如果说你的这个公司已经是全世界前五的大模型的能力那么就完全可以用自己的接触模型去做如果没有呢如果没有我就就不要困难一些所以我其实从我们角度来讲的话我们可能合作的这些公司数据量最大的往往都是同时具备大原模型的团队世界模型的团队还有VA团队这样的这个团队来做的这件事如果没有的话它肯定就会用其他的两个时候可能会用千万或者可能会用其他的这些开源的模型那当然这是其一第二的话就是说他们对于数据的理解我认为是极其到位的比如说不只是纯粹正确的数据也包括糾纱的这个数据糾纱里好在改正的数据这个认知其实很多都是从大原模型来的对其实因为它更加像人另外就是说对于数据量是否可以接受对于数据的即可程度也是远也不一样的因为如果说你已经见过了很大量的一个需求你对于这件事的预期数据量的预期会很高而如果说这个团队之前它的所使用的数据量比较小它也很难一下子去开一个很高的数据量的口子它的Batch的事完全不一样的第三个点我其实认为是一个InfoShr 就是它的这些训练的基础设施我觉得卡是很相关的一个点以及就是RL就是强化学习的这套的基础设施是很相关的一个点我举一个例子可能机器人公司几千张卡已经很多了但是大模型团队可能都是大几万张卡所以这个是一个至少一个数量级的一个体生另外就是强化学习的基础设施这件事其实很难自言很难为了巨深的模型去做一道强化学习的大规模的并行的基础设施而这些大模型团队往往自己都已经有最好的这套基础设施可以拿来激用它只不是从大元模型的这个场景千一到了去微调 VIA而已所以LLM大元模型团队是在做我们所谓的那个通用的大脑没错 VIA团队是在做这个机器人大脑但是它大概率不是从头开始迅的它是基于了那个大约模型的大脑没错那世界模型团队呢这是新出现的吗其实我们也看到我们的一些客户他们可能再用他们的世界模型或者说他们希望将来用这个世界模型来作为一个机做模型来做后面的标识因为我觉得世界模型其实有了更多的对于物理世界的预测理解能力而基于这个在加上相应的ActionHeight 对吧那么就可以做出来更优质的这个标识其实我认为世界模型和标识是一个很有意思的一个相互共生的一个关系那世界模型可以作为机做给到标识那标识其实又作为一个落地给到世界模型先的反馈这个是相很关键的一件事那我举一个例子如果我认为一件事它的评判标准会越来越接近可能这两件事将来就会是一件事那比如说我认为在巨身可能现在最棒的这个评测级叫Behaver Behaver是李菲菲教授做的这套基于访真为巨身打造的一套这个评测级它都是比较难的常常的这些任务以及这些很难去踩踢的这些数据去做到的那么我个人因为很有信就是在12月份的这个Nyps的一个峰会来帮助这个今年就是第一次 Behaver Challenge来搬奖那么我发现一个很有意思的一个情况就是其实去打Behaver绑的这个团队也有世界模型的团队他们其实就是基于他们底座的世界模型基于这个Action Hide 然后去也就演去上了这个绑也做得也很好这个是一个另外一个就是另外一个我觉得很有意思的一个工作教E-Nact 它其实也是基于Behaver这套的评价体系本质上来讲是评价VLA的评价体系作为一套去评价世界模型的评价体系这个也是离非非团队做的所以你可以看就是同样的一个Bunchmark 它又可以去作为评价VLA的标准又可以去作为评价世界模型的标准那如果评价系统越来越一致很有可能将来这两件事会越来越我觉得会越来越相关那世界模型踢带的不是VLA 是世界模型踢带的其实是大约模型吗我认为世界模型可能更多的会是在云端的一个大闹而VLA我觉得它会是在端测的一个大闹我觉得这个可能是一个在场线他们也会是一个共生的一个关系那大约模型呢我认为大约模型本质上来讲大约模型在数字世界已经具备了一并世界模型的能力但是它其实缺乏对物理世界的理解我认为世界模型是有物理世界的理解能力以及预测能力的而我认为巨身的VLA可能更多的是需要在物理世界有更加精确的有效的以及高效的一个行动力所以我认为这三者可能还是不太一样但是这三者可能后面的训练的基础设施它的底层的这个基座会越来越去统以层的基座会越来越去统它可能会成为一个统一的非常大的大闹对所以可能未来世界模型是那个云端大闹 VLA是那个端测的大闹然后数字世界可能有个大闹就是大约模型的大闹对听起来现在是有两股势力一个是做大闹的公司一个是做本体的公司对以类是做大闹公司以类是做本体的公司你觉得这两类公司哪个会成为一个就是在这个游戏版图上更重要的一股势力我人家可能长线都会比较重要但是我大概说一下我的一个观察这个观察就是数据幣环这件事或者数据引擎这件事就是特斯拉其实发明了数据引擎对它安整这个概念它更多的是因为它要取落地它的 FST自动价值的这套系统那它可能当时已经具备了有上百万两出在路上可以全天后的基于司机对吧基于这些用户去开回来的数据去訓練他們的雲端的大腦又基於他的雲端的大腦的不斷的提升去部署到端策更好的自動駕駛的能力近而形成了一個數據飛輪這套數據引擎就特撒到數據引擎它的底層邏輯其實本質上來講是一個本體相關的底層邏輯就是自動駕駛商或者說這個歐陽它因為在全世界部署了最多的自己的車它就可以從自己的車上收回來最多的數據又基這些數據可以訓練最好的大腦所以這些歐陽他們自己就是最大的大腦上對吧但是我認為對於巨生來講這個邏輯可能會被顛覆為什麼呢因為從巨生來講這個世界上並不具備比如說上百萬台的機器人部署在端策然後在自動化的執行各種各樣的任務或者說在端策的憂忍去搖操他們去執行各種各樣的任務如果有人去搖操的話帶來的成本又過高這個也不是一個可規模化的一個路徑在這樣一個情況下我認為它一定整個數據的架構會去符合數據進塔那就是最小的數據量會是基於在端策真實部署的機器人去踩積回來的數據真機數據真機數據沒錯那麼中間的這部分的數據量會是基於訪針去生長的數據而下面的數據會是譬如互聯網或者是人的第一類市角的數據下面這兩類數據訪針和人的第一人稱市角的數據他們的特點是什麼他們都不需要基於本體不需要基於一個硬件的本體就可以回來數據且他們的規模化能力要遠遠高於真實的機器人的部署這樣就會發生一件什麼事我覺得這樣就會發生就是說最多的巨深的數據一定不是本體商提供的對吧在這樣一個前提下我認為特斯拉的數據必須還在巨深就不成立了相當於就說不會存在一個本體商它自己是最廣泛應用的本體同時它又可以做全世界最好大腦我覺得這件事底層就不太會成立那我在舉一個例子來佐證這件事特斯拉他們是在做機器人對吧就是optimus 它在做機器人但是optimus的大腦其實是安排給XAI去提供的對吧而並不是讓特斯拉自己去提供一樣的一個道理一定會是一個大模型商去做這件大腦在這樣一個情況下我覺得大模型商他們會是利用更多的本體無關的數據去訓練這個大腦而本體商可能更會是利用大模型商提供的大腦去做微調部署以及落地在這樣一個情況下我覺得可能還會有兩類不同的公司會接觸進來一類就是數據商我認為數據商其實它也經歷了不同的演變從最早的可能在靜態數據級的時候它和客戶可能純粹的是一個就是假方一方的關係到SKAYO AI Search McCrure 和客戶可能更多是類似一個Puttership的一個關係到後面我覺得需要基於數據商去提供評測又基於評測去提供更多的反饋又基於這些反饋去刺激客戶的需求拿到更多的數據又基於這些數據順來更好的模型然後這樣在基於數據商去跑更多的評測因此我認為就是數據商和大模型的廠商會越來越多的形成一個共生的一個關係因為就是大模型商需要數據商給他們更加有效的評測更加有效的數據而數據商又需要基於大模型商給他們提供基於模型更好的數據驗證反饋來幫助他們去跌代自己的數據的生產聯路所以這兩邊我覺得會是一個共生的一關系所以我覺得數據商在裡頭會很關鍵還有一個我認為就是長景商這個往往是被大家忽視的長景商或者就是就是長景公司長景公司比如說歐陽他就是一個長景公司他自己就具備很多的機器人需要去落立的長景在他的車間在他的工廠包括比如說醫療的集團他有很多的自己的長景需要去部署到機器人包括農業的公司等等就算是工業這就是巨大的一個機會所以我認為這些不同的長景級的公司他們都有大規模不屬落地機器人的需求我們其實現在服務的客戶可能有很大的一個比例已經開始是這些長景級的客戶在這樣一個情況下我覺得會是四者的一個相互的協助第一個是大魔形商他們更多的是會基於本體無關的就是數據商提供的數據不斷地去衝刺Skilling Law 放話然後提供大腦把大腦提供給本體公司本體公司可能再基於更多的長景和數據去落地到長景上而長景公司他們也有更大的一個自主權因為其實他們可以選擇A硬件公司的硬件也可以選擇B硬件公司的硬件甚至他們自己有很強的一個字眼能力他們也可以自己開發硬件比如說我認為可能很多的歐監都會開發自己的機器人因為他們對量產對質量的管控對硬件的穩定性對成本的控制可能有更好的一個理解他們也可以基於大魔形的這個大腦的能力去給自己的長景直接去落地所以我認為後面可能是這四者的一個聯繫說回我們剛才講的那個禮廣面觀點你覺得不能說數據及模型那從長遠來看你覺得什麼機模型我認為還是要回到第一程原理看看人事如何去學習的那我覺得可能系統性的學習的能力我覺得這個地層應該是一個模型本質上來講我覺得大魔形就不能說是知識寂模型對我覺得不能說是知識寂模型我覺得應該是一個不斷提升的系統機能力因為其實每一次系統機能力的提升可能也會帶來對於數據的新的需求我舉一個例子小孩的學習可能看一些畫本就夠了但是馬斯克或者是比如說巴菲特的學習可能就有更加針對性的高級的這些知識以及這些信號相當於有一絲教可能對當然就是說我認為這個絲教它不應該是以人為重心的它應該是以系統為重心的只有這樣才可以提供足夠規模化的絲教足夠規模化的煙川生教我們播課其實一方面了過很多大原模型的嘉賓一方面了過很多肉包Tix領域的嘉賓你覺得這兩個領域面對今天面對的數據問題不同是什麼他們階段分別到了什麼階段我認為這個糧責還是挺不一樣的我覺得從大原模型角度來講的話他們的預訓練的數據是足夠的因為本質上來講是整個互聯網的數據對所以這款是很多的他們面臨的其實更多的是一個後訓練以及評測的一個問題那麼後訓練和評測本質上來講就有點類似於是煙川生教需要找越來越高階的老師給他們提供這些煙川生教其實這些老師往往在不同的行業裡對吧比如說可能是最好的工程師可能是可能是數學的金牌可能是最好的律師可能是最好的醫生而且越來越多的煙川生教會變為就是說出題兩說可能普通的老師是在通過自己的示範來教育學生而越來越好的老師可能是去問越來越難的問題來激勵學生自己去尋找答案所以我認為本質上來講這個是大園模型他們在面臨的數據的問題是找越來越好的人又基於他們可能去出越來越難的體基於這些體以及基於這些先號這些更多的經驗的傳授來去不斷地去提升模型的能力而對於這個巨生來講的話我覺得它現在的問題可能在兩端第一端就是在預選領其實現在缺乏了足夠的預選領的數據這個預選領數據我覺得需要有物理的這個世界無論是真實的物理的世界還是訪真的物理世界以及它所需要去交互的這些的資產比如說電腦比如說咱們在這兒的咖啡杯等等之類同時它需要有這些經驗的傳授比如說人或者是一個機器人在這兒該如何去操作不同的物體與這個物理的世界如何去交互以及在這兒相應的語言的定義還有就是相應的評價高準這個知識在哪裡是好的在哪裡是不好的對吧然後給到相應的這些學習的信號這個我認識很關鍵的一個預訊鏈的需求在這兒其實我覺得現在整個行業還是缺乏最規模化的預訊鏈的數據來幫助整個巨深來達到一個經過預訊鏈裡後一個機座模型的一個基礎能力這個我覺得是奇奇怪建的一個缺失第二個的話我覺得就是評價能力這個點其實我覺得很多人可能沒有想到比如說自動駕駛或者大圓模型為什麼他們的模型提升會那麼快自動駕駛本質上來講是因為它的評價是免費的怎麼說這件事因为自动下车的评价是通过它在端测部署的叫Shythomose 就是中文叫影子模式那其實就是把他的算法部署在撤捆在他的訪真世界裡頭去跑線的算法他並不去做相應的真正的執行但是會把他所輸出的信號和開車的司機所操作的信號去做對比當遇到了一些不同的地方的時候把這個作為一個反饋拿回來因為比方說如果說這個人是一個老師的話當學生和老師有一點差異的時候很有可能這個時候是學生做錯的時候所以這個是一個機器便宜連架或者免費的一個信號拿回來來幫助自動駕駛來評價他們相應的這個情況以及這個信號也包括相應的示範也包括相應的經驗告訴他們當你這錯了以後老師是怎麼做的人是怎麼做的來讓你去基於更多的模仿的學習去提升自己我認為大緣模型其實也有這樣一個影子模式這個影子模式就是當這些大緣模型已經上線了以後與用戶的交互對吧其實比方說咱們在用GPT 用不同大緣模型的時候咱們也給它不同的反饋這些反饋其實也是一個免費的影子模式來幫助他們去告訴他們哪裡好哪裡不好給他們一些示範幫助他們去提升這也是一個免費的一個評價而對於巨身來講的話現在並不具備這樣一個大規模的評價的能力我認為這個一定要基於訪針去提供在巨身在機器人他不具備一個就是在真實世界去提供影子模式的一個基礎他唯一可以的這件事就是基於訪針去規模化評價並拿到更多的信號又把這些信號給到巨身的大腦讓他們不斷地去提升所以我認為評價這其實也是就是巨身就模型他們對於數據的一個核心的確實所以機器人的數據收集問題比大原模型可能是結構性的難對我覺得要難很多可能是幾個數量級的難如果足夠多的數據是100分你覺得大原模型今天數據能到多少分你覺得機器人數據能到多少分我其實覺得可能很難去定義這個100分我舉一個例子其實人的學習是無知競的所以從人的角度來講你其實可以看越有能力的人他可能學習能力更強他其實每天設立的數據會更多而不是更少對當然就是說我覺得如果從一個概念上來看的話我覺得可能大原模型在預訓練可能已經到第二了我覺得他們可能更多的是在後訊聯合評測我其實覺得在後訊聯合評測我認為大原模型可能還有很長的一個路要走我估計可能大原模型現在可能到了60分但是真正的要往上去提升我最還有很大的一個空間就是在後訊聯合評測的階段我認為對於據身來講的話假設100萬個機器人所回來的數據是一個起點這個起點可能都不是100分是一個60分我覺得現在都沒有1萬台機器人無論是在真實或者訪真或者是人類的數據能夠去提供這類的數據所以我認為其實如果從這個角度來講可能0.6分都不到 0.6分都不到對你這個其實給大家一個指觀的感受是的但我覺得今天大原模型的數據問題隨著它從插報走到了 AZN的階段 AZN方面也會更加的缺乏數據因為因為 AS沒有見過真實人類工作的所以它也需要找大量的人類專家在真實的基於真實的工作環境去收集數據你覺得AZN的今天遇到的數據問題是不是跟RoboticS are有點像對我覺得這個這個點特別好我覺得其實機器人就是在物理世界的AZN 而這大原模型的AZN 其實是在數字世界的AZN 那其實我覺得他們遇到了問題其實很像首先他們需要一個環境其次就是說他們需要先進的經驗傳授另外他們也需要先的評價或者評價的這些信號來幫助他們去提升咱們去可以去看到就是說對於大原模型的AZN 其實現在有一個很關鍵的一個針對他們的數據產品叫RRO應付就是服務強化學習的環境這個環境本贊是一個虛擬的環境但它不是一個比如說物理訪針的環境它更多的是一個數字世界的環境比如說可能是一個虛擬的 DD 網站虛擬的京東的網站虛擬的一個溝污網站虛擬的一個邊城網站虛擬的一個邊城的環境來幫助他們能夠在這個裡頭去不斷的基於一些定好的這些的重工的指標這些定義以及這些考題不斷的基於強化學習去翻聽自己不斷去試錯也不斷去提升自己這個其實是我覺得 AZN 在這個數字世界他們現在所需要的最主要的這個數據的產品那對於這個據深來講的話其實剛才如果所說其實現在還沒有到真正的AZN階段對吧現在其實還是在一個預訊鏈以及在一個評測階段就這兩頭的問題是最大的依舊是沒有足夠的預訊鏈能夠讓這個模型達到一個相對基礎的一個能力一個是沒有足夠好的規模化的評價可以幫助這些大模型商不斷地去衡量他們的基礎能力不斷地提升那在這我在說一個細節就是為什麼 BehaverChallenge 就李飛飛的 BehaverChallenge這件事這麼重要因為其他的這些學術局的Bunchmark 其實這些我們的這些客戶最棒的這些大模型商他們都已經把他們的Bunchmark 可以打爆了據深的Bunchmark 其實比較容易都被打爆了那其實足夠難的是Behaver 那Behaver 100到T 可能現在最高的分數成功率是26% 所以還有一段路要走當然就是說這個更多是一個學術局而對於比方說 In the Street 那麼他們需要的是更加大規模的高質量的 Behaver 來幫他們去挑戰他們就模型的基礎能力那當然在這個兩個電的基礎上其實後訓練就會變得很關鍵就是當預訓練的基礎能力達到一個相對的標準了以後後訓練通過強化學習做後訓練就會變得足夠的重要那麼我被也看到我們的一些客戶在跟我們在基於訪針去做後訓練的強化學習的翻聽這件事那本質上來講這件事就和數字世界的大原模型的AZN 很像那數字世界的大原模型在一個虛擬的網頁端對吧虛擬的編程端去不斷的試錯來做翻聽而這個物理世界的AZN 本質上來講在訪針的環境裡頭去基於定義好的這些成功的指標標準他們以及大規模的場景他們對不斷的去試錯在翻聽自己那只不過就是說這件事我覺得相對於預訓練和評測來說現在可能還是一個刺憂的一個問題其實剛才我們對於整個數據好像做了一個買品那這是很像的我以為想來要送向就數據這個產業它在人工智能的領域裡面它是一個分支它在這個生態裡面大概佔據一個什麼樣的位置我們也來聊聊數據產業的前世今生我覺得數據的產業的發展其實和每一次模型的學習的犯事的發展其實有很相關的這個關係比如說我可以把它定義為最早的時候數據產業可能其實點是李菲菲的Emitry Knight 它是即使一個訓練級它也是一個評測級那它服務的更多的是機器視覺那它提供的是這些照片以及像這些真值的標註那它更多的是一個淨態的一個數據級它給到的都是正確的答案所以在這個時候我覺得數據產業更多的類似與一個填壓式的教育產業那在往後就是到了這個自動駕駛 SKAYO我覺得可能真正開創了一個工業級的數據產業就是從最早的淨態的可能很難去控制時間比方說Emitry Knight確實是有幾年的時間去開發出來的而SKAYO可能真正的可以去工業化的工廠級對吧大規模的人力運營去管控質量管控效率管控交付時間線來去交付這些數據那這個我覺得可能更多是偏一個量範式的一個教育行業在往後我覺得到了這個就是大原模型的這個數據產業這個時候我覺得就是說它的核心的邏輯發生了變化從最早的時候可能是用戶提出需求你來交付對吧然後一個偏工廠行的但還是相對出放性的一個交付變成了一個可能更加的是一個評測驅動型就是幫助客戶發現問題然後去刺激新的需求然後針對性的交付所以這個時候其實比如說從SKAYO給自己的定義來講的話可能從這個時候管他自己就開始教成了DATA方距那就叫類似於是學習台積件的金圓廠這樣一個模式本質上還是一個工廠但是它有更多的流程更多的規範更多的No號更多的Prasize 這些是它的SKAYSAUCE 對吧但是我認為就說在往後我認為的發展其實就會更加不一樣為什麼呢?因為我覺得在這個時候就是說在大園模型RHF評價的時候它還是一個一人位中心比如說Mokor 色質也是一樣都是越來越優秀的人位中心去提供反饋去提供更多的經驗的傳售我認為對於巨生來講的話它所需要的數據量要遠遠大園模型所需要的數據量在這個時候我很難去想像比如說1000倍的SKaleMokor 色質它們可能已經在全球有大幾十萬人可能100萬人這樣規模 1000倍這個規模去提供數據我認為這個事一件很難去規模化也很難高效的一件事情所以我認為在這個時候一定會發生一個轉變就是以人位中心變成以系統為中心這個系統是一個印情它基於可能在端策的不同的人它基於它的訪針它的工程的能力去放大這些人的信號這些人的經驗讓它們來有效的去支持到巨生模型的眼鏡而且我覺得這件事也一定是以一個以評測去動而不是以訓練去動的一件事所以我覺得這個可能是一個數據產業我認為可能以步以步的一個演變剛才我們講到標數據的人或者說收集數據的人它的實心大幅的提升人數有減少嗎人數其實沒有減少這個其實很有意思的一件事其實我最早的時候也想了很多這塊的問題就是說是否有一天要不然就是算法的學習的效率大大的提升要不然就是這個人模型的能力越來越高就會越來越不需要頂尖的人的認知但是當目前為止其實還沒有我覺得這個點上很像最早的時候DipSix出來然後大家說TestTime scaling這件事一旦出來了以後很有可能預訓練或者整體上對英偉大卡的需求量就會大大的降低但是其實大家發現當TestTime scaling出來了以後到刺激了更多的AI應用的需求 AI Agents的需求到反向的增加了這個英偉大卡的需求我覺得很有可能是這樣我覺得一個比較直覺的一件事就是可能越有能力的人他越愛學習他其實每天讀的書的量不是減少而是增加我覺得很有可能後面會是這樣一個情況當然他會增加到一個階段就是說舉一個例子可能AI的模型能力太強了到最後的時候可能這個世界上他已經搭到了一個諾本獎的水平那已經沒有幾個人可以交他了那在這個時候我認為他需要做的就是自我的不斷地提升就跟人一樣哎沒錯我認為他其實會很像人就是說人可能在小的時候可能更多的是看很多的畫本而有老師的延傳生教到後面的時候可能更多是自我的不斷地提升或者說我覺得有很多的這個人他並不是去與別人去對比他是為與自己去對比我每天今天能夠比昨天進步多少我覺得一樣大我地我覺得AI也會到這個階段那在這個階段他真正需要的什麼我覺得他可能需要的是一個環境一個成功的一個標準不斷更新的成功的標準對吧然後基於自己的經驗然後基於RL幫助自己不斷地去提升我覺得他會達到這個階段而這個階段其實也是我認為對於訪針對於合成數據很關鍵的一個階段因為這個時候他永遠需要物理的環境他永遠需要評價的指標這個我覺得會變成他可能到那個時候最需要的事情他需要的是學校老師考試這是這個階段他下一個階段很就是自我學習沒錯對他永遠需要一個環境一個背景一個環境以及相應了這些成功的定義這個數據的產業他摧上哪些關鍵的人和公司首先我覺得李飛飛是真正的定義了 AI數據這件事我覺得他的這個貢獻是極高的那在這個之後我覺得真正工業化我覺得這個SKAYOAI 我覺得是真正的去引領了工業化的這個AI數據的浪潮而且我覺得他其實引領了兩次第一次是自動駕駛他創意的階段其實當時真正整個行業規模化的AI數據的需求就是在自動駕駛他把它作為了一套流程化的產線工廠來真正可以可靠的交付自動駕駛到標註的數據以及後面可能在21年22年的時候記住到了GPT2 記住到了RRAHF 那麼來最早的去服務到了這個大模型的這個數據尤其是後訓練和這個評測的這個數據基於評測驅動的這個數據這個產業我覺得這個是機器關鍵的當然可能還有一些就是在評測驅動的這個數據後來去演變的比如說像Sirge 像Mokor 我覺得這個都是相同的一類的公司你剛才也提到對於Robotics 來說訪真非常的重要你就訪真到底在這個行業裡扮演一個什麼樣的角色你覺得還是一個加速器加速的工具還是一個更底層的東西對我覺得這個問題很好其實這個也是我覺得我從業以來就是做訪真以來我就一直在思考的一件事對那我可以很肯定地說我認為訪真對於機器人他是一個必備條件沒有訪真這件事肯定做不成那我的出發點我覺得更多是在幾塊第一就是說剛才咱們提到了數據必還這個概念我認為就是說機器人的數據必還和自動價值會完全不一樣因為機器人沒有這麼多真正的機器在端策在部署有基於人的示範去拿回來大規模的這些的數據他必須要基於訪真才能夠採回來足夠規模化的數據他是個必須像所以他是一個必須像第二我覺得另外一個我覺得極其的一個必須像就是就不要說在數據上我覺得一個是訪真還有一個是人類的數據我覺得這兩個會是本體無關數據的主要的來源而對於這個評測來說的話我其實想不到除了訪真之外任何一種來源我認為大規模就我提的不是一個小規模的評測比如小規模的評測我可以在實驗試機邊或者在一個場景我去建立一些的樣機實態二十台去做一些的就是算法的推理評測我覺得這是可以的但是我不可能比如說在如果我要去落地加劇場景我同時在一千個家庭甚至可能更多的家庭比如說去評價比如說成千上萬個不同的這個任務隨時拿回來信號同時我可以重複性的去測量比如說我可能就是每天我的算法都會演進那我能不能每天都測量多變來去真正的讓我可以更精緻的知道每一版算法的這個演進這個我認為唯一的方案只有通過訪針對那當然另外一個我覺得很有意思的一個觀察就是我們服務的客戶其實我們最早的時候服務的客戶都是這種強的訪針的比例味那他就是相信合成數據就是相信訪針那他用我們的合成數據去訓練他們的大腦當時會有一些可能最頂級的這個這個訪針來最頂級的大模型團隊他們就是真實流派的他們絕對不願意去嘗試任何的訪針但是其實咱們再看我們過去的可能三個月的時間過去的三個月的時間基本上他們都成為我們的客戶來規模化評測這件事是你們找他們還是他們找你們他們來找我們對所以這個是一個有誰啊這就不方便說對但是這個我覺得是一個很有意思的一個信號就是實話說當時最早的時候我是主動地給他們發了很多的有見那他們說我知道你們是訪針最棒的如果我要做訪針我一定會來找你但是我現在可能還沒有到這個時間點但是可能過去的三個月都來找了我們他們共同意到的問題是什麼他們沒有辦法去規模化他們的評測了這個是他們的核心的問題就是他們認為他們的算法有足夠的足夠好就是他們他們之前都是通過真基數據之前都是通過真基數據或者通過一些訪針的就是評測級就是這些學術級的Benchmark 去打但是在真正印的水其實沒有太大的意義因為他們太簡單了他們不夠規模化比如說可能我們有一些去落地家庭場景的這些的大腦的團隊他們可能跌衣服他們可能做家務已經做得很好那他們希望就是說能夠有一千個不同的家居的場景可以隨時地去評價他們包括這些最關鍵不是場景而是這些任務以及這些評價標準可以幫助他們去隨時地去評價他們自己這個是他們不可能通過真基去獲得的聽上去想要做大腦的內衣波人可能是最早擁抱訪針的對嗎沒錯然後那些就是一開始是從一個場景裡走出來的謝謝您們! 可能是比如說是跌衣服或者是在商超裡讓他們有一個做什麼事情的機器人的公司是比較慢用保防陣的當他們需要放化的時候他需要防陣是這個意思嗎我認為就是說反正有兩種比如說不要傳統的就是這種支持的RL 對吧這種這種防陣那比如說可能全身的就是父胞的肯錯或者Local Motion 就是說如何讓一個人性機器人更有效的去行走讓他能夠站得標稟讓他可以去做一些全身控制的任務這個時候可能這些機器人公司會去很擁抱防陣他們其實是最早用防陣的一批只不過這塊的防陣的需求量標小他可能在一台本地的機器上去跑RL 就可以實現跑三化學習就可以實現而不是一個大規模的需求而我認為對於大規模的需求就會如你所說更多的是這類大模型商大腦公司他們需要去泛化他們需要去規模化他們的數據或者規模化他們的評測在這兩個點上他一定會被一個點至少一個點卡住他一定會用防陣所以他們是最早用抱那批人沒錯你剛才說近三個月開始出現變化的應該是在垂直場緊做機器人的公司也不是就是說大模型團隊其實也會分為一上來就是堅定的訪真派的團隊也會有一些最早的時候就是徵機派我就相信徵機的數據但是可能到了一定階段他會發現我壓軟走不通這件事那我一定要防陣所以我認為就是說過去三個月我們最多的增長我覺得第一是基本上可能所有大模型團隊以及他們的世界模型團隊在這可能就是一個公司可能不只是一個團隊在根本合作可能有VIA的團隊有世界模型團隊都在根本合作因為其實某種層面上可能有很多VIA團隊他們可能在基於世界模型的基礎對吧到這個時候沒準確世界模型團隊用我們可能能夠用得更好對可能VIA用我們的評測世界模型用我們的數據這個是一個我們可能看到的很多的一個現象這三個團隊對數據的需求不一樣嗎不太一樣比如說可能世界模型團隊並不見得一定要去去有那麼強行動的數據對他一定要更好的物理的這種限制對吧這種光定然後他需要有這種可以幫助他們可以更好的去預測在物理世界這個下一件事情的發生但是他並不見得一定要有第一人視角或者第一個機器人的視角在裡頭去與物理去交互的數據而VIA可能更多的是一個行動派他必須得有這種行動的數據那可能是他自己的本體可能是其他的本體跨本體甚至是人的行動的數據所以這個我覺得還會有些的區別但是整體上就是說從評價角度來講他們可能也都很需要訪針因為他們需要在這些足夠物理真實的環境中能夠要不然去確認他們的預測能力足夠準確要不然他們的行動能力可以實現這些不同的任務你知道中國也有很多就是要做機器人大腦的不管是大公司也好還是雙眼公司也好我跟他們交流下來我直觀上感覺好像訪針他要小於軍機台因為他們普遍給出的理由是因為真技數據好方法訪針數據不好方法你覺得為什麼會出現這個現象為什麼在中國的機器人團隊訪針派似乎不多我認為其實幾個點第一就是說我認為這個就是這類公司本張來講他們還是機器人公司機器人公司我就咱們去看他們的商業模式它的底層還是要去賣本體所以如果他要是一個訪針派我就他就很難去來肯定是他的客戶去買他們的本體為什麼他們的客戶其實很多的就是我覺得國內很多的真機派的商業模式還是去賣一個蔬菜中心對吧我買過來用你的機器人來採集數據來採集數據然後來不斷地去提升所以他需要相信真機數據才能賣本體對就是否則我認為就是說他其實我就本身上來講還是一個屁股決定腦袋的事情我覺得他需要去真正的提倡一個真機派才能夠更有效的去把這些機於真機數彩這樣一個商業模式去跑通當然其實提到真機數彩我認為真機數彩一定是需要的我並不否認真機數彩而且我人現在的量也是需要的我認為他在增長時辨可能這個量也是必須的但是關鍵就看他會增長到什麼一個階段我覺得根據數據進行其實最小的量應該是真機的10超的機器人的本體的數據真機數據沒錯他的成本最貴他的成本最貴但是最關鍵的是他最難規模化他都不是成本的事比如說你怎麼去進入到不同的場景很快速的去規模化這件事這個是很難的一件事你如何去換新的場景很多我覺得大部分的真機的數彩現在如果你去他們的數彩中心你會看到他們他們也在用訪真怎麼去利益他在用現實世界的訪真他拿的是一個假的香蕉他拿的是一個假的蘋果他並不是拿的是一個真的香蕉一個真的蘋果他的場景可能變換很小可能都是在這個桌面級可能或者說一些一家的這種的方式的搭建他很難像訪真一樣去規模化到可能更加廣闊的多變的足夠物理真實的這些場景的應用所以我覺得這個是一個我覺得就核心的一個不同點另外其實從我們的角度我認為就是說真機派真正在做預訓練級的大模型其實我也聽了就是談接的那一期我不要同意談就談接著看法就是說我覺得可能不太合理就是說純粹地做一個巨深的大模型他一定是基於一個機座的對吧那在這個時候我認為就是說更應該是一個大模型公司來去基於他們機座的能力再基於更多的數據先是預訓練再是後訓練來做出更好的標A來所以我覺得從這個點上我覺得可能機器人公司可能也沒有多少機器人公司真正在做這件事就真正在做一個預訓練級的一個大模型所以他需要的數據可能就沒有那麼多他需要的數據沒有那麼多談接說的一個觀點我印象很深因為我也是跟他說就是國內偵機派或者說偵機數據有更好的放花性他說訪針數據帶來的是心情rear的問題不是放話的問題放話的問題應該通過深圳極大量的訪針數據來解決對你同意他這個觀點嗎我是同意的說到這裡我們定義一下訪針吧因為訪針的定義現在也是模糊的以前可能是說的是物理訪針現在也把一部分的視頻深圳認為是訪針你怎麼定義訪針我其實還是希望更加嚴格的去定義一下那麼我認為訪針的話我認為他更多的是需要在一個足夠物理準確的一個環境中可以可負現的就以及可以可修正的去產生相應的行動並且觀測到其結果我認為這個才需要是一個訪針那我當然解釋一下就是說物理準確就是說他的環境以及你所交互的這些物體我認為他們需要足夠的與真實世界的物理去對標那這個對標不只是一個看起來像不只是一個在幾合上向他的可能摩擦力他的可能更多的這些物理參數也要足夠的去對起這是第一第二可負現就是說假如說我去跑100變訪針我有一個足夠高的一個系數不見得一定是100 可能是95 99 我的這個結果是相同的我覺得這個是很關鍵的一件事另外一個就是說當我去在我相同的環境相同的其實點改變我的行動我可以看到可能所改變的這個結果我覺得這幾個點都是足夠需要的那咱們再看一下視頻模型視頻模型我認為就是說他可能更多的是一個對下一針的一個預測他可以看到一些我覺得世界的變換對吧但是一他可能很難去負現他可能很難去負現那如果很難去負現我就很難去做大規模的可靠的評測第二就是說他沒有行動他很難有足夠準確的行動那這個點我也很難去要不然就做評測要不然就產生數據對第三就是說當我改變了一些在出示狀態的條件的時候他是否可以產生其他的這些行動這個也是很難的一件事所以我覺得普遍的視頻模型現在還不能衝置為防徵當然就是我認為世界模型是有機會真正的成為防徵的一類的世界模型成為防徵的一類對那麼怎麼去理解這件事就是說我人世界模型他的底層其實是一個生成模型所以他的優勢是可以更加廣泛的生成相對真實沒有我覺得沒有防徵的物理真實真實但是相對真實這樣的對於世界的預測甚至是我認為後面接觸了機器人對於下一步的本體的行動我覺得這個是可行的這件事在未來的可能一段時間是可行的但是我認為訪針和世界模型我認為他們並不是一個誰會取代誰的一個關係我認為他們兩者更多的會是一個共生的一個關係怎麼去理解這件事比如說我們其實服務的客戶有可能有一個很大比例都是世界模型的客戶其實世界模型的客戶他們為了他們的預測能力逐步的去提升就物理的光電能力逐步的去提升他需要有更好的物理的數據來幫助他們去提升對吧他需要有更加真實的物理他需要有更加踢進人的行為的行動來幫助他們去提升所以在這的話其實訪針會去幫助他們另外一方面其實由於世界模型他可能具備更好的一個生長能力所以他又可以幫助訪針的數據幫助的訪針的結果去做更好的一個範畫或者說用訪針基於世界模型去做更好的一個光電良者結合有更加準確的生長式的一個輸出那從我們的角度我們可能過去幾個月我們和我們的世界模型的客戶可能越來越多的形成一個共生的一個關係共生的一個關係就是說他們在用我們的數據我們在用他們的模型良者一塊能夠把這件事做得更大我覺得這個可能是一個後面就是說訪針世界模型他們良者相互的一個關係我聽起來訪針世界模型一種手段我覺得其實很難說誰是誰的一個手段我覺得訪針並不是世界模型的一個自己或者世界模型也不是訪針的一個自己我覺得他們倆可能應該是共同去達到更大的一件事情這件事就是為了智能去提供更好的學習的能力現在這三個團隊每一個團隊都跟你們合作最多世界模型不要A和LM 我覺得世界模型合作要合作更多而是因為你們做的是肉包庭相關的事件沒錯因為我們更多的還是關注在一個物理的環境立透一個行動的經驗以及相應的這些評價的準則在這我覺得我們做的相對表少的是表說一個數字化的一個環境就是LM就這一些世界模型和標誼會相互突定嗎我覺得他們其實在短期是一個很共生我覺得相互依賴的一個關係我覺得將來我覺得有可能在有一天良者可能會合而唯一但是其實本質上來講我覺得可能在很長的一段時間我覺得他們兩者都是相互依賴的一個關係我們能不能把Robotics這個行業對標以前智能駕駛來想因為以前在宗駕是維貿和特斯拉之爭也延續了很長時間今天的這些Robotics大腦公司似乎都在走維貿那條路但是今天來看好像特斯拉成為一個更主流的路線當然維貿也做得很好你是怎麼看待這個問題的以及你覺得基金人領域的維貿和特斯拉是誰你為什麼覺得現在可能大腦公司更想維貿這條路因為他們不清本體收集很多的數據感覺基金人公司更像特斯拉啊李靖你意思我可能觀察到的情況就是說我先說一下就是我覺得可能這件事會跟自動駕駛很不一樣就是我人家可能不見得會follow特斯拉或者follow微貿我覺得這個原因就是說剛才我提到的他的底層的數據裸計如果底層的數據裸計是基於一個基於本體的數據幣幻作為90%90%以上的數據量那麼我認為他一定會follow要不然就是特斯拉要不然就是微貿的裸計那麼我覺得那麼在一個相對更垂直的場景裡在做這個事情沒錯相對更垂直的場景且他們的智能相對有限就是我覺得自動駕駛的智能還是相對有限的他更多是一個端策的模型端策的模型然後他的任務其實比較單一對吧就是把車開好了對比如說他遇到這樣一個杯子他的反應就是我要避開他但是在基於人領域他需要根據這個杯子是什麼材質他是一個多大的杯子然後來決定他的手的力度所以他的伏達系數也更高沒錯就是他的就是場景更加單一他的唯一的物理就是車和地面的物理他不希望去撞到任何的東西對所以就是說我認為他的智能水平低一些對就他的智能水平會低一些當然我認為有兩種方式去解決自動駕駛問題一種方式就是不是表 A 就是直接 VA VA 是 VA 的下一代我覺得不是就 VA 我覺得就共多就行動輸出他其實其實他錄對我覺得他其實更多是因為我在端策上可能算裡面有那麼大對吧且有可能就是說這件事所需要的智能是相對有限的且就是說我有足夠的數據了以後我可以基於模仿學習把模型壓到就是更加踢進於司機的行為上就夠了對吧那很有可能 VA有可能就是這件事的終局這是有可能的一件事但是還有一種方式就是說我做一個更加通用的 VA 我再讓他去開車這件事一定也是可行的將來對吧所以我的意思就是說自動駕駛這件事我覺得他的一個我其實沒有太想清楚的一個點就是會不會有兩條路線都能通一條路線就是由於他的智能上線沒有那麼高因此 VA 有通用了對吧還有一條路線就是我做這個 VA 他也能做但是這個 VA有可能他還能做其他的事我覺得這兩條路徑有可能都是成的對沒有了語言在 VA沒有語言你覺得他的智能水平肯定是會降低的他的智能水平會大大的降低那當然這個我就是從智能的角度從學習犯事的角度去討論那另外一方面我覺得從數據的角度一樣就是說可能自動駕駛本質上來講還是去用模仿學習最大量的模仿學習少量的強化學習去把它智能供出來那他所需要的數據更多的還是本體相關的車直接開回來的數據而對於巨生來講的話一定是走的是本體無關的數據的路線本體相關的這些數據的量真正的機器人在端錯落地量會相對來說很少那在這樣一個情況下的話我覺得可能就是最後出來的就是說不太會存在特斯拉因為如果真是特斯拉的話如果真是特斯拉模式的話它的大腦其實可能不是特斯拉做的可能是XAI做的所以我的意思就是說我覺得在這可能他也是一個大公司兩層的他其實是兩個不同的公司所以我覺得可能就是說最後可能會有三種模式微模模式現在的特斯拉在特斯拉公司內部的模式還有一種模式是馬斯克體系內的模式就是他一個是做本體的公司一個是做大腦的公司那麼這個如果說咱們放到這個其他公司裡好可能就是地賣做一個大腦然後可能就本體上用這個大腦去落地我覺得很有可能是這條路線除了馬斯克和Google 你覺得還有誰能支持這件事情都做你的意思就是自動架式和這個巨神智腦不是大腦和機器人我覺得美國可能比較少一些我覺得國內的話我覺得小米我覺得有可能對但是整體上來講我覺得這件事還是比較難的一件事小彭和李翔呢他們的現在的站位是一個智能架式車旗我認為這件事他的底層還是卡得數量因為本質上來講如果要做這件事就有點類隨意說你的前提就是你需要有世界模型的團隊和能力你可能已經有一個全世界可能最好的世界模型了然後又基於這個同時再去做標A這件事那我覺得他的卡的數量可能會比較高需要多少我們可能在服務的客戶的卡可能都是大幾萬張現在這個機別在做這件事但我覺得就國內的這些這些歐元牌是有很大機會的創業公司呢創業公司我覺得很難去做大腦我覺得從我的小度我就不太合理去做大腦這件事你看智能架式的智能水平你覺得不夠高相對於那個統一的大腦來說那有沒有可能機器人是這樣一個一個垂淚場景去解決我就基於某一個垂淚場景收集很多的徵機數據然後把這個場景訊號就像今天的智能架式一樣這可能會不會是一個更快的路徑統一的大腦會不會太遠了對我覺得一定會存在這個路徑其實這個路徑在我看來更加像微夢這個路徑像微夢對因為我覺得它其實更多的是在一個偏限定的就是非凤化的一個區域對吧然後把一件事給它做好我還記得就是我當時剛加入Cruise的時候我們的重心就是在舊金山去落地自動架式做完了以後再去想第二個城市所以其實我認為這種方式就很像當年的微夢Cruise 它要花很長的時間在第一個場景完全落地落完了以後它去翻化這件事擴大這個就是長年的視佩性可能會比較難對其實你看現在我覺得微夢確實是做得很好但是我覺得特斯拉可能在這兒 Scalability就是在規模向性上可能會做得更好很多對所以在我看來就是說我覺得如果從這樣一個方式從一個相對詞語的場景去做首先這個場景可能會分為就是一兩個特定的場景現在把它做好然後再把這個場景的其他的特定場景給做通這個就要花很長的一個時間在這個之後再去平行得到其他場景這件事我覺得可能就要上進動骨因為它的整個模型的價格數據各方面可能都是不一樣的對那這樣的話我覺得有點類似於是當年的自動就是我認為這款也會有成功的案例比如說自動駕駛其實你看現在在國內我覺得做得很好的比如說有礦山的自動駕駛它就關注在一個詞語它把這個詞語完全地做好在這個詞語它有比較好的一個商業模式以及相應了一個壁壘我認為這個是一個很成功的案例對那當然這個案例我就說它可能很難去清到其他的場景去所以你不認可我說到現在大腦公司像微某然後機器人公司像特斯拉的這個判斷對吧對我就是我認為大腦公司的話應該更像 Open Eye後面對就是我覺得自動駕駛本質上來講它還是一個沒有那麼高智能的事我認為就是說咱們要去看巨身的話要同時去對標大園模型和自動駕駛就是我覺得巨身可能是良者的一個結合這個很有特斯拉嗎有巨身領域的特斯拉嗎我覺得可能 Figure是希望成為巨身領域的特斯拉對吧它有它自己的這個硬件它在規模它的缺量產它在落地同時它也在做自己的大腦但是還很遠它這個因為還是場景實在是太模糊了對我就我覺得難度還是很高的我覺得現在我越來越多的觀察就是我覺得我可能會更早地看到大模型的這個放化能力的產生而我認為就是說可能很多人低窟了在一個垂躇場景落地的難度以及一旦落地了以後再去遷到其他垂躇難就遷就更難對因為我是實實在在的經歷過 Cruise微墨當時自動駕駛的這一波那麼我覺得就是說首先在一個垂躇場景沒有再究竟是山去落地其實已經很難了這個問題那當然就是一旦好了以後你知道其他的這些城市其實每一個城市你可能都要有更多的數據去踩積去訓練以及去大規模的去評測來真正保證你在這個城市能夠足夠安全地去落地這件事它不是一個很方法性強的事但是比如說特斯拉他可能他一開始就開始收集數據沒錯它是一個就更加廣泛的一個數據的踩積真正能夠把這時候給做同但機器人可能這麼廣泛數據踩積的場景更難一些所以一定要依賴訪證你的邏輯室訪證和人類數據一來本體無關的數據我人這件事會極其關鍵就是如果沒有這件事如果沒有巨身的精彈的下面的訪證和人類數據我認為就是巨身這件事的通知能就出來了說到這個數據精子塔我們來聊聊這個精子塔的構成以及它對於每類數據的收集上有什麼能喝對數據精塔其實是非非的學生就是朱鵰克教授他提出的一個概念他本質上來講的就是去分析巨身智能的數據跟自動價是不一樣他最多的肯定不是基於自己的本體產生的數據因為沒有足夠規模化的本體的數據更多的要一來於訪證和互聯網以及人類數據那麼精彈的包括三塊最上面是真實的本體採集的數據也就是咱們現在可能最多的看到的真實機器人的搖操作的數據這個數據一定是最準確的最好用的但是這個數據的問題是他很難去規模化他很難去規模化機器人很難去規模化場景中間層是訪證產生的數據對訪證產生的數據他的優勢就是說他的規模化能夠做得很好當然他也會遇到心土壘的問題當然其實現在由於客戶都是大模型他們在預訓練機段會用很大量的訪證的數據以及真實的數據其實這個模型的通用的能力會變得很強其實心土壘就是訪證和真實蓋不得這個問題變得越來越小對這個是中間的訪證的數據在網下就是互聯網的數據還有人類的視頻的數據人類的視頻的數據其實更多的是人的低人視角的數據可能是人帶著眼鏡然後去採集的數據咱們其實去看過去的幾個月的時間我覺得在本體無關的數據訪證和人類的數據我覺得產生了一個制的突破我其實認為現在已經達到了一個Skilling Law 就是巨深的一個數據的一個Skilling Law 為什麼這麼少去說呢咱們去看一個是我覺得李菲菲的這個Behaver Challenge 包括這個因為大家的Groot這個模型用到了大量的訪證的數據證明了他的有效性另外就是說Janalyst 他用了27萬小時到5米加轉的這個數據 5米加轉其實本身來講也是人兩個手就拿著這個加轉去採集的數據他其實也是人類數據的一種那他更多的是一個標簡單的一個加轉形態那再往後其實就是手指形態的數據沒錯那他們已經證明就是說27萬小時數據在模型上看到了Skilling Law 對那麼我覺得由於這幾個點其實從我們的實在的觀察上從我們的客戶給我們帶來的需求上過去幾個月可能是一個制的一個飛躍就是對於這個數據量的需求是一個可能極大的一個增加讓我們可能原來的時候是一個我們就是我們需要去刺激需求到現在我們可能是要去規模化我們的團隊來真正的交付客戶的需求這樣一個階段對那當然就是說在這我可能在分享一些更多的想法我覺得金塔其實並不是一個很單純的就是三層就是真實數據反正數據然後這個人類數據它其實每一個階段就是每一層都要去細分我舉一個例子從反正數據層可能最往上這一層可能是一個人趣趣的反正數據因為它從RI角度很貼近於真實數據層它是它的優勢是它不需要去基於機器人的本體對吧它另外就是說它還是用人這樣能夠踩級到最高質量的數據但是它的問題就是它有規模化能力相對來說欠缺對吧那往下其實就是更多是一個算法驅動的模型驅動的自動化財經層這個可能人的記住就相對來說很少它能夠保證的是它的規模化但是它的質量就不會比上層更高對吧咱們再往下去看就是說人類數據層也一樣可能也會包括比方說被動採集的人類數據層就是說人可能帶著一些眼鏡對吧然後沒有很好的一個質量管控測試拿到了很多的人的第一人視角的數據也會包括可能主動採集的這個數據層可能有更加高質量的硬件更加高質量的流程的管控但是它的規模性會差一些我覺得這個可能是一個數據進行它的構成對那當然還有另外一個點就是說我其實某種層面上覺得數據層給人的一種印象是它是一個很獨立的狀態就是真實訪真或者往人類是一個相對比方的獨立的一個概念從我們的實踐中我越來越認為數據層它可能會是一個就是以訪真為中心的一個避緩以訪真為人是中間那次對就怎麼去理解這件事就是說如果真要把訪真的評測做好因為評測這件事必須要基於訪人去規模化那它必須要拿來最大量的足夠真實的場景物理的世界人的這些的軌跡經驗同時還有我覺得很關鍵的評價的標準就是不同任務的評價的標準這件事在訪真中避門造出是很難出來的那其實需要去拿到更多的真實的數據所以這個其實也是為什麼我們現在開始去做人類數據的原因人類數據就是人類的視頻的數據你剛說是以人類為低視角的數據沒錯以人類為低視角因為其實咱們可以把人機器人我覺得大模型很關注的一個能力就是跨本體的能力如果從這個角度來講的話人是不是也是一個機器人所以本質上來講這種訓練犯事它其實就是把人當成一個機器人把他的數據拿回來堆進去一塊去訓練另外還有一個點就是說相當於把人當車了對把把人當車沒錯完全就完全是這個意思另外如果這樣沒準將來機器人越來越像人因為它越像人它的本體和人的差距就會越小所以我覺得這個是人的低視角的數據的一個核心的一個點當然就是說這個數據回來了以後其實可以基於RiotoSim 很多的這個算法訪真的能力把這個世界拿回來把他所交互的這些物理拿回來以及把他們的很多的任務以及評價標準拿回來又把這些真正的加入到訪真裡頭去來擴充訪真的規模化對吧另外一個呢就這個是一個從真實到訪真裡的一個環從訪真到真實就是說訪真做完了以後一定需要在真實世界去落地那麼SimTorough如何去解決一方面來講是在預訓練加入更多的訪真一方面其實是把他和真實世界做更好的對標對吧那其實所以就是說真實的謠操作的數據真實謠操作的評測和訪真的對標就會變得又為重要對吧不只是在訓練端的對標同時還有在這個評測端的對標來真正的可以讓SimTorough 不只可以服務訓練也可以服務評測所以從這個角度來講的話我認為可能數據訓練一方面他是一個精塔他是一個分層的精塔另外一方面我認為他可能是以一個以訪真為中心的以評測驅動為中心的數據的一個必環所以你覺得哪些數據是被高過了那些數據是被低過了對首先我認為真實的七七人的數據肯定是被高過了我認為其實咱們從過去幾個月真正行業的發展來看我覺得其實大多數人都已經看到了這個點就是可能原來就是真擊派的這些的公司或大模型團隊其實現在我認為大規模的去採購訪真的數據訪真的評測或者是人類的數據所以我覺得第一他肯定是被高過了第二我覺得訪真還是在被低過為什麼呢因為我覺得大家已經看到了一些訪真數據的這樣的一個能力但是我認為就是說訪真的評測我認為其實真正看到他的沒有那麼多人我覺得大模型團隊是完全看到為什麼因為他們在關注的是大規模的評測沒有訪真他就沒有辦法做大規模評測而我認為很多的機器人公司可能現在還是在開始去看到這個階段為什麼因為他的規模還沒有那麼大那當他的規模越來越大他需要去處理的任務數量任務種位開放場景越來越多他就會越來越感覺到這個通點沒有他是繞不開放生這件事的另外我覺得人類的數據其實相對來說也是被低估的我認為其實人類的數據也是機器關鍵的一件事當然我認為他是要去從我們角度我認為他可以幫助我們真正的去完善和補充增強我們以訪真為中心的這條款真的眼睛停下來非常有用是那眼睛就相當於是車所有人都出去給機器人收集數據去了是的我很同意這個點我認為其實是人類數據他的一個問題就是他其實沒有什麼比雷我看到很多人在做人類數據的硬件但是其實本質上來講人類數據他的底層就是要讓人帶上消費級的硬件去採集數據一定是要眼睛看嗎第一是要眼睛看比如說有我看有硬件公司做一個像Plaude做錄音筆像比如說還有公司做了一個凶錢的明白這種事人類第一是老數據嗎從第一線原理上來講你越提醒人的視角是越好的對就是說其實你的一個硬件如果本來是定在頭上定在頭點上或者放在胸口你其實人的視角跟人的眼睛的視角都有一個差距的所以本質上來講這個都會產生一段問題為什麼一定要是眼睛我覺得可能更多的是從一個低性原理就是說有人是這麼工作的就人就是這麼要工作的對那麼這個其實也是我覺得看到的很多的真正的需求我覺得都是朝這個方向去走的對那你從這個角度去看的話其實到最後的時候一定需要的是一個最佳規模化的我覺得消費級別的足夠舒適的可傳代來真正的服務人類數據的我覺得端策的硬件怎麼讓人願意大規模帶上眼鏡如果不是鏡石或者像我這樣我是鏡石但是我就想帶你印象我覺得離向狀態下人就喜歡帶這個眼鏡而不是人為了數據是帶這個眼鏡我覺得這個可能才是真正的人類數據需要是達到的這個點我舉一個例子比如說 MITA的這個 Ribbine的這個眼鏡對吧他們其實就改變他們的思路他們最早的時候可能是希望做遊戲眼鏡對吧然後做得很旋但是看起來不夠好看我覺得MITA的Ribbine的眼鏡我覺得它特別特別聰明的一個點就是它首先這是一個很酷的眼鏡看上去很好眼鏡其次它有一個AI的助手可以跟你去對話對吧它有一個上頭我認為這種的可傳代可能在場線是最有用的就是這個可傳代是一個大家都已經有的東西而不是一個你需要去買給大家的東西所以這些公司首先需要設計一個足夠有心理的眼鏡讓我們都心甘情的戴上然後它再利用我們去給它機器人收集數據是這個道理但是你如果是你這個走出去想的話我覺得就是說前提就是一定要基於一個消費機的就相當於就是說我認為人類數據的公司不應該做自己的用件如果因為它的這個硬件很難達到一個消費機消費機我值得可能是一個百萬甚至更大的一個出貨量大家都喜愛這個眼鏡所以我認為它應該是一個基於一有的消費機的硬件或者說這個硬件如果沒出來有一個消費機的硬件的公司做了一個報款出來大家都戴上了這個是一個真正的一個報點那它為什麼要把數據給機器人訓練大黨的公司我認為在這的話它會有一個就是不同的這個硬件其實都有相應的SDK API APP 對吧所以其實你可以去設計這樣的一個採取流程的我們都知道算力很貴因為我們說驅動人工智能三加碼車是算力算法和數據算力非常貴數據貴嗎想要買比如說訪任數據會人類第一史的數據大概是一個什麼樣的金額數據其實我人家在越來越貴這個是很有意思的一個點就是說可能很多的人認為數據應該越來越便宜我其實覺得這個就是本質上來講就是就數據不同的就剛才我提到的就數據不同的階段可能從一個靜態的數據級或者是一個量泛級的數據到一個提供反饋的數據它的這個給算法帶來的價值是完全不一樣的因此它所可以去拿到的這個價格也是完全不同的對那當然就是說我認為就是說咱們去從預訊鏈後訊鏈還有評測角度去看的話我認為可能預訊的數據數據應該是最便宜的且它應該是一個相對的標品對吧因為我覺得不太可能有一家公司自己去支付所有預訊鏈級的費用它應該是一個平攤對吧比如說可能全世界有五家大模型公司去平攤了這份預訊鏈的這份的數據的成本而且大家都願意去平攤因為這個應該是一個相對幫助大家提升一個相對通用那個能力基礎的能力最關鍵的這些反饋驅動的這些的提升還是在後訊鏈和評測而後訊鏈和評測的可能是一個更加針對性的數據它更多是一個評測驅動來給到足夠的信號以及相對這些經驗的傳授它的數據的價值和價格會更高很多大概多少錢其實這個不太好說就是說現在可能比如說從一個數據角度來講可能一小時從幾十人民幣到上千人民幣可能都會有但是它就是標數據的專家什麼階級數據的專家不止它包括了比方說這個就數據我覺得它巨深的數據然後就它包括了三藥素第一是它包括了一個物理的場景無論是真實的還是訪真的它一定要有一個場景第二就是說它包括了這些經驗的軌跡以及這些經驗的傳授經驗的傳授就包括了這些語言的標註第三就是說它包括了這些評價的指標比如說這個是成功這次失敗它可能會標得更加精細比如說比Heavy的數據級可能我做一個Pizza 可能是一個很長長的任務我裡頭可能有的比較小的任務我可能先失敗了比如說我可能先放一個模固我先失敗了我第二次又成功了這個都會標出來對那這些在一起結構化它是一個數據那一小時這樣一個表說就是做Pizza的數據可能會賣到可能比方說從幾世人民幣到幾千人民幣不懂現在這個是一個我覺得現在整個行業還是一個比較發散的一個階段那當然了就是說我們很關注的是高質量的數據因為在這其實低質量數據沒有任何意義高質量的數據我覺得其實是在一個幾百人民幣到上千人民幣這樣的一個階段什麼是高質量的數據高質量的數據我認為就是幾個點依據說這個物語的長徑它足夠的多樣化它的交互足夠的真實且它足夠的符合真實的物理的長徑第二的話就是說這個軌跡的這個基礎足夠的專業對然後表說做一個Pizza 對吧它是足夠流暢它可能有食物但是食物裡它有一個修正其實這類的數據會更軌就是其實跟很散之爵就是大家可能認為一個這個完美的做屁股的一個視頻可能是會最貴但其實不是其實你如果中間比如說掉了幾例這個菜然後給他撿回來再重新把這可以做好他會更貴其實我覺得有點歷史於人的學習人的經驗對吧失敗了以後在成功的經驗往往是最飽貴的然後第三就是說我覺得他的這些評價指標以及他的這些標柱足夠的這些準確尤其是這些長程的任務其實在這款是很難的一件事他需要很大規模的自動化的模型驅動的算法來真正的幫他去精細化的做好包括可能如果說是人類數據都還手這個全身的這些的拆聽這些的真實度這些的準確性是極其關鍵的一件事情比如說什麼樣的數據是好數據比如說電影的數據會是好數據嗎遊戲的數據會是好問題就是我們這些日常見到的哪些視頻可能會是一好數據我覺得其實遊戲的數據我覺得電影的數據都會有用的但是指播就是說咱們從數據經查小說來講的話數據經查其實我覺得一個點告訴大家就是任何的數據都會是有用的但更多的考慮的是一個RI 就是成本收益比對那麼我舉個例子就說電影的數據視頻的數據很有可能是能夠幫助模型提升的但是他的問題就是我可能我的處理成本也會比較高且我模型提升的點數會相對比較低一些所以可能就是說我去消耗大量的算力去處理的這些數據然後去壓縮的這些數據但是在智能上我的體現相對來說會差一些那我認為其實從一個RI角度來講的話我覺得最高的還是一個基於訪針可能有人在緩但是是算法驅動去踩一些的數據或者是一個人類的數據我覺得這兩個可能是目前我看到的在預訊難階段我覺得RI最高的數據為什麼電影的數據遊戲的數據處理難度很高我覺得他一方面他會有一些比方說你可能會增加更多的標註另外他的問題就是說他還不是一個3D的形式他本質上是一個2D的形式那遊戲有可能是3D 但是遊戲他可能就是說他有點太CrossDome 就是他可能是一個跟這個真實世界太不一樣的一個場景他的物理其實不真實的對吧所以他有一個別的世界觀沒錯但是這類數據其實對於世界模型是有用的比如說其實很多的世界模型的團隊就用了大量的遊戲就是玩遊戲的數據他們有相應的這些的團隊在買相應的這些遊戲的版權然後用他們的AGENDS在老去打然後把數據拿過來來訓練他們的世界模型但是這件事怎麼說他是有用的但他的效用性到底多高沒有那麼高從一個我覺得提供數據的角度來講應該追求的是一個高RI價值的客戶的需求就是說數據台我覺得很大其實在裡頭並不需要每一個都去服務但是可能服務應該是最高價值鏈的東西那你們內部會有很多的數據給他不同的定價嗎會有對但是這樣就是說整體上來講其實沒有那麼的負責我們可能整體上來講更多的是兩類一類是預選鏈對吧一類是評測的數據這兩個其實是現在大家最缺乏的數據因為很多人叫你們叫Data Factory嗎就是數字的工廠你們帶我們走進這個數字的工廠內部你們的工作流程是什麼大概人員是怎麼樣構成的就比如說剛才我們說數據標誌的人這是一個職業嗎對我的問題很好我這首先可能我就是我們可能更像是一個Data安整或者說我更希望把它定位成一個Data安整就是它是一個Data Factory是一個舊定義對 Data Factory我就它是一個有點偏工廠就是它是一個流水線流水線缺發線的技術缺發線的系統且它不是一個反饋驅動的它不是一個評測反饋驅動的我們因為Data安整是一個反饋驅動的一個學習的引擎那麼他們更多是基於一個系統以工廠以系統能力利用到端策的這個人去幫助他們去生成的數據在這樣一個情況下就是說我舉例子其實可能大家看到的是我們生產的數據但是其實我們的內盒是一個全戰我們首先為了去打造這個物理足夠真實的世界我們需要用到訪針這個訪針我們需要去構建足夠真實的物理的世界以及這些可交互的這些足夠真實的物理的資產這個其實地層是很難的一件事打造不要說剛提的這些資產是比較簡單的但打造非剛提不要說打造這個線欄其實我們服的很多工業化的場景需要線欄插拔的場景這個是很難的一件事那它需要地藏的自演的物理的集團器是一個非剛提的集團器以及訪針的這個資產的這個扣抵站就是連條來真正幫助他們去產生同時的話這裡合的物理該怎麼辦這套的物理需要從真實的世界物理來所以我們其實有一個物理的測量工廠這個測量的工廠基於足夠自動化的機械幣等等之類的工具鏈來自動化的去這個世界上的不同的真實的物理的資產去做交互把他們的力學信心拿回來又把它相對自動化的去放到這個訪針的資產和這個世界上去所以這些都是我們為了去生產一個一個訪針的足夠真實的物理的世界和可交互的物理的世界做出的這個系統在這個基礎上我剛才提到有兩類訪針的數據以類是一個以人為去動的它的優勢就是說它的數據的質量是最高的它提供的是最好的示範它的問題就是說它規模換能力相對欠缺一些在這個陸鏡上我們有很優質的這些比如說搖操作的工具鏈有些類似你看到人在去搖操作一個真實世界的機器人我們有人在搖操作訪針實際的機器人不同形態的機器人甚至我們自己定義的機器人它可能跟每個機器都不一樣但是它是一個足夠標準化的一個形體來去採集各種各樣的機器人的本體的數據示範的數據來拿回來同時我們也基於這條的陸鏡去訓練出來了足夠好的自動化的這個算法可以基於這套算法去自動化的去在這個方向去做採集偶爾需要人為的介入所以這個是一個更加規模化的數據產生的這個貫線在這兩個基礎上再往後就是標注那可能就是說它有更多的預計的標注在這用到了很多大模型的能力以及最後可能有一個人在環的一個制檢來真正保證這個數據它是在它的質量上是足夠高的所以這個可能是一個我們真正產生數據的一個基礎那當然就是說剛才我也提到了評測也是需要被規模化的所以你可以理解評測其實也是一條數據貫線那它呢其實點就是說它會其實基於我們機於人趣就是基於人趣採集的這條的這個鏈錄這條的這個端策的這些硬件以及雲上的這些自動化的這些算法拿回來這些數據然後再去做Rotus Sim 那可能包括這個把視頻裡頭的這些物理給重建把視頻裡頭這些任務相對自動化的去提取出來以及這些評測標準提取出來把這些放入我們訪針的資產場景、世界以及這個任務的定義頭去讓它更加規模化的去產生一套就評測的這套的數據鏈來讓它去服務的客戶你剛才已經說評測數據非常的重要那你們怎麼做的對我認為評測的數據它的最大的難點就是1 它需要很有挑戰 2.它需要很可貴模化就要難也要可貴模化沒錯這個是很難的我舉個例子可能比方說很多的機器人工資他們在做Demo 他們可能比方說跌衣服對吧等等他們可能更多是在一個相對固定的一個場景去做相對單一的任務但是對於大模型的氛化能力可能他們需要就是說真正的在很大規模的場景跳去可能簽即別至少這樣的場景跳去可能有很大規模的任務這個任務可能是一個簽甚至是萬規模這樣一個任務然後有相對的這些成功的定義來幫助他們真正的去評價這個時候我覺得第一就是說如何去打造這些平行的世界這些平行的世界的相應的這些物理這些其實跟它我已經簡單講過就是對於訪針對於真實到訪訪針這樣一個一個一個一個一個展現那不要難的是它和這些任務以及這些評價標準這些我們是從真實世界來的我們這個是極其關鍵的一件事就是說如果如果訪針的評價與真實世界的評價去脫離那這件事就算可以規模化它也沒有辦法真正的產生實質的價值另外一個點就是說可能大家認為我們是一個以訪針為中心的公司所以我們只做訪針其實不是這樣我們還有一套真實評測的基金比如說我朋友真實的機器人然後我沒有就真實的這些就評價的算法這些場景他們的目的不是為了去服務的客戶去評價他們的機器人在真實場景而他們目的是為了去與我們的訪針的更大規模的這套的供給鏈這套產線以及這些評測的難題去對標比如說我們用相同的算法在訪針裡頭和在真實裡頭我們是否可以看到一個相關性的對應這個是很關鍵的一件事我覺得只有把這些也做好才真正的能夠把以訪針為中心的規模化的訪針的評測可以做好沒有多少人整個團隊嘛我們現在可能全職的更多的是工程技術方向就有可能100來個同學大概是這樣就我不太認為 AI會自己為自己完成就上成數據然後就服務自己這件事底層邏輯是不同的因為它就更像是一個用動機所以本質上來講我覺得一個核心事一你是不是拿到我足夠準確的世界對吧已經足夠準確的任務二你需要有人在這裡頭的一個經驗的示範這個是一個核心的能夠幫助模型去提升的一個人質那當然就是說我覺得很關鍵的一個點就是你如何去放大這個示範對吧如果你是一個以人為中心的數據公司那你可能需要的是我認為可能需要的是千萬到一這個量級的人最終才能把這些做成因為這款需要的量太大但是如果你是以一個以訪真為中心以系統為中心的那你其實在這兒有一個放大效應因為你是通過技術去放大人產生的這套的這個經驗那我認為這款可能需要的這個量會小100倍左右上次我記得彈劫說就是 data factory 有問題就是你們採取了很多數據但是比如說給它提供數據的以後就是想給這種大腦公司提供的數據以後它也不能告訴你們這個數據好然後最後就會出現撤皮就是數據公司說我是你們模型沒訊號然後模型公司說是你們數據採的不行就是一個撤皮的過程你怎麼看這個問題怎麼辦對我認為這是一個客觀存的問題但是其實我想舉一個例子就是咱們去看 SKale AI和OpenAI在GPT2 其實是一樣的一個階段這個階段其實就是說大家其實在共同的找尋這個數據的配方它其實大方向已經身體比較明確了比如說訪針比如說人類數據比如說訪針的評測但是它在細節上可能會有一些區別我舉一個例子比如說我們就實實在遇到最早的時候可能客戶給我們的需求是要完美的數據後面可能更加希望是富陽本或者就是糾錯的數據另外就是說可能需要更加分布廣的數據比如說你去拿一個評測可能希望的是拿評測的方式是不一樣的而不是每次都拿同樣類似的一個方向一個位置對吧這些都是一個我覺得逐步跌倒的一個認知我認為在這兒其實最關鍵的就是跟可能整個業內最領先的客戶去寫作起來去共生起來我覺得這個是最關鍵的一件事另外其實就是說我們其實也遇到了一些就之前可能也會有人去問就是說如果一個數據公司它不是做大腦的它不是做本體的那麼它可能認知對於數據的認知趕不上一個本體公司一個一個大腦公司對於數據的認知我覺得其實從我們實踐下來我認為到不是這樣就為什麼呢就是說其實真正這個世界上能夠對數據尤其是大規模的預訓的數據產生認知的團隊擊殺舞弊可能也就五個左右我們可能基本上跟他們都是一個合作關係我認為就是說在這兒最關鍵的是和最核心的客戶產生一個相對共生的一個寫作的一個關係沒有個這可能就這可能就不太細說但是可能你可以想像就是最大的大模型公司最關鍵的大模型公司那麼他們往往都會有自己的居身的團隊在這兒呢我覺得就是說很核心的一個點就是兩邊是否可以同步地去跌倒就跌倒也相互的人質這是一個很關鍵的事其實某種層面上我們得到很多不同客戶給我們的人質同時我們也給我們的客戶提供了更多的一個人質我覺得這是極其需要的我在舉一個例子就是其實數據進塔這件事它是需要被驗證的就是數據進塔是一個概念但是它到底哪一層的數據是最有效的配比是如何的這個是需要被驗證的我們其實可能和其中的大概兩個公司左右都在不斷地去眼鏡對於數據進塔的跌倒這個是很關鍵的一件事那當然就是說你要去驗證市進塔你需要多少讓它可能得幾萬張卡才真正能夠有效的去驗證市進塔所以我認為其實在這兒一些核心的人質是極其關鍵的應該怎麼配比我認為就是說可能就不能說太細但是就是說我認為其實就是越來越偏本體無關層這個是首先是一定的一件事另外就是說我們可能得到更多的一個認知就是不只是一個在預訊連結段包括就是預訊連之後的後訊連從R的結段該怎麼去做這件事該怎麼去微調多少利用訪症多少利用真實以及後面的評測該如何去構建我覺得它是一個整體的一個體型化的一個人質準備數據非常的關鍵能不能給大家一些你們的關鍵的一些 secret分享一下對我覺得可能就是說說一些就是比較偏反直覺的認知我覺得還是回到就是說這個什麼樣的數據是好的數據這個點上其實我覺得它越來越像人的學習就是它越來越不像最早的自動架式最早的這個機器視覺最早的自動架式的機器視覺就是完美的數據是最好的它有一個標準答案的我覺得現在的數據可能越來越沒有一個標準答案這個時候能夠我覺得從第一線原理上能夠幫助人去學習的數據我覺得它可能是最好的數據就是它是一個表説讓你看到了一些錯誤能讓你從錯誤中去學習的數據我覺得這個是一個很關鍵另外就是說可能人從小的時候長大它可能就是說你就是看一個老師就給你講題你可能不見得是最好的效果可能你把每一個同學都給當成自己老師一道題可能有不同的做法然後從足夠的分佈中去得到自己的結論可能是更好的我覺得這些可能是我覺得它的CQSOS 它是和人的學習是越來越共同所以其實我越來越覺得我們可能做的是一個教育公司就是教育公司對我認為中舉的數據公司可能跟教育公司是長得很像的那你覺得教育AI和教育人的不同是什麼目前來看我覺得現在巨神可能還是沒有那麼智能所以現在還是有不少的是一個示範還是有一些讓他去死基因背或者讓他去模仿學習但是我人就是說越往後可能你越需要去挑戰他另外就是說我覺得在這兒其實本身來講巨神這件事它還是一個藥與物理世界去交互的一件事所以這個教育可能和咱們的平常的這種數本的教育還是不太一樣的它需要有更多的物理的示範和物理的交互因為你跟國內外的不管是大腦的公司還是機器人本體的公司還是大模型的公司應該都很熟能不能給大家做一個就是關於中美機器人團隊是怎麼做數據的賣品沒問題他們都是什麼的信仰派就是因為我跟他們很熟所以我可能不能太細說我覺得我可以去相信的去歸類就是說我覺得有一個就是大模型派大模型派我覺得可能越來越多的就是大場的大模型團隊我覺得他們可能出發點可能一最早的時候可能不太一樣但是可能越來越越來越趨銅越來越趨銅就是說他們需要的是這個領樣本的飯化的能力你說的是大別模型團隊還是那個團隊大場的威耀A團隊大場的世界模型團隊我覺得大概是這兩個團隊吧我覺得他們需要的是這個領樣本的飯化能力我覺得這個是一個機器機器對機器的上能力我覺得這個是他們最看重的他們倒沒有那麼看重本體的輔導度那他們最關鍵希望的是能夠用相對簡單的標準化的本體但是能夠去驗證他們規模化的機器的上上能力我覺得這個是他們特別相信數據他們也特別相信本體無關的數據相信訪針相信訪針的評測相信人類數據那麼因為這個走的是大約模型的走進世界路沒錯同時就是說他們其實在Infra上他們會更早地去嘗試做RL 做大規模的RL這件事但是重點可能是在訪針這個是我們可能看到的一個核心的一個大模型團隊的一個趨勢這裡有差異嘴因為這些大場他當然他自經很熊厚他有Infra能力也非常的強但是他同時有大約模型也有VLA和世界模型就是做機器人的這個方向那他在當下肯定會把資源傾向傾斜給大約模型的團隊對吧他不會傾斜給機器人團隊所以會不會反而出現在大場資源其實在機器人團隊能留到機器人團隊的資源沒有想像中那麼多你說這點很好但是呢就說我覺得這個其實是一個可能升到6個月前的真實的現象或者說其實在今年以前我覺得看到的情況其實大廠是基本上沒有下廠的比如說 Open Eye可能沒有下廠對吧可能自己也沒有下廠就沒有下廠 C-RES立去大規模的去做這件事對但是在今年開始了以後我認為可能核心就是說大模型這裡相對來說可能趨勢相對確定了一些有一定的手可以疼出來然後這些就開始去做到了機器人 VIA 對所以從你的視角告訴我們誰變得更激進了我覺得自己肯定是更激進了我覺得阿里也我覺得 Open Eye 我覺得Dime也絕對更激進了對我覺得因為答我覺得也更激進了這就是五家絕竅機型大腦的船隊我覺得還會有其他對其實某種層面上我認為派也應該屬於這個類但他是創業公司對他專業公司但是我認為他可能咱們去定義他可能更多偏一個訪替人來而不是一個機器人公司對吧那麼我覺得他也算是這一類就是他在他在真正的大規模的去訓練自己的模型就這個是一個我覺得大模型對吧那我們再去看機器人我覺得機器人的話可能最早的時候全都是真實派的現在我覺得有一些是開始去 Follow訪真訪真評測我覺得這是調投了還有一些同時那一載Follow這個人類的數據比如說這個用一戰的為首對吧同時本來三輩那他的他用他的那個類無迷的甲轉其實也是人類數據的一種那國內的一些可能也是有Follow人類數據的對所以我覺得就是說機器人公司其實也在分化可能呢我覺得我覺得底層是這個機器人公司是否是一個很大的商業模式是一個數彩還是說他的商業模式就是去做大腦之能我覺得他在這後有運的風化就是他的數據的品類上後有運的這個風化做大腦之能好像不能成為商業模式把新解斷我覺得就是說就是大腦之能就是說他去把機器人不熟到真正的長程口去去執行長期的任務而不是去做一個數彩的數彩場我覺得現在可能很多的機器人公司其實底層做的是一個數彩場其實我個人比較剛好語數語數其實我覺得它還是一個更加偏本體的模式如果說咱們去認為可能這個就是本體無關的數據導致可能大廠的大模型真正成為最後的誕堡那我覺得語數的區分度是最鮮明的它就是堅定的把他的本體做好所以我到我認為就是說語數可能後面他的定位很清晰他也不和他的比方說他也不和誕堡公司去競爭我覺得他們是一個很無實而且知道自己哪裡有優勢知道自己哪裡不希望去發展的一公司就我覺得知道自己的這個Boundary 就編界我覺得很關鍵那他在這個生態裡面會扮演個什麼角色這樣的本體公司我覺得他會是一個核心的本體硬件上可能比如說後面如果說這些大廠的大腦公司大廠的大腦團隊他們希望去在場景去落地他們大腦他們很有可能會高有去看語數和語數合作對吧因為我覺得語數已經被證明他是一個足夠穩定的可量產的對吧可量產的除了語數以外你還看好那些機器人物我認為志願其實我覺得商業化走的是很好的因為我覺得他們可能從黑萬就想得很清楚這件事如果說他要去體系化作的話他就要把上下有溫泉打通同時我認為其實劇身可能某種層面上現在還應該是一個共濟驅動的市場就是你先把這個量給做出來真正的去驅動整個行業的提升整個驅動整個共濟的練習提升我覺得在這兒他的他是想得很清楚的我覺得他的量產各方面是做得很好的你覺得這個行業當然今天特別早如果一定要說終局的話你覺得他會形成一個什麼樣的形態機器人大腦會是大拳的嗎會是一架壟斷的嗎我覺得可能會像現在大魔形行業對吧咱們可能看到大家以為 OpenI能夠一級壟斷沒錯原來因為好像不行沒錯對因為我認為就是說第一層還是數據幣環對吧如果說這個數據幣環是掌握在一個本地上他有規模他自己最大的本地去多點的場景拿回來最多的數據他有新蘭自己最大的大腦那這件事可能確實會形成一個霸權我舉個例子特斯拉就是這樣一個霸權對吧他們在自動駕駛我覺得是做的是很好的那當然國內的我覺得歐岩比如說像李翔小鵬未來等等我覺得做得都很好對那當然如果說在這兒他如果是一個本地五官的一個數據模式他必須要和數據上去進行共生的一個演化那這個時候我覺得可能大模型廠商很難單獨的形成一個霸權所以我認為在最後可能更多的是一個生態系統這塊有最好的誕老公司有最好的數據公司有最好的這個機器人的這個本地公司三者的一個強合作來真正的讓這個長進公司真正的把這些機錢給落地進去當然可能會有一些長進公司自己就是最好的硬件公司我覺得這是完全可能的現在看好像美國那邊大腦發展得更快中國這邊本地發展得更快這會產生什麼後續的影響你中國團隊對於但機器人大腦會追回來嗎從我的判斷因為我們其實服務的客戶足夠多我認為很有可能會去追回來我舉個例子千萬其實是現在可能最好的開源的大模型對吧所以我認為就是說國內的大模型的能力我認為是極高的且他們在這兒我覺得做的決心是足夠高的他們的基建我覺得是足夠好的同時呢我覺得這塊的人才密度也是足夠高的我覺得更多的是因為由於可能國內的大廠之前的時候可能重新還是在大模型大圓模型他一定要把這些事給爭下來我覺得現在這件事他們已經開始把他們的資源開始去放到巨神這塊了所以我認為可能咱們可以看到不少這塊的一個提升為什麼過去三到六個月他們開始往巨神上轉資源他們看到什麼跡象其實我覺得還不是過去三到六個月我可能是過去的我覺得叫小一年的時間對我認為可能更多的是一就是說大模型這邊我覺得可能相對趨勢比較明確了所以他們有精力往這邊投了二的話我認為可能確實也是看到了就是說咱們現在就是文字兒有一個核心裸機就是你到底是本體相關的數據還是本體無關的數據如果這件數據一定是本體來的我覺得大模型傷勢很難完全介入的對吧那他最好的方式就是跟一個本體上去合作對吧如果這個數據的核心是本體無關的數據那我覺得這就是託託的大模型公司的機會對所以我覺得這個是一個可能整個行業我覺得逐步開始想清楚的一件事誰會是 Robotics領域的OPENI? 我覺得首先 OPENI可能也還會是RoboticsOPENI 因為他們其實 Robotics團隊其實還是很強的一個團隊我覺得一定不能小趣我覺得DIMINE 我覺得絕對可能還是大模型的DIMINE 對我覺得他們是一個極其的文我覺得極其優秀的團隊對我覺得因為大家我覺得是很有希望的我覺得是很有希望的因為我覺得因為大家對物理AI 是極其極其重視的我覺得 GIM的團隊我覺得民語的團隊我覺得都是足夠強的團隊而且資源我覺得給高的團隊我覺得在國內的話我覺得可能自己我覺得可能阿里爾前文從我角度我覺得可能都是極其優秀的你不看好馬斯克我覺得XAI是有機會的但是馬斯克其實他現在的Focus是他的本體的硬件他其實我覺得一個是XAI 可能現在還是在一個大模型對吧他還是要把重心把大模型給做好他內場上沒有打贏對沒錯沒錯所以這個是他可能XAI最關心的事而他的他既然有一個本體優勢我覺得這個優勢是別人沒有的優勢就是他本體的硬件優勢他一定要把它放回到機制對吧所以我覺得這個是特斯拉現在這個機器人的重心所以我覺得這兩個其實現在兩邊還沒有完全全的會到一起去你覺得機器人大腦現在的路線有分歧嗎他收臉了沒有我並不認為完全收臉我認為就是說其實就是剛才怎麼提到的這個模型技術劇這件事我認為可能就是說機器人大腦的架構可能這件事還並沒有完全的收臉那當然我覺得在一有的架構上已經有一些 Skeleton要的端理是基於非本體就本體無關的數據訪真和人類數據去產生的那當然就是說這個蛋腦架構是否可以進一步地去演化他該如何更有效的去利用到世界模型等等我覺得這個還是一個研究問題就在這兒我覺得還有一定的研究問題需要被解決我們現在有很多的新詞包括世界模型包括空間制能然後包括物理世界的AI 這些都要講一個事情還是像是之前你們給大家解釋一下這些新的概念對我覺得他們其實還不太一樣我覺得物理世界的AI 可能更多的指的是能夠在物理世界去行動的這些的模型那麼我認為可能主要包括就是自動架式和巨神制能這個我覺得是一個對物理物理AI的定義當然就是說我覺得空間智能的話我覺得它其實更多的還是關注在三地的空間視覺然後是否可以去有效的不只是重建更多是生成三地的空間以及基於它去進行相應的一些預測我覺得世界模型可能更多的視覺就是你對物理世界有足夠好的一個理解能力以及一個預測能力但是可能你欠缺對它的一個行動能力我覺得它應該是這樣的一個區別我們今天因為主要的話題是數據但你覺得如果在數據裡面直接覺得一個最關鍵的問題它就能時間大幅的約生你覺得會是什麼問題我覺得如果是巨深的話我覺得可能現在最關鍵的問題是平臭就是平臭的規模化我覺得這個是最核心的問題為什麼這麼說呢因為其實我覺得現在就是本體無關的數據的預訊鏈的通路和Skinna 我就已經出現了我認為在評測上其實現在是一個卡口這款是一個真正的卡口如果這個解決不了我認為大家很難去衡量自己智能的提升這個是一個核心對在這兒我覺得跟猜如我所說我覺得可能一定要去把真正的訪真的規模化的評測給它打造好我覺得這款會是一個所有人都需要的一個能力那如果是大約模型呢它數據問題應該解決最關鍵的一個問題是什麼大約模型我其實認為可能也是在評測和後續鏈端那它其實很多現在AZN 可能需要的是一個是更好的一個評價能力那麼其實現在遇到的一個問題是什麼呢就是說摩高一尺到高一張就是當你模型能力提升了以後你需要更加牛的人去提供更加好的反饋或者去制定更加難的考題就更加有效的評測指標所以我覺得這個其實是現在可能大圓模型遇到的最大的問題它其實是它本質來講是捲越來越高階的評價指標你覺得到哪一天數據問題會徹底不重要了我其實最早就是我認為會有一天數據問題不重要可能是比如說15年可能20年可能會有一天數據不是一個問題但是我現在越來越思考就是說我就從第一線圓裡去思考人你說人什麼時候不願意去讀書或者人什麼時候不願意去學習了我其實覺得人可能越優秀越希望去提升自己它只不會變成就是說從向別人學習變成與自己去對標與自己的昨天去對標以今天去早上去對標對吧它會更加即可地去設計到更多的知識但這些知識可能有的時候可能數本已經不夠了那它可能需要去在真實的世界去實踐去遇到一些挫折然後拿到一些反饋來不斷的去激勵自己更好的去提升所以我其實認為可能智能越強我現在的觀點跟之前我就其實有些變化我現在觀點是我認為智能越強其實它對於知識的即可程度會越高對於數據的即可程度會越高但它可能就不想像外學習它可能是自我學習是的我基同也我覺得就是說到了終局可能整體上來講就跟馬斯克說的咱們人可能就在一個訪針裡頭就是它可能就是在自己的這個咱們給它設定了一些訪針的環境給它去基於它自己去設定了一些成功指標它不斷地去修訂它自己的內貢我覺得可能會有那麼一天當AI開始像AI學習那Data Factory是不是就消失了我同意這個點就是說我認為Data Factory 它不是一個低性的一個需求我認為知識或者說人類對於學習的可求它是一個低性的需求對我認為Data Factory它還是一個量泛式的大規模的一個產生量泛式的相對標準化知識的一個路徑我認為這個路徑可能很快就會不需要那你們不就消失了我們不是Data Factory 我們我認為還是一個以系統驅動的以系統為中心的以評測為中心的通過幫助客戶的模型發現問題並且基於這些有效的反饋和經驗幫助他們去提升的一套的能力對吧這套能力包括示範也包括訪針的這些環境到終局的時候很有可能所有的人都不用我的數據但都用的訪針的環境在裡頭去用RL 不但就是修煉內工我覺得可能會有那麼一天 A會不需要這個你就AI需要如果它足夠強大它需要一個教育系統嗎我覺得到最後可能不是一個教育系統可能是一個環境對吧這個環境就說有的例子就是說人在這個社會上他去學習他總需要一個環境無論是一個比如說偏數字的一個環境或者偏物理的一個環境他都要在這樣一個場景下去自我的去提升對吧這個場景這個環境其實本身來講可能是我們終局去提供給我們客戶的那就有點類似於咱們去看大園模型的學習其實現在有很多的就本來SKale等等給他們提供的是一個叫RL 跟他我提到就是一個服務強化學習的一個環境對吧那麼讓這個模型在裡頭自己的修煉內工我認為這個是一個可能最終極的一個需求你說像IceSan這樣的人的環境是什麼 IceSan我覺得它可能有很多的是在它的大腦裡頭去構建了很多的思考前提它首先它可能有一些它對於物理的基礎的認知對吧然後基於這些基礎的認知基於這些基礎的這些定理它去構建了很多的思考實驗思考實驗某種層面上咱們可以給它理解為訪針對吧它其實很多的管理相當論下一項論它可能都是它自己的但腦裡頭的思考實驗去失措去想出來的那麼本質上來講我認為如何去構造這樣一個思考實驗你可能需要一些物理你需要一些光頂就是一些限制條件對吧你需要足夠多的這些環境來幫助它在裡頭去進行足夠多的就是我覺得可能大規模的實驗你覺得訪針是你就是我們開始聊到那個你一直想尋找但是以前沒有找到現在找到的那個方向嗎我覺得對我覺得訪針是這個因為我認為訪針是真正能夠去解決巨身數據問題的即使或者說我認為訪針是整個巨身智能它對於這個學習所需要的前提條件那當然就是說我覺得訪針就是單獨是訪針當然我覺得單獨訪針可能並沒有辦法完全解決這個問題我認為它需要是一個跟它我提到的一個巨踏它是一個語以訪針為中心但並不是一個訪針唯一得一套的一個系統的能力 (人們都在一起) 好了今天的節目就是這樣這裡是商業訪談錄是一檔由語言及世界工作室出品的深度訪談節目也可以到公眾號關注我們的工作室或取更多的信心我們的公眾號是語言及世界 Learn great is world 我們希望和你一起從這裡探索新的世界轉得 down to the cheer we're the start of the story This world will hear We'll always put a new world from here

Podcast Summary

Key Points:

访谈围绕数据在人工智能发展中的核心作用展开，重点讨论了数据对于大模型和机器人（具身智能）产业的不同挑战与意义。
嘉宾谢臣（Steve）分享了他的职业经历，从自动驾驶仿真到创立光轮智能，其核心洞察是仿真和合成数据将成为机器人产业发展的关键基础设施和前提条件，而非仅仅是加速器。
深入探讨了数据产业的演变：从静态数据集、工厂化生产，发展到如今大模型时代更注重“因材施教”的高阶反馈与评测系统，数据正从“标注”转向“教育”。
分析了大模型团队与机器人本体公司在数据飞轮、商业模式和产业格局上的潜在差异与协作关系，并预测未来可能形成大模型商、数据商、本体商和场景商四方协作的生态。
指出当前大模型在预训练数据上相对充足，挑战在于后训练与评测；而机器人领域则面临预训练数据严重匮乏和缺乏规模化评价能力的双重结构性难题，数据收集难度高出数个数量级。

Summary:

FAQs

数据在人工智能发展中扮演什么角色？›

数据是驱动人工智能的关键要素之一，与算力和算法并称为“三驾马车”。它类似于教育对人的作用，为智能提供学习和提升的基础。

仿真数据在机器人领域有何重要性？›

仿真数据是机器人产业的数据基建，能加速机器人发展。对于机器人而言，仿真不仅是加速器，更是实现大规模训练和评测的前提条件。

大模型和机器人的数据问题有何不同？›

大模型面临数据“撞墙”难题，互联网数据已耗尽；而机器人数据仍处于“荒漠”阶段，缺乏足够的物理世界交互数据，收集难度更高。

什么是“零样本”能力？为什么它重要？›

零样本能力指模型在没有见过特定任务数据的情况下，仍能执行该任务。它体现了模型的泛化能力，是通往通用智能的关键。

仿真数据如何改变机器人产业的格局？›

仿真数据使机器人训练不再依赖大规模实体部署，降低了数据获取成本。它可能颠覆传统的数据飞轮模式，促进大脑供应商与本体制造商的分离。

数据标注行业正在发生怎样的演变？›

数据标注正从传统的人工标注转向自动化与专家反馈结合。在大模型时代，数据提供者更像“老师”，通过出题、评价和反馈来提升模型能力。

Chat with AI

Pro features

Go deeper with this episode

Unlock creator-grade tools that turn any transcript into show notes and subtitle files.

AI chapters & timestamps

AI-generated chapters with a short description for each topic — click to jump to that point in the audio and transcript.

Locked

Transcript exports (PDF · SRT · VTT)

Download the full transcript as a formatted PDF, or grab perfectly timed caption files.

Locked

Viral quotes + downloadable graphics

AI finds the punchiest 15–30 second moments — perfect for TikTok, Reels, and Shorts. Each quote can be exported as a customizable image card (8 templates, 3 aspect ratios) ready for social.

Locked

Citation & fact-checking engine

Pulls only the publicly verifiable claims — statistics, named figures, historical events — and fact-checks each with Google Search, citing the real source URLs.

Locked