太空探索技术公司吧 关注:7,556贴子:349,283
  • 3回复贴,共1

通往agi可能的最后一步

只看楼主收藏回复

通过预测误差来动态调整学习率。对于预测误差要有好的估计,感觉可以通过学习训练来建立预测误差估计的关联空间,即学到其中的一些特征相似度差异与学习率的映射。注意到我们的最终目标是逼近真实世界的结构,数据分布的结构只是用来辅助逼近的脚手架,因此在具身智能阶段不追求用于拟合的损失函数最小化,而要追求预测误差最小化。具身智能用来收敛出用于误差估计的关联空间。生成式的图像大模型和语言大模型作为基座,并且通过这样的过程可以极大提升文本图像的映射精度。
另外就是让大模型获得类似人脑离散化的特性,引入截断机制:可以考虑在权重低于某个正值的时候直接置为零,参数量膨胀百倍,稀疏化权重网络,这样离散化特性就出来了。


IP属地:江西来自iPhone客户端1楼2024-06-23 20:40回复
    我猜测大脑对于固定结构的感知和check有一种定向锁定机制,大约是一种多个独立路径可达的锁定机制,dna编码的奖励系统中应该有一个隐藏的超参数3,即可以找到3个及以上的独立路径推出一样的东西即认为是固定结构,也可称之为潜意识认可的公理,如果有两条路径推出可认为是可以质疑的公理,一条则认为是似真似假的公理,一条都没有就认为不可能。注意到这里说的固定结构是粒度非常细的结构,对应于图像大模型中学到的结构,对于建立在这之上的语言大模型,一条路径即可认为是公理,一条都没有认为不可能。


    IP属地:江西来自iPhone客户端2楼2024-06-23 22:28
    回复
      以上操作都要搭配具身智能使用,具身智能有两个独特的优势,一个是可以获得超长时长的一镜到底式的视频数据,这对于收敛出一个统一的视觉关联空间是必要条件。另一个就是可以做实验得到即时的对应反馈。


      IP属地:江西来自iPhone客户端3楼2024-06-23 22:29
      回复
        比如先操控核弹渣亖你正在啃莱猪的劝架老肖?


        IP属地:江苏来自Android客户端4楼2024-07-04 18:58
        回复