国诚投顾：机器人x具身智能的再思考

深圳市国诚投资咨询有

关注

2025-02-12 09:02:43

有28人浏览

分享到：

　　具身智能的发展离不开Transformer架构:

　　1）架构运用：Transformer架构凭借其强大的多模态融合能力和高效的并行计算能力，推动视觉、语言和行动指令的融合（VLA模型），为智能行为决策提供帮助，成为具身智能领域的重要技术基础。

　　2）VLA模型：作为基于Transformer架构的VLA模型，π0模型相较于RT2模型有所升级，通过多样化的训练数据和流匹配技术，使机器人展现强大的泛化能力和灵活的操作能力。未来，VLA模型在具身智能领域将实现进一步发展，随着千寻智能和星海图分别在灵巧手操作和空间智能方面展现了创新，今后将促进VLM与空间智能结合，向端到端通用趋势发展。

　　触觉与动态手：

　　触觉感知在人机交互、虚拟现实、远程医疗和人形机器人研发等领域具有重要研究价值。精准捕捉手部与可形变物体间的力学交互数据，对于人形机器人完成复杂任务至关重要。基于触觉原理，卢策吾团队提出了视觉-触觉联合算法框架，实现了高精度动态交互重建。这一系统利用触觉手套收集信号，并结合深度相机捕捉的点云序列，通过触觉与视觉数据的融合，实现了动态手-物体交互的几何重建与形变追踪，为机器人柔性操作、虚拟现实力反馈等提供了从微力感知到实时三维重建的完整技术链。

　　激光雷达与视觉技术：

　　1）激光雷达：通过发射激光束探测目标的位置、方位及速度，利用ToF、AMCW和FMCW等测距方法生成三维点云图，实现环境感知。速腾聚创推出的全固态激光雷达E1R和半球形Airy，以及其ActiveCamera解决方案，显著提升了机器人的环境感知能力，推动了其在AI机器人领域的布局。

　　2）视觉技术：2D视觉基于灰度或彩色图像处理，通过像素特征识别物体的纹理、形状及位置，技术成熟且成本低，但计算复杂，适用于简单任务或预算有限的场景；3D视觉通过ToF、结构光法和立体视觉法直接获取深度信息，生成点云或深度图，适用于避障、抓取和导航等复杂任务，具有简化算法和适应动态环境的优势，但成本较高。在机器人高精度操作和动态导航中，3D视觉不可或缺，而2D视觉则适用于简单任务，随着深度学习的发展，2D视觉能力逐步增强，但3D视觉仍是关键任务的首选。

　　投资建议：

　　Deepseek带领下，全面看好具身智能+Ai领域，Ai有望赋能多个产品形态的机器人+多个新兴创业公司，产业参与者将涉及更多领域，机器人领域的软/硬件工程师红利有望持续兑现。关注和Ai+具身智能研发方向重合且具备稀缺卡位优势的公司，发动机方向的宗申动力；灵巧手触觉电子皮肤福莱新材、日盈电子；关节力学传感器安培龙、新型传感器峰岹科技，以及减速器相关产品的爱仕达、中大力德等。

　　参考来源： 2025年02月10日民生证券李哲机器人x具身智能的再思考

　　特别声明：文章内容仅供参考，不构成投资建议。投资者据此操作，风险自担。

　　本文由投资顾问：何程彬哲执业编号： A1290622090001 编辑整理

本文系资鲸网专栏作者深圳市国诚投资咨询有发表，属作者个人观点，不代表网站观点，未经许可严禁转载，违者必究！