25年5月来自斯坦福大学、哥伦比亚大学、JP Morgan 研究、CMU 和 Nvidia 的论文“DexUMI: Using Human Hand as the Universal Manipulation Interface for Dexterous Manipulation”。
DexUMI——一个数据收集和策略学习框架,它使用人手作为自然界面,将…
原文:https://mp.weixin.qq.com/s/QLFKvb8Ol3CX9uWKBXSrow 论文:ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models
Abs:https://arxiv.org/abs/2505.24864
权重下载:https://hugg…