Axi's Blog
周记 Week56Blur image

这次也算是很久之后的一次周记吧,这周略有奔波,处理了不少事情,但是周记上倒是没什么可以写的。

科研#

首先还是大概说下科研,一件让我心中的石头落地的事情发生了,GR00T 在我们内部迭代的某个版本的 Benchmark 上面训出了性能,而且很高,而后我们也从代码中找到了数据生成的一些 bug,这些 bug 会导致模型在之前不能很好的学到如何关闭夹爪,而恰好和我们之后的预处理方法抵消掉。如今 bug 改正了,同时性能也有了,可以说一切都好起来了。

接下来的问题到了模型学习的难度上了。我们内部初步迭代的版本一直是 RoboTiq 的机械臂,而非 Aloha,单臂的模型在我们初步的 benchmark 上很轻松就把几个点跑满了,尽管我们已经在强调一些 novel object 以及 reasoning 的元素(之前的 GenManip 也是最早强调这些元素的 Benchmark 之一)。因此决定加大难度(事实上之前设计的难度也比这个刷满的高,但是因为担心模型学不出来大家都没有点,紧急降低了难度),发挥 GenManip 框架最擅长的 long horizon 生成。

相较于 AGIBot 那边的 benchmark,数据主要来自于遥操作,GenManip 自动生成数据的好处就在于伴随着 horizon 的变长,不会带来更大的数据采集负担,而且可以多次迭代。

生活#

这周主要还是生活上的事情,到处奔波。首先要回到学校参加一下专业实习的答辩,反正是随便聊了点,没啥东西,但是要线下,所以说坐火车回到了西安,也和乐小姐一起吃了饭什么的。然后就是回北京拔牙,因为我有两颗智齿完全是横向生长的,因此需要拔掉,可以预见的是未来的一段时间内都不能自由地大快朵颐了。

这周大概就是这样,风平浪静。

周记 Week56
https://axi-blog.pages.dev/blog/week-56
Author 阿汐
Published at August 4, 2025
Comment seems to stuck. Try to refresh?✨