明日香的笔记
11
01
VideoAgent VideoAgent
视频理解agent,将长视频转化为结构化的记忆(时间、物体),通过调用工具进行推理。
2025-11-01
09
14
14
04
01
03
25
08
08
01
08
12
10
03
02
11
18
1 / 3