杂七杂八
p人自救指南 - 记录一些乱七八糟的学习笔记、技术文档、开发文档。
Cross-modal Causal Relation Alignment for VQG Cross-modal Causal Relation Alignment for VQG
视频问题定位的跨模态因果关系对齐
2025-04-01
TRACE: Temporal Grounding Video LLM TRACE: Temporal Grounding Video LLM
通过因果事件建模增强视频理解大模型的时间定位能力
2025-03-25
思路整理 思路整理
后端体系问题记录
2025-03-08
项目记录 项目记录
项目八股整理
2025-03-08
MLLM Papers Review MLLM Papers Review
mllm相关论文复盘整理
2025-01-08
MLLM Dataset&Code MLLM Dataset&Code
记录mllm相关数据集和代码
2024-12-10
ShareGPT4Video ShareGPT4Video
ShareGPT4Video系列,视频密集标注策略,详细标注数据集,标注模型
2024-12-03
多模态架构相关 多模态架构相关
多模态模型架构整理,自用
2024-12-02
Vue Vue
前端三件套+Vue简要笔记整理
2024-11-18
MVBench MVBench
多模态大模型视频理解能力基准
2024-11-12
TimeChat TimeChat
基于视频滑窗Q-Former的时序感知的视频大模型
2024-10-13
SpringCloud SpringCloud
微服务理论,实践,八股
2024-10-08
1 / 2