Cross-modal Causal Relation Alignment for VQG 视频问题定位的跨模态因果关系对齐 2025-04-01 论文 视频理解 多模态 TRACE: Temporal Grounding Video LLM 通过因果事件建模增强视频理解大模型的时间定位能力 2025-03-25 论文 MLLM 视频理解 思路整理 后端体系问题记录 2025-03-08 后端 Java 项目 项目记录 项目八股整理 2025-03-08 笔记 Java 项目 MLLM Papers Review mllm相关论文复盘整理 2025-01-08 笔记 MLLM 论文 MLLM Dataset&Code 记录mllm相关数据集和代码 2024-12-10 笔记 MLLM 代码 ShareGPT4Video ShareGPT4Video系列,视频密集标注策略,详细标注数据集,标注模型 2024-12-03 论文 MLLM 视频理解 字幕生成 多模态架构相关 多模态模型架构整理,自用 2024-12-02 笔记 LLM 多模态 Vue 前端三件套+Vue简要笔记整理 2024-11-18 前端 框架 前端 MVBench 多模态大模型视频理解能力基准 2024-11-12 论文 MLLM 视频理解 TimeChat 基于视频滑窗Q-Former的时序感知的视频大模型 2024-10-13 论文 MLLM 视频理解 SpringCloud 微服务理论,实践,八股 2024-10-08 后端 框架 微服务