多模态模型资料
多模态模型资料
2024年6月27日修改
1.
排行榜
2.
综述
•
◦
多模态模型包括 Modality encoder、Pretrained LLM、Modality interface
3.
MLLM
3.1
LLaVA
两阶段训练,先训 Connector 然后再端到端训练,Connector 使用的是 MLP
3.2
InstructBLIP
特点是用了三种 Loss,有对比学习、二分类和生成任务
3.3
Qwen-VL
训练过程都是使用生成任务,分阶段训练