DeepSeek官方视觉语言模型,支持多模态任务(图像+文本)。
多模态融合,高精度;优势包括开源预训练模型、新手友好API接入,领先社区。
图像描述、视觉问答、跨模态搜索
需基础技术知识
免费
https://huggingface.co/spaces/deepseek-ai/DeepSeek-VL-7B