用 Sentence Transformers 微调多模态检索模型
教程Hugging Face2026年4月16日7 分钟阅读
这篇文章讲的是,怎么用 Sentence Transformers 训练或微调多模态 embedding 和 reranker 模型,目标场景包括检索增强生成(RAG)、语义搜索和视觉文档检索。作者拿 `Qwen/Qwen3-VL-Embedding-2B` 做了个视觉文档检索实验,微调后在自己的评测集上把 NDCG@10 从 0.888 提到了 0.947,超过了他测试过的所有现有 VDR 模型,包括体积大 4 倍的模型。
本文编译自 Training and Finetuning Multimodal Embedding & Reranker Models with Sentence Transformers,版权归原作者所有。
觉得有用?分享给更多人