Florence-VL来了!使用生成式视觉编码器,重新定义多模态大语言模型视觉信息 本文由马里兰大学,微软研究院联合完成。作者包括马里兰大学博士生陈玖海,主要研究方向为语言模型,多模态模型。 2024-12-24 14:46