首个Mamba Transformer混合架构多模态大模型来了,实现单卡千图推理

首个Mamba Transformer混合架构多模态大模型来了,实现单卡千图推理

1年前

本文作者来自于香港中文大学深圳和深圳大数据研究院。其中第一作者为香港中文大学深圳博士生王熙栋和研究助理宋定杰,主要研究方向分别为医疗AGI和多模态学习;博士生陈舒年研究方向为多模态学习,博士生张辰研究 …