【资料图】
《科创板日报》25日讯,阿里云今日推出大规模视觉语言模型Qwen-VL,并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入。相较于此前的VL模型,Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力,可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。
本文源自:科创板日报
作者:黄心怡
标签:
阿里云开源通义千问多模态大模型Qwen-VL
三星 Galaxy Fold 4 折叠屏手机迎来 One UI 5.1.1 更新
西北工业大学专业有哪些 陕西科技大学王牌专业
菏泽高新区万福街道办事处雷泽湖社区志愿服务队(关于菏泽高新区万福街道办事处雷泽湖社区志愿服务队简述)
X 关闭