2026年3月11日 星期三

超越极限,阿里通义Qwen3-VL 4B与8B模型震撼开源上线

超越视觉边界,阿里通义Qwen3-VL 4B与8B开启多模态新纪元

阿里通义 Qwen3-VL 4B 8B 开源

科技财经观察2025年10月15日 13:48消息,阿里通义Qwen3-VL系列新增4B与8B模型,性能超越GPT-5 Nano,全面开源。

   10月15日,阿里通义正式宣布推出Qwen3-VL系列的全新成员——采用Dense架构的Qwen3-VL-8B和Qwen3-VL-4B模型,并已开源上线。

   Qwen3-VL-4B/8B是一款采用密集(Dense)架构的视觉理解模型,相比同类产品,其显存占用更少,同时保留了Qwen3-VL的所有核心能力。该系列模型根据不同需求提供了Instruct和Thinking两种版本,满足多样化的使用场景。 从技术角度来看,Qwen3-VL-4B/8B在保证性能的同时优化了资源消耗,体现了模型设计上的高效性。这种改进不仅有助于提升实际应用中的部署灵活性,也为更多用户降低了使用门槛。在当前大模型不断演进的背景下,这种兼顾性能与效率的设计思路值得肯定。

   Qwen3-VL-8B 在 STEM、VQA、OCR、视频理解和 Agent 任务等公开评测上表现优异,不仅超越 Gemini 2.5 Flash Lite 和 GPT-5 Nano,甚至可以媲美上一代超大尺寸模型 Qwen2.5-VL-72B。

   而 4B 版本则在端侧展现更高的性价比,适合在需要 AI 视觉理解的智能终端部署。

   值得一提的是,这两款视觉理解模型在“视觉精准”与“文本稳健”方面实现了协同提升:针对小模型普遍存在的“跷跷板”问题(即提升视觉能力通常会牺牲文本性能,反之亦然),阿里通过架构创新和技术创新,使模型在保持文本理解能力的基础上,进一步强化了多模态感知与视觉理解能力,让小巧的模型具备了更强的视觉与文本处理能力。

   新模型已在魔搭社区和HuggingFace平台上线,并推出了FP8版本,方便用户更高效地进行部署与使用。开源代码已公开,具体地址如下: 该模型的发布为开发者提供了更多选择,尤其FP8版本在降低计算资源消耗的同时保持了较高的性能,有助于推动模型在边缘设备或资源受限环境中的应用。这一进展体现了开源社区在AI技术普及与优化方面的持续努力。

   https://modelscope.cn/collections/Qwen3-VL-5c7a94c8cb144b

   https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe

相关阅读

小米MIX 5震撼曝光!AI生成真机渲染图首秀:圆形奥利奥Deco+磁吸外挂镜头,影像系统彻底重构
AI 付爆红春节:支付宝用户数首破亿大关
7-bit 175GS/s ADC 芯片问世,imec引领AI数据中心速度革命
美光目标价狂飙100美元!大摩:AI存储需求爆红,抗压能力惊人!

发表评论

请输入您的姓名
请输入有效的邮箱地址
请填写评论内容

AI栏目

科技财经观察AI栏目为您提供第一时间的新闻报道、深度分析和独家视角。

即时资讯

全天候更新热点事件,第一时间传递重要新闻

深度分析

专业团队解读事件背景与深层影响

24小时热文

AI还原《海贼王》经典名场面:罗宾上船瞬间震撼全网
2026-02-12 14:52

AI还原《海贼王》经典名场面:罗宾上船瞬间引爆全网热议

Threads 推出「Dear Algo」功能:AI 为你定制专属信息流
2026-02-12 14:51

AI 为你写信,信息流从此有了温度

人工智能引领未来:李强部署创新引擎驱动产业变革
2026-02-12 13:18

智能跃迁:李强擘画产业变革新蓝图

字节跳动即梦AI强势入驻Seedance 2.0与Seedream 5.0 Lite,开启AI创作新纪元
2026-02-12 13:14

字节跳动即梦AI强势入驻,开启AI创作无限可能

特斯拉擎天柱三代震撼登场,重新设计引爆科技圈
2026-02-02 14:31

特斯拉擎天柱三代震撼登场,重新定义未来人形机器人新高度

特斯拉人形机器人2026重磅登场:看懂人类就能学新技能,年产百万台!
2026-02-02 14:27

特斯拉人形机器人2026来袭:读懂人类动作,百万量产开启智能新时代

机器人看视频学会超逼真嘴部动作
2026-01-19 21:32

机器人张嘴秒变影帝,视频学唇形逼真到以假乱真

字节跳动曝光AI耳机新形态:豆包搭载摄像头,智能穿戴再升级
2026-01-14 20:42

豆包AI耳机亮相:摄像头赋能智能穿戴新体验

DeepSeek V4春节空降!编程能力狂飙破界,力压GPT-4o与Claude 3.5引爆AI圈大地震
2026-01-10 00:29

DeepSeek V4春节核弹级发布!代码生成速度飙至GPT-4o的2.3倍,GitHub实测通过率首破92%,AI编程赛道一夜改写规则!

谷歌工程师狂赞 Claude Code:一小时完成一年工作量
2026-01-04 15:19

谷歌工程师惊呼:Claude代码效率让一年工作量一小时搞定

友情链接

与优秀科技平台合作,共同构建创新数字生态

合作伙伴持续增加中,期待与更多优秀平台建立联系