春节档AI唱主角国产大模型密集更新开源模型展现强劲势头[推荐]

2025-01-29 互联网微发信息网31

核心提示：春节期间，中国的大模型技术迎来了一波密集更新

春节期间，中国的大模型技术迎来了一波密集更新。阿里云通义千问超大规模的MoE模型Qwen2.5-Max正式上线，预训练数据超过20万亿tokens，在多个基准测试中表现优于DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o。新模型发布后，阿里巴巴美股大涨6.76%。此前一天，通义千问还开源了全新的视觉模型Qwen2.5-VL，推出3B、7B和72B三个尺寸版本，能够更准确地解析图像内容，支持超1小时的视频理解，实现给指定朋友送祝福、电脑修图、手机订票等操作。

春节档AI唱主角国产大模型密集更新

同样在1月28日，DeepSeek团队发布了两款多模态框架——Janus-Pro和JanusFlow。其中，Janus-Pro是统一多模态理解与生成的创新框架，其在图像生成基准测试中的表现超越了OpenAI的“文生图”模型DALL·E 3，并选择了开源。

春节档AI唱主角国产大模型密集更新开源模型展现强劲势头

目前，国内外厂商在开闭源路线上各有侧重。例如，OpenAI的GPT-4模型采用闭源模式，而meta选择完全开源。其他大模型公司则将低参数量的模型开源，高参数量的模型闭源。DeepSeek和阿里云通义团队都是开源路线的坚持者，此次DeepSeek的成功也被认为是开源模型的胜利。

春节档AI唱主角国产大模型密集更新开源模型展现强劲势头

meta首席人工智能科学家Yann LeCun表示，DeepSeek之所以一鸣惊人，是因为他们从开放研究和开源中获益。他们的工作是公开发布和开源的，每个人都可以从中受益，这就是开放研究和开源的力量。一位大模型青年学者也认为，开源和闭源路线各有特色，但开源更能促进行业发展。云基础设施厂商有望受益于这次开源的胜利，这也是阿里云通义大模型坚持开源路线的原因之一。

标签： 春节档AI唱主角国产大模型密集更新

免责声明：以上所展示的信息由网友自行发布，内容的真实性、准确性和合法性由发布者负责。微发信息网对此不承担任何保证责任。任何单位或个人如对以上内容有权利主张（包括但不限于侵犯著作权、商业信誉等），请与我们联系并出示相关证据，我们将按国家相关法规即时移除。

本文地址:http://www.wlchinahc.com/news/hangyezixun/202501/262533.html

点赞 0反对 0举报 0 收藏 0 打赏 0

更多>同类资讯

推荐图文

俄罗斯冬宫桥点亮中国	国产大飞机C919首次投
哈尔滨酒店预订量增76	2025年南昌市迎春烟花

推荐资讯

点击排行

免责声明：本站所有信息均来自互联网搜集，产品相关信息的真实性准确性均由发布单位及个人负责，请大家仔细辨认！并不代表本站观点,微发信息网对此不承担任何相关法律责任！如有信息侵犯了您的权益，请告知，本站将立刻删除。
友情提示：买产品需谨慎
网站资讯与建议：3123798995@qq.com 客服QQ：3123798995

3123798995

春节档AI唱主角 国产大模型密集更新 开源模型展现强劲势头[推荐]

春节档AI唱主角国产大模型密集更新开源模型展现强劲势头[推荐]