周三,中国知名科技公司阿里巴巴发布了其Qwen 2.5人工智能模型的新版本,据称该模型超过了备受赞誉的DeepSeek-V3。
深seek在过去三周内的人气和迅速上升让海外和国内的竞争对手都面临压力,而Qwen 2.5-Max不同寻常的发布时间选择在农历新年的第一天,大多数人都下班和家人在一起。
“Qwen 2.5-Max优于[…]阿里巴巴的云计算部门在其官方微信账户上发布的一份声明中表示,“几乎涵盖了gpt -40, DeepSeek-V3和Llama-3.1-405B,”指的是OpenAI和Meta最先进的开源人工智能模型。
1月10日发布的DeepSeek人工智能助手,由DeepSeek- v3模型驱动,以及1月20日发布的R1模型,震惊了硅谷并导致科技股暴跌,据称这家中国初创公司的低开发和使用成本促使投资者质疑美国领先的人工智能公司的巨额支出计划。
但DeepSeek的成功也导致其国内竞争对手争相升级自己的人工智能模型。
在DeepSeek-R1发布两天后,TikTok的所有者字节跳动发布了其旗舰人工智能模型的更新,并声称该模型在AIME中的表现优于微软支持的OpenAI的01,AIME是一项衡量人工智能模型理解和响应复杂指令的基准测试。
这与DeepSeek声称其R1模型在几个性能基准上与OpenAI的01相媲美的说法相呼应。
DeepSeek V3模型的前身DeepSeek- v2在去年5月发布后,在中国引发了一场人工智能模型价格战。
事实上,DeepSeek-V2是开源的,而且前所未有的便宜,每100万代币(或人工智能模型处理的数据单位)只有1元人民币(0.14美元),这导致阿里巴巴的云计算部门宣布一系列型号的价格下调高达97%。
其他中国科技公司也纷纷效仿,包括b百度和中国最有价值的互联网公司腾讯(Tencent)。b百度于2023年3月发布了中国首个类似ChatGPT的应用。
今年7月,DeepSeek神秘的创始人梁文峰罕见地接受了中国媒体《浪潮》的采访,他说这家初创公司“不在乎”价格战,实现通用人工智能(AGI)是公司的主要目标。
OpenAI将AGI定义为在大多数具有经济价值的任务中超越人类的自主系统。
虽然像阿里巴巴这样的大型中国科技公司拥有数十万员工,但深seek的运作方式就像一个研究实验室,主要由来自中国顶尖大学的年轻毕业生和博士生组成。
梁在7月份的采访中表示,他认为中国最大的科技公司可能不太适合人工智能行业的未来,并将其高成本和自上而下的结构与深seek的精益运营和宽松的管理风格进行了对比。
“大型基础模型需要持续创新,科技巨头的能力有其局限性,”他说。
周三,中国知名科技公司阿里巴巴发布了其Qwen 2.5人工智能模型的新版本,据称该模型超过了备受赞誉的DeepSeek-V3。
深seek在过去三周内的人气和迅速上升让海外和国内的竞争对手都面临压力,而Qwen 2.5-Max不同寻常的发布时间选择在农历新年的第一天,大多数人都下班和家人在一起。
“Qwen 2.5-Max优于[…]阿里巴巴的云计算部门在其官方微信账户上发布的一份声明中表示,“几乎涵盖了gpt -40, DeepSeek-V3和Llama-3.1-405B,”指的是OpenAI和Meta最先进的开源人工智能模型。
1月10日发布的DeepSeek人工智能助手,由DeepSeek- v3模型驱动,以及1月20日发布的R1模型,震惊了硅谷并导致科技股暴跌,据称这家中国初创公司的低开发和使用成本促使投资者质疑美国领先的人工智能公司的巨额支出计划。
但DeepSeek的成功也导致其国内竞争对手争相升级自己的人工智能模型。
在DeepSeek-R1发布两天后,TikTok的所有者字节跳动发布了其旗舰人工智能模型的更新,并声称该模型在AIME中的表现优于微软支持的OpenAI的01,AIME是一项衡量人工智能模型理解和响应复杂指令的基准测试。
这与DeepSeek声称其R1模型在几个性能基准上与OpenAI的01相媲美的说法相呼应。
DeepSeek V3模型的前身DeepSeek- v2在去年5月发布后,在中国引发了一场人工智能模型价格战。
事实上,DeepSeek-V2是开源的,而且前所未有的便宜,每100万代币(或人工智能模型处理的数据单位)只有1元人民币(0.14美元),这导致阿里巴巴的云计算部门宣布一系列型号的价格下调高达97%。
其他中国科技公司也纷纷效仿,包括b百度和中国最有价值的互联网公司腾讯(Tencent)。b百度于2023年3月发布了中国首个类似ChatGPT的应用。
今年7月,DeepSeek神秘的创始人梁文峰罕见地接受了中国媒体《浪潮》的采访,他说这家初创公司“不在乎”价格战,实现通用人工智能(AGI)是公司的主要目标。
OpenAI将AGI定义为在大多数具有经济价值的任务中超越人类的自主系统。
虽然像阿里巴巴这样的大型中国科技公司拥有数十万员工,但深seek的运作方式就像一个研究实验室,主要由来自中国顶尖大学的年轻毕业生和博士生组成。
梁在7月份的采访中表示,他认为中国最大的科技公司可能不太适合人工智能行业的未来,并将其高成本和自上而下的结构与深seek的精益运营和宽松的管理风格进行了对比。
“大型基础模型需要持续创新,科技巨头的能力有其局限性,”他说。
有话要说...