国产AI,走到新的关口


6月6日,阿里云智能集团副总裁韩鸿源表示,AI大模型的竞争会越来越激烈。“以后,可能不再有那么多的模型存在了。想训练一个好的模型,在市场有竞争力不是那么容易的事情”。
AI届正迎来大变天?近日,多家科技公司放出大消息。
6月6日,阿里云智能集团副总裁韩鸿源表示,AI大模型的竞争会越来越激烈。“以后,可能不再有那么多的模型存在了。想训练一个好的模型,在市场有竞争力不是那么容易的事情”。
上述判断的输出是在一个全新的市场背景下。上个月以来,国产大模型正厮打“价格战”。
5月15日,字节官宣,豆包大模型pro-32k版推出面对企业全网最低输入价格——0.008元/万tokens。
5月15日,字节跳动宣布旗下豆包主力模型,输入价格为0.0008元/千Tokens
“蝴蝶效应”随之开启。阿里云在5月21日宣布,通义千问主力模型Qwen-Long的API输入价格从0.2元降至0.005元/万tokens,降幅高达97%。降价后的价格仅为GPT-4价格的1/400。
5月22日,百度、讯飞、腾讯云纷纷宣布旗下模型大降价。降幅有的高达80%~90%,有的直接宣布基础模型可以“永久免费”。网友因此调侃,“万万没想到,618大促最先打折的会是AI大模型”。
4家云厂商入门优惠价格对比
“价格战”背后,不难看出各家科技公司对AI的勃勃野心和“领地意识”。但横亘眼前的问题是,互联网大厂到底在卷什么?当下的生成式AI,能带来改变生活的应用吗?
6月6日,我参与了在深圳举办的阿里云AI峰会,想在这里找到一些答案。
模型即服务(MaaS),什么意思?
许多AI从业者都有一个感受,相对于2023年“百模大战”的热闹与喧嚣,进入2024年,AI业界趋于冷静。市场越来越残酷,整合的速度在加快。
另一个新气象是,经过1年的技术积淀与蛰伏,互联网大厂开始在AI赛道发力。5月开始掀起的“价格战”,就是各家大厂实力的象征。
国内大模型厂商API"降价"复盘/图源:幻影视界
首先是5月6日,国内知名私募巨头幻方量化旗下AI公司,发布DeepSeek-V2大模型,价格为GPT-4 Turbo的近百分之一。
5月11日,清华系创业公司智谱AI官宣降价,入门级产品GLM-3 Turbo模型,百万Tokens调用价格从5元降至1元,降幅高达80%。仅不到一个月以后,6月5日,智谱再度降价,称最新的GLM-4-flash 版本的价格已经降到了GLM-3 Turbo的 1/10。
智谱AI首席运营官张帆6月5日举例,“现在,仅仅花 1 毛钱我们就可以拥有 100 万 token。100 万 token 够写两本四大名著,《红楼梦》写两遍也只需要 1 毛钱。”
互联网大厂自然不甘落后。字节在5月15日发布豆包大模型顺便官宣降价,号称其价格比行业平均价格便宜99.3%;5月21日,阿里宣布9款大模型降价,其中,通义千问长本文增强版模型输入价格降至0.005元/万token,远低于OpenAI、Google等公司的模型价格,“击穿全球底价”。
据阿里云智能集团资深副总裁刘伟光介绍,降价后意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。
疯狂的“击穿全球底价”迅速传导至了百度、科大讯飞、腾讯等大厂。不少人认为,资金、技术实力雄厚的互联网企业打响“价格战”,意图“卷”竞争对手、“熬死”小公司,占领最大的市场份额。
果真如此吗?
5月22日,AI创业“独角兽”百川智能CEO王小川对此评价,“(大模型)降价意味着大家实在是太看好这个时代的前景了,不愿失去,侧面反映大家对这个时代AI的能力是有足够多憧憬的。”
他同时认为,这一轮大厂降价并不是面对消费者端(to C),而是to B(面向企业端),实质是云厂商进到新战场。
这轮AI大模型的“价格战”,实际上是对云服务的争夺。
6月6日举办的阿里云峰会,也传递了上述信号。相比于OpenAI技术人员在发布会上动辄与手机内置的GPT4 Turbo聊天互动,阿里云在峰会上更多地披露了技术的细节与中下游应用。
阿里云峰会
造成如此区别的原因很简单。OpenAI面对的是消费端客户,而阿里云主要做的是面向企业的服务。
阿里云智能集团副总裁、公共云首席解决方案架构师韩鸿源在峰会上表示,以前大语言模型刚出来时,大家非常喜欢做的事情是模型微调,即针对特定的业务方向,将享有的领域知识注入模型里面。
“但是这个需求今天不会继续像以前那么强了。”韩鸿源说,“当基础模型泛化能力越来越强的时候,当它能够做更多处理的时候,模型的微调有时候不一定是最好的选择。”
也就是说,当人们对AI性能要求越来越高时,一个新的发展方向——模型即服务(MaaS)的能力变得非常重要。
所谓的“模型即服务”(Model as a Service),字如其名,这是一个属于生成式AI的云服务时代。“今天绝大部分跟AI相关的工作,其实是承载在云上的,绝大部分AI组织使用了云的能力。”
“公有云+API”被认为是企业使用大模型更具性价比的模式,这在全球都是一个大趋势。例如,OpenAI的ChatGPT部署在微软Azure云上,Meta的LLaMA部署在亚马逊AWS云上,Midjourney和Google的Gemini部署在谷歌云。
韩鸿源透露,生成式AI爆发以后,从计算、数据、开发、部署各个方向上,对云计算技术能力提出非常多的挑战。比如,训练大模型需要密集计算;一个AI训练任务,可能需要运行周或者月级别的时长才能拿到有效的结果……这些对于云服务商都是技术思路的重塑。
两位到场企业家告诉我,当下,传统企业和国企对AI的数字化转型迫在眉睫,对AI云服务也存在切实的需求。而云服务的重要性在于,企业有大量内部数据有待数字化,进而存储在云上,与AI大模型做进一步的结合。
上述企业家都提到,他们的转型首先放在需求旺盛的“数字人”赛道。他们表示,此前,数字人只能按照固有的设定进行回答。但在大模型的加持下,它们的“知识”变广了,回答变得丝滑和智能,可以与观众进行实时互动。
降价后,数字人与观众“聊天”和互动的价格将进一步降低,变得更“触手可及”。
AI重塑智能终端
“数字人”是AI应用的一大代表。但不少普通人都闪过疑问:AI是否真能给生活带来质的改变?比起ChatGPT刚爆发时带来的巨大轰动,生成式AI在2024年面临着更多冷静的追问:它会是诸如过去70年的每一次AI技术革命一样,终化为“泡沫”吗?
毫无疑问,2024年,无论是消费者还是业界,都在翘首以盼生成式AI带来的全新应用。
6月6日举办的阿里云的峰会,给了这个问题很多眼前一亮的答案。一个大的趋势是,软硬件结合,将成为大模型的落地新解法。
手机大厂vivo AI研究院人工智能部总经理郝雄分享称,目前,vivo蓝心大模型已对vivo手机的AI影像、智能助理、图文创作等场景进行了全面优化。
vivo看见将携手通义千问,为更多视障人士打开“新视界”
“打造超级助理+重构系统体验=AI手机。”郝雄总结。
他介绍,vivo推出的AI手机,基于阿里云训练自研蓝心大模型,千卡大模型预训练性能接近LLaMA水平。
更特别的是基于AI多模态技术的“vivo看见”。郝雄在现场演示,“vivo看见”不仅可以在镜头对准周围环境和物品时,自动播报画面内容及文字信息,还可以切换到文字、卡证、条码等多种识别模式,获取更多画面细节,并进行多轮对话。
“科技向善”的力量在此时得以释放。七年前失明的生活博主“宝哥和他的导盲犬”用视频记录了他使用“vivo看见”乘高铁出行的全过程。他“看见”了高铁窗外的风景、桌上的水杯,“分清”了酒店里的洗漱用品。“vivo看见”为他描述路边的月季花,唤起了他似曾相识的童年回忆。
同样将AI大模型内嵌进终端产品的还有小鹏汽车。去年起始,各家智能车企在AI热潮下发明了新词——“汽车机器人”,以顺应AI的时代。尽管如此,很多人对大模型与汽车如何结合,仍没有实感。
小鹏汽车智能体验负责人于桐在峰会上介绍了大模式“上车”后的体验。
首先体现在对人类语言的表达和理解上。于桐说,没有大模型之前,此前人们对AI表达诉求是命令式的。比如,人类要说,“将空调调高至X度”,AI才能理解意图。但这样的诉求,他认为是反人性的,并非源于人们真实的感受。
小鹏已在智能座舱场景中新增接入阿里云通义千问。基于小鹏自研大模型XGPT和通义千问等模型后,车载助理 “小P”变得理解人类语言和感受。
AI小鹏,乘“云”直上
比如,用户说“有点冷”时,小P可以准确理解意图、调节车内温度。当用户说:“车窗前面有点糊”,车就知道要自动清洗车窗玻璃。当用户表示:“腰有点疼”,智能座舱将自然地为其打开腰部按摩功能。
于桐还介绍,AI赋能汽车带来的变化,还包括对外界环境的超强感知,包含视觉信息、位置信息、指令信息、环境信息。譬如路经减速带,车辆会通过感知能力,自动将车辆悬架升高、变软,甚至是减速,减少颠簸,让乘坐更舒适。
他透露,当前,小鹏汽车与阿里云通义大模型深入合作,在产、研、营销和客服上的功能和效率都进入了快速迭代。基于此,小鹏非常快速地迭代端到端大模型,在智驾领域处于汽车行业第一梯队。
业内人士认为,随着多模态大模型的能力不断增强,手机、个人电脑、头显、汽车、机器人等智能终端有望迎来新的爆发。软、硬件结合将是大模型的发展方向。苹果、谷歌、特斯拉都已宣布正式入局。在国内,联想AI PC已接入了通义千问等大模型,并于5月10日正式发售。
北科瑞声创始人、国家重大人才计划特聘专家刘轶博士表示,电脑、手机、手表等终端是离用户最近的信息入口,大模型与终端的结合将加快AI技术的普及。
“最开放的云”
可以看见的是,AI正在通过软硬件结合,以“润物细无声”的方式,悄然改变着人们的生活。而与大举烧钱占领市场,达成“赢家通吃”的逻辑有些不一致:当下的许多大厂,都在强调伙伴与开放的重要性。
6月7日,阿里云更新技术博客:重磅发布开源模型Qwen2-72B,性能超过美国开源模型Llama3-70B,也超过众多中国闭源大模型。所有人均可在魔搭社区和Hugging Face免费下载通义千问最新开源模型。
据悉,通义千问Qwen2系列模型大幅提升了代码、数学、推理、指令遵循、多语言理解等能力。在MMLU、GPQA等国际权威测评中,Qwen2-72B斩获十几项世界冠军。阿里云CTO周靖表示,“坚持开源开放是阿里云的重要策略,我们希望打造一朵AI时代最开放的云,让算力更普惠、让AI更普及。”
Qwen2-72B的各个性能数据在MMLU、GPQA等国际权威测评中表现优异
韩鸿源则认为,区分各平台的优劣,除了模型的服务能力和成本,更重要的在于“怎样跟开发者社区有效地结合,为大家提供一个持续发展的生态环境”。
他介绍,阿里云平台是开放的运行方式,它的承载能力可以支持三方模型和经过调整的垂直模型有效运行。阿里云有强大的开发者社区魔搭。
据悉,目前魔搭上有超5000个模型,以及超500万的开发者。同时,通义和旗下生态模型已接入model scope、huggingface等开发者社区。
Qwen2-72B的各个性能数据在MMLU、GPQA等国际权威测评中表现优异
百度创始人李彦宏也表达过类似看法。在一次内部讲话中,李彦宏曾用移动时代类比,“基础模型不会通吃AI应用,”他说。
“在移动时代,微信没有去吃掉拼多多,滴滴也没有变成腾讯的一部分,它们都各自提供了自己独特的价值,有自己非常不一样的竞争力,它们的兴起都是依赖移动生态里的一个封闭平台——微信,但是它们并不怕微信去抢它的饭碗,所以没有必要担心基础模型通吃AI的应用。”
比起赢家通吃,以阿里、百度为代表的互联网大厂,更想要做的是类似英伟达十余年前创建的Cuda生态。它们希望以更包容的底层模型和云服务,支撑上下游AI应用,构建一个繁荣强大、充满活力的大模型应用生态,从而形成真正的护城河。
当然,不可忽视的是,当下,基于生成式AI技术的Super APP(超级应用)仍未出现。谁都希望在自己构建的生态里,出现那个改变世界的超级AI应用。因此,鼓励、支持更多的参与者与原生应用的出现,才是互联网大厂“价格战”背后的野心。
阿里云的实践经验和结果证明,AI的商业化和落地势不可挡。越来越多的智能终端和产业,将因为AI大模型的注入,增加对人性的理解,带来全新气象与希望。
(本文转载自盐财经 ,如有侵权请电话联系13810995524)
* 文章为作者独立观点,不代表MBAChina立场。采编部邮箱:news@mbachina.com,欢迎交流与合作。
备考交流
最新动态
推荐项目
活动日历
- 01月
- 02月
- 03月
- 04月
- 05月
- 06月
- 07月
- 08月
- 09月
- 10月
- 11月
- 12月
- 05/06 活动报名 | 经济学教授x帆船奥运冠军x独角兽企业联创,聊聊个体与组织的双向奔赴
- 05/07 活动预告 | 节后活动不停歇,5月7日招生直通车开启预约,CLGO毕业校友、知名跨国消费电子企业学长经验分享即将到来!
- 05/08 颠覆性创新时代,一切『再设计』| 复旦-BI MBA《设计思维》公开课报名
- 05/10 全球经济格局变化与中国的应对策略 | 复旦MPAcc公开课报名
- 05/10 重磅抢位!中欧MBA年度健康产业论坛2025:医疗创新为本,领航易变时代
- 05/10 报名|就读一年开启创业之路!交大TFMBA学长与你相约招生开放日
- 05/10 长江商学院MBA公开课|大厂专题:多元竞争,突破增长瓶颈 @北京
- 05/10 【招生沙龙报名】把握AI时代机遇,复旦MBA助你职场进化
- 05/11 活动报名 | 5月11日深圳招生直通车启程,招生政策新动向、在校生活Q&A一站式解答!
- 05/17 【华东理工大学商学院iBEST融合创新系列论坛】应变而进:全球政策变革与企业全球化战略转型
热门资讯
MBA院校号
暂无数据