国产AI，走到新的关口

MBAChina

2024-06-13 14:27 浏览量: 1368

智能总结

6月6日，阿里云智能集团副总裁韩鸿源表示，AI大模型的竞争会越来越激烈。“以后，可能不再有那么多的模型存在了。想训练一个好的模型，在市场有竞争力不是那么容易的事情”。

AI届正迎来大变天？近日，多家科技公司放出大消息。

上述判断的输出是在一个全新的市场背景下。上个月以来，国产大模型正厮打“价格战”。

5月15日，字节官宣，豆包大模型pro-32k版推出面对企业全网最低输入价格——0.008元/万tokens。

5月15日，字节跳动宣布旗下豆包主力模型，输入价格为0.0008元/千Tokens

“蝴蝶效应”随之开启。阿里云在5月21日宣布，通义千问主力模型Qwen-Long的API输入价格从0.2元降至0.005元/万tokens，降幅高达97%。降价后的价格仅为GPT-4价格的1/400。

5月22日，百度、讯飞、腾讯云纷纷宣布旗下模型大降价。降幅有的高达80%~90%，有的直接宣布基础模型可以“永久免费”。网友因此调侃，“万万没想到，618大促最先打折的会是AI大模型”。

4家云厂商入门优惠价格对比

“价格战”背后，不难看出各家科技公司对AI的勃勃野心和“领地意识”。但横亘眼前的问题是，互联网大厂到底在卷什么？当下的生成式AI，能带来改变生活的应用吗？

6月6日，我参与了在深圳举办的阿里云AI峰会，想在这里找到一些答案。

模型即服务（MaaS），什么意思？

许多AI从业者都有一个感受，相对于2023年“百模大战”的热闹与喧嚣，进入2024年，AI业界趋于冷静。市场越来越残酷，整合的速度在加快。

另一个新气象是，经过1年的技术积淀与蛰伏，互联网大厂开始在AI赛道发力。5月开始掀起的“价格战”，就是各家大厂实力的象征。

国内大模型厂商API"降价"复盘/图源：幻影视界

首先是5月6日，国内知名私募巨头幻方量化旗下AI公司，发布DeepSeek-V2大模型，价格为GPT-4 Turbo的近百分之一。

5月11日，清华系创业公司智谱AI官宣降价，入门级产品GLM-3 Turbo模型，百万Tokens调用价格从5元降至1元，降幅高达80%。仅不到一个月以后，6月5日，智谱再度降价，称最新的GLM-4-flash 版本的价格已经降到了GLM-3 Turbo的 1/10。

智谱AI首席运营官张帆6月5日举例，“现在，仅仅花 1 毛钱我们就可以拥有 100 万 token。100 万 token 够写两本四大名著，《红楼梦》写两遍也只需要 1 毛钱。”

互联网大厂自然不甘落后。字节在5月15日发布豆包大模型顺便官宣降价，号称其价格比行业平均价格便宜99.3%；5月21日，阿里宣布9款大模型降价，其中，通义千问长本文增强版模型输入价格降至0.005元/万token，远低于OpenAI、Google等公司的模型价格，“击穿全球底价”。

据阿里云智能集团资深副总裁刘伟光介绍，降价后意味着，1块钱可以买200万tokens，相当于5本《新华字典》的文字量。

疯狂的“击穿全球底价”迅速传导至了百度、科大讯飞、腾讯等大厂。不少人认为，资金、技术实力雄厚的互联网企业打响“价格战”，意图“卷”竞争对手、“熬死”小公司，占领最大的市场份额。

果真如此吗？

5月22日，AI创业“独角兽”百川智能CEO王小川对此评价，“（大模型）降价意味着大家实在是太看好这个时代的前景了，不愿失去，侧面反映大家对这个时代AI的能力是有足够多憧憬的。”

他同时认为，这一轮大厂降价并不是面对消费者端(to C），而是to B（面向企业端），实质是云厂商进到新战场。

这轮AI大模型的“价格战”，实际上是对云服务的争夺。

6月6日举办的阿里云峰会，也传递了上述信号。相比于OpenAI技术人员在发布会上动辄与手机内置的GPT4 Turbo聊天互动，阿里云在峰会上更多地披露了技术的细节与中下游应用。

阿里云峰会

造成如此区别的原因很简单。OpenAI面对的是消费端客户，而阿里云主要做的是面向企业的服务。

阿里云智能集团副总裁、公共云首席解决方案架构师韩鸿源在峰会上表示，以前大语言模型刚出来时，大家非常喜欢做的事情是模型微调，即针对特定的业务方向，将享有的领域知识注入模型里面。

“但是这个需求今天不会继续像以前那么强了。”韩鸿源说，“当基础模型泛化能力越来越强的时候，当它能够做更多处理的时候，模型的微调有时候不一定是最好的选择。”

也就是说，当人们对AI性能要求越来越高时，一个新的发展方向——模型即服务（MaaS）的能力变得非常重要。

所谓的“模型即服务”（Model as a Service），字如其名，这是一个属于生成式AI的云服务时代。“今天绝大部分跟AI相关的工作，其实是承载在云上的，绝大部分AI组织使用了云的能力。”

“公有云+API”被认为是企业使用大模型更具性价比的模式，这在全球都是一个大趋势。例如，OpenAI的ChatGPT部署在微软Azure云上，Meta的LLaMA部署在亚马逊AWS云上，Midjourney和Google的Gemini部署在谷歌云。

韩鸿源透露，生成式AI爆发以后，从计算、数据、开发、部署各个方向上，对云计算技术能力提出非常多的挑战。比如，训练大模型需要密集计算；一个AI训练任务，可能需要运行周或者月级别的时长才能拿到有效的结果……这些对于云服务商都是技术思路的重塑。

两位到场企业家告诉我，当下，传统企业和国企对AI的数字化转型迫在眉睫,对AI云服务也存在切实的需求。而云服务的重要性在于，企业有大量内部数据有待数字化，进而存储在云上，与AI大模型做进一步的结合。

上述企业家都提到，他们的转型首先放在需求旺盛的“数字人”赛道。他们表示，此前，数字人只能按照固有的设定进行回答。但在大模型的加持下，它们的“知识”变广了，回答变得丝滑和智能，可以与观众进行实时互动。

降价后，数字人与观众“聊天”和互动的价格将进一步降低，变得更“触手可及”。

‍AI重塑智能终端

“数字人”是AI应用的一大代表。但不少普通人都闪过疑问：AI是否真能给生活带来质的改变？比起ChatGPT刚爆发时带来的巨大轰动，生成式AI在2024年面临着更多冷静的追问：它会是诸如过去70年的每一次AI技术革命一样，终化为“泡沫”吗？

毫无疑问，2024年，无论是消费者还是业界，都在翘首以盼生成式AI带来的全新应用。

6月6日举办的阿里云的峰会，给了这个问题很多眼前一亮的答案。一个大的趋势是，软硬件结合，将成为大模型的落地新解法。

手机大厂vivo AI研究院人工智能部总经理郝雄分享称，目前，vivo蓝心大模型已对vivo手机的AI影像、智能助理、图文创作等场景进行了全面优化。

vivo看见将携手通义千问，为更多视障人士打开“新视界”

“打造超级助理+重构系统体验=AI手机。”郝雄总结。

他介绍，vivo推出的AI手机，基于阿里云训练自研蓝心大模型，千卡大模型预训练性能接近LLaMA水平。

更特别的是基于AI多模态技术的“vivo看见”。郝雄在现场演示，“vivo看见”不仅可以在镜头对准周围环境和物品时，自动播报画面内容及文字信息，还可以切换到文字、卡证、条码等多种识别模式，获取更多画面细节，并进行多轮对话。

“科技向善”的力量在此时得以释放。七年前失明的生活博主“宝哥和他的导盲犬”用视频记录了他使用“vivo看见”乘高铁出行的全过程。他“看见”了高铁窗外的风景、桌上的水杯，“分清”了酒店里的洗漱用品。“vivo看见”为他描述路边的月季花，唤起了他似曾相识的童年回忆。

同样将AI大模型内嵌进终端产品的还有小鹏汽车。去年起始，各家智能车企在AI热潮下发明了新词——“汽车机器人”，以顺应AI的时代。尽管如此，很多人对大模型与汽车如何结合，仍没有实感。

小鹏汽车智能体验负责人于桐在峰会上介绍了大模式“上车”后的体验。

首先体现在对人类语言的表达和理解上。于桐说，没有大模型之前，此前人们对AI表达诉求是命令式的。比如，人类要说，“将空调调高至X度”，AI才能理解意图。但这样的诉求，他认为是反人性的，并非源于人们真实的感受。

小鹏已在智能座舱场景中新增接入阿里云通义千问。基于小鹏自研大模型XGPT和通义千问等模型后，车载助理 “小P”变得理解人类语言和感受。

AI小鹏，乘“云”直上‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

比如，用户说“有点冷”时，小P可以准确理解意图、调节车内温度。当用户说：“车窗前面有点糊”，车就知道要自动清洗车窗玻璃。当用户表示：“腰有点疼”，智能座舱将自然地为其打开腰部按摩功能。

于桐还介绍，AI赋能汽车带来的变化，还包括对外界环境的超强感知，包含视觉信息、位置信息、指令信息、环境信息。譬如路经减速带，车辆会通过感知能力，自动将车辆悬架升高、变软，甚至是减速，减少颠簸，让乘坐更舒适。

他透露，当前，小鹏汽车与阿里云通义大模型深入合作，在产、研、营销和客服上的功能和效率都进入了快速迭代。基于此，小鹏非常快速地迭代端到端大模型，在智驾领域处于汽车行业第一梯队。

业内人士认为，随着多模态大模型的能力不断增强，手机、个人电脑、头显、汽车、机器人等智能终端有望迎来新的爆发。软、硬件结合将是大模型的发展方向。苹果、谷歌、特斯拉都已宣布正式入局。在国内，联想AI PC已接入了通义千问等大模型，并于5月10日正式发售。

北科瑞声创始人、国家重大人才计划特聘专家刘轶博士表示，电脑、手机、手表等终端是离用户最近的信息入口，大模型与终端的结合将加快AI技术的普及。

“最开放的云”

可以看见的是，AI正在通过软硬件结合，以“润物细无声”的方式，悄然改变着人们的生活。而与大举烧钱占领市场，达成“赢家通吃”的逻辑有些不一致：当下的许多大厂，都在强调伙伴与开放的重要性。

6月7日，阿里云更新技术博客：重磅发布开源模型Qwen2-72B，性能超过美国开源模型Llama3-70B，也超过众多中国闭源大模型。所有人均可在魔搭社区和Hugging Face免费下载通义千问最新开源模型。

据悉，通义千问Qwen2系列模型大幅提升了代码、数学、推理、指令遵循、多语言理解等能力。在MMLU、GPQA等国际权威测评中，Qwen2-72B斩获十几项世界冠军。阿里云CTO周靖表示，“坚持开源开放是阿里云的重要策略，我们希望打造一朵AI时代最开放的云，让算力更普惠、让AI更普及。”

Qwen2-72B的各个性能数据在MMLU、GPQA等国际权威测评中表现优异

韩鸿源则认为，区分各平台的优劣，除了模型的服务能力和成本，更重要的在于“怎样跟开发者社区有效地结合，为大家提供一个持续发展的生态环境”。

他介绍，阿里云平台是开放的运行方式，它的承载能力可以支持三方模型和经过调整的垂直模型有效运行。阿里云有强大的开发者社区魔搭。

据悉，目前魔搭上有超5000个模型，以及超500万的开发者。同时，通义和旗下生态模型已接入model scope、huggingface等开发者社区。

Qwen2-72B的各个性能数据在MMLU、GPQA等国际权威测评中表现优异

百度创始人李彦宏也表达过类似看法。在一次内部讲话中，李彦宏曾用移动时代类比，“基础模型不会通吃AI应用，”他说。

“在移动时代，微信没有去吃掉拼多多，滴滴也没有变成腾讯的一部分，它们都各自提供了自己独特的价值，有自己非常不一样的竞争力，它们的兴起都是依赖移动生态里的一个封闭平台——微信，但是它们并不怕微信去抢它的饭碗，所以没有必要担心基础模型通吃AI的应用。”

比起赢家通吃，以阿里、百度为代表的互联网大厂，更想要做的是类似英伟达十余年前创建的Cuda生态。它们希望以更包容的底层模型和云服务，支撑上下游AI应用，构建一个繁荣强大、充满活力的大模型应用生态，从而形成真正的护城河。

当然，不可忽视的是，当下，基于生成式AI技术的Super APP（超级应用）仍未出现。谁都希望在自己构建的生态里，出现那个改变世界的超级AI应用。因此，鼓励、支持更多的参与者与原生应用的出现，才是互联网大厂“价格战”背后的野心。

阿里云的实践经验和结果证明，AI的商业化和落地势不可挡。越来越多的智能终端和产业，将因为AI大模型的注入，增加对人性的理解，带来全新气象与希望。

编辑：梁萍

(本文转载自盐财经，如有侵权请电话联系13810995524)

* 文章为作者独立观点，不代表MBAChina立场。采编部邮箱：news@mbachina.com，欢迎交流与合作。

备考交流

2024考研英语二备考群: 678595048
2024管理类联考复试调剂②群： 814776983
2024海外硕士交流群： 895560072
2024年MBA/MEM/MPAcc联考备考群： 769561411
免联考调剂咨询①群： 796631901
2024考研政治冲刺群： 863373153
海外硕士咨询③群: 850595383
免联考硕士入学咨询群： 711046255
2024考研复试调剂交流群： 902176003

免费领取价值5000元MBA备考学习包（含近8年真题）购买管理类联考MBA/MPAcc/MEM/MPA大纲配套新教材

扫码关注我们

获取报考资讯
了解院校活动
学习备考干货
研究上岸攻略

活动日历

2025年度

01月
02月
03月
04月
05月
06月
07月
08月
09月
10月
11月
12月

展开

MBA院校号

暂无数据