阿里云为什么对大模型持续乐观?

来源:

责任编辑: 班彦

发布时间: 2024-09-20 16:36:21

0

0

在大模型行业集体迷茫之际,阿里云却在2024云栖大会上释放了诸多积极信号。

大模型走红快两年,目前的发展状态和此前业界的预期还有较大差距,一些大模型公司开始出现战略摇摆。但阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在演讲中表示,过去22个月,AI发展的速度超过任何历史时期。

一方面是大模型技术快速迭代以及技术可用性大幅提升。去年,大模型还只能帮助程序员写简单的代码,今天已经能直接理解需求,完成复杂的编程任务。去年,大模型的数学能力还只有中学生水平,今天已达到国际奥赛金牌水平,并在物理、化学、生物等多方面学科接近博士水平。

另一方面,模型推理成本指数级下降,已经远远超过摩尔定律。以通义千问为例,一年来,通义千问API在阿里云百炼上的调用价格下降了97%以上,百万Tokens调用花费最低已经降到了3毛钱,未来还有继续下降的趋势。

吴泳铭给当下大模型发展状态的定义是“AGI变革的早期阶段”,要实现真正的AGI,下一代模型需要具备更大规模、更通用、更泛化的知识体系,同时也将具备更复杂更多层次的逻辑推理能力。在他看来,全世界先进模型竞争的投入门槛,将达到数十亿、数百亿美金的级别。

从2024云栖大会上的一系列发布来看,阿里云对大模型的乐观不只停留在口号上,而是要继续实打实投入。

阿里云和同行态度的强烈反差,背后是彼此对大模型应用落地前景认知的差异导致的。

大模型的想象空间不只在手机屏幕

大模型太多,应用却太少是当下整个行业面临的问题,大模型要跑起来、更要用起来,需要走好落地应用“最后一公里”。

从各家基础模型公司和应用层公司的探索来看,目前大模型的落地应用分为B端和C端两个方向。

在B端场景中,大模型目前已经在金融、工业、教育、医疗、政务等行业中得到应用,对研发设计、生产制造、经营管理、营销服务业务环节带来一些助力。但整体来看,很多企业对大模型的应用还在探索阶段,大模型依然面临落地难、落地成本高的问题。

C端场景的边际成本更低,被大模型从业者寄予了更多期待。AI助理被认为是大模型时代的超级应用,无论是以月之暗面为代表的大模型创业公司,还是腾讯、字节跳动、百度等互联网大厂,都相继推出了AI助理类应用。但豆包、Kimi等多个AI助手应用的表现还没达到人们的高预期,产品形态依然在演进,暂时看不到移动互联网时代超级应用爆发的势头。

很多从业者对大模型的落地应用感到迷茫,一个重要的原因是他们把对大模型应用落地的场景局限在手机屏幕上。

吴泳铭在2024云栖大会上给出了不一样的答案。在他看来,AI最大的想象力绝对不是在手机屏幕上,AI最大的想象力是在通过渗透数字世界、接管数字世界,并改变物理世界。

过去三十年,互联网浪潮的本质是连接,互联网连接了人、信息、商业和工厂,通过连接提高了世界的协作效率,创造了巨大的价值,改变了人们的生活方式。但生成式AI是通过生产力的供给创造了新的价值,从而为世界创造了更大的内在价值,也就是总体提高了整个世界的生产力水平。这种价值创造,可能是移动互联网连接价值的十倍、几十倍。

正因为如此,我们更应该跳出移动互联网的视角来看AI大模型的未来。很长一段时间,AI的焦点主要集中在模拟人类的感知能力,比如自然语言理解、语音识别、视觉识别。但是生成式AI的崛起,带来了质的飞跃,AI不再仅仅局限于感知,而是首次展现了思考推理和创造的力量。

吴泳铭表示,AI模型可以通过对物理世界数据的Token化,理解真实世界的方方面面,比如人类行走、奔跑、驾驶车辆、使用工具,绘画、作曲、写作、表达、教学、编程的技巧,甚至是开公司创业。理解之后,AI就可以模仿人类去执行物理世界的任务,这将带来新的产业革命。

这样的变革已经在一些行业发生,比如汽车行业。之前的自动驾驶技术,是靠人来写算法规则,几十万行代码,仍然无法穷尽所有的驾驶场景。采用“端到端”的大模型技术训练后,AI模型直接学习海量人类驾驶视觉数据,让汽车具备了超越大部分司机的驾驶能力。

在吴泳铭看来,机器人将是下一个迎来巨变的行业。未来,所有能移动的物体都会变成智能机器人。它可以是工厂里的机械臂、工地里的起重机、仓库里的搬运工、救火现场的消防员、包括家庭里的宠物狗、保姆、助理。工厂里会有很多机器人,在AI大模型的指挥下,生产机器人。现在每个城市家庭里有一辆或者两辆车,未来每个家庭可能会有两三个机器人,帮助人们提升生活当中的效率。

从这个角度来看,AI驱动的数字世界连接着具备AI能力的物理世界,将会大幅提升整个世界的生产力,对物理世界的运行效率产生革命性的影响。AI大模型的价值也不仅仅局限在商业领域,更重要的是将给社会生活带来巨大改变。

这是一个更大的历史机遇,也值得更多从业者积极投入、提前布局。能够抓住这个历史机遇的企业,将释放出比移动互联网高速增长时代更大的价值。

强大的基建才能催生AI新未来

在颠覆式的新浪潮下,坚定的技术乐观派才会真正走在时代前面,引领变革的发生。

在吴泳铭看来,人们对新技术革命,往往对短期高估,又对长期低估。因为在新技术应用早期,渗透率还比较低,人们经验没有发生过此类事件,大部分人的本能会产生怀疑,这很正常。但新技术革命会在人们的怀疑中成长,很多人会在迟疑中错过。

不同于传统IT时代,AI时代对基础设施的性能、效率要求更高。业界先进的模型参数规模和数据规模仍在持续增长,巨头之争已经从千亿模型向万亿模型发展。

比如,GPT-4模型具有1.8万亿参数,在约 13万亿个Token上进行了训练,算力需求相当于在大约2.5万张A100加速卡上运行90~100天。Meta在原有1.6万张A100卡集群基础上又建设两个具有约2.5万张H100加速卡集群,用来加速LLaMA3的训练。由此可见,万卡已经成为未来先进大模型训练的新起点。

尽管先进模型的门槛提升至几十上百亿美金,但头部大厂在投入上未曾迟疑。在海外,谷歌、微软、亚马逊、英伟达、Meta、苹果和xAI,每年在前沿技术上的投资高达 4000 亿美元,大部分资金都投向大模型和AI基础设施。

国内大厂中,阿里云投入压强最高,AI基础设施、基础模型、对外投资全覆盖。本届云栖上,吴泳铭表示,“阿里云正在以前所未有的强度投入AI技术研发和基础设施建设。”

过去一年,阿里云从以CPU为主导的传统计算体系,加速向以GPU为主导的AI计算体系演进,新增算力超50%都是AI算力。阿里云CTO周靖人在演讲中表示,阿里云正在围绕AI时代树立AI基础设施的新标准,全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。

周靖人在2024云栖大会现场展示了阿里云全系列产品家族面向AI的升级:最新上线的磐久AI服务器,并提供AI算法预测GPU故障,准确率达92%;为AI设计的高性能网络架构HPN7.0,可稳定连接超过10万个GPU ,模型端到端训练性能提升10%以上;人工智能平台PAI,已实现万卡级别的训练推理一体化弹性调度,AI算力有效利用率超90%。

在模型层,阿里云也持续饱和式投入,几乎保持以月为周期迭代基础模型。大会现场,阿里云宣布通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o,同时还发布了开源模型Qwen2.5系列,成为仅次于美国Llama的世界级模型群。

其中,Qwen2.5全系列模型都在18T tokens数据上进行预训练,相比Qwen2,整体性能提升18%以上,拥有更多的知识、更强的编程和数学能力。Qwen2.5全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录。

今年,大部分大模型厂商都试图通过降低大模型的使用门槛来推动大模型在更多行业落地。得益于基础设施的强大,阿里云在降低企业和开发者使用成本方面也是最积极也是最激进的厂商之一。

今年5月,阿里云抛出重磅炸弹,通义千问GPT-4级主力模型Qwen-Long价格直降97%,1块钱即可买200万tokens,相当于5本《新华字典》的文字量。降价后,Qwen-Long价格约为GPT-4价格的1/400,击穿全球底价。

本次云栖大会上,阿里云再次宣布百炼平台上的三款通义千问主力模型大幅降价。Qwen-Turbo价格直降85%,低至百万tokens0.3元,Qwen-Plus和Qwen-Max分别再降价80%和50%。其中,Qwen-Plus推理能力追平GPT4,是效果、速度及成本均衡的最优选择,降价后,Qwen-Plus同等规模较行业价格低84%。

同时,阿里云还在持续坚持开源模型路线。通义大模型一年多来坚持全尺寸、全模态开源,多次登上HuggingFace开源榜首,同时,通义开源模型累计下载量已经突破4000万,通义原生模型和衍生模型总数超过5万,受到开源社区众多开发者的追捧。

从模型服务到AI云服务,阿里云持续投入的强度堪称“中国卷王”,无论行业如何争论,反正开源闭源全覆盖,从底层基础设施到上层的大模型平台和模型社区全栈建设,布局的广度和深度,甚至全球无出其右。

阿里云的乐观和信心来自坚定的信念。少有人知道的是,阿里云从2018年便投入大模型研发,因此能够在ChatGPT掀起新一轮AI浪潮后迅速站稳国内基模第一的身位,而在前年云栖大会上,阿里云即提出MaaS模型即服务的理念,此后引领了全球云厂商面向AI时代的MaaS变革。

如今,阿里云看到的路是,只有提前布局,打造更强的基建,才能让所有人都能用上最先进的大模型,让企业和开发者以最低的成本使用AI,让整个行业更快拨云见日。

新闻热榜

1

赵杰女子链球夺铜

2

临沂中院举办全市法院“三强三优”成果展示会

3

中国高超音速再传喜讯,美学者发现不对:台岛已无用,应速速放弃

4

商务部刚刚正式宣布了!

5

我们为什么要跟美国争世界第一?被逼的!#科技#美国#中国崛起#科技强国#全球博弈

6

天眼早新闻8月16日

7

唐山市原副市长曹全民被查

8

联合国机构说超4万人在加沙地带死亡是“残酷的里程碑”

9

翁源县领导深入企业,共谋乡村文化振兴新篇章

10

跨国公司领导人青岛峰会召开在即,如何持续深化与跨国公司合作?山东副省长答极目新闻问

11

泰国政局“三足鼎立”佩通坦为何能够顺利当选?

12

台公布恶性撞船事件调查结论,国台办回应

13

体验跳水视网膜脱离

14

中企承建巴基斯坦莫赫曼德水电站实现截流

15

不得不说,民进党当局极其擅长撒"

16

荔枝应该怎么种?这些小细节要注意,农户们高产很容易

17

真人版“分小萌”上线顺义区光明街道深入推进垃圾分类工作

18

中国对锑等物项出口管制引关注,商务部:不针对任何特定国家和地区

19

澳门公布行政长官选举日程表

20

"王佳佳法官冤不冤?

21

最高检明确:对提供财务造假“一条龙”服务应从严打击

22

最新消息:伊朗报复以色列的剧本遭曝光!复仇计划让人恐惧!

23

河北省唐山市一级巡视员曹全民接受纪律审查和监察调查

24

辟谣纸板床中国制造

25

甲亢女:印度证明了西方殖民者的错误

26

印度眼中的十大强国

27

莫迪无奈“服软”,不得不使用人民币与俄交易,助力人民币国际化

28

衡山:全力加快应急广播建设民生实事工程“火热”推进

29

"台“海巡署”:对2·14撞船涉事人员不予起诉,对大陆提三点要求

30

辟谣甘肃煤气厂爆炸

31

美国政府批准了新一轮价值超过200亿美元对以色列军售计划此时美国批准对以军售实际上就是向以色列授权使其继续袭击加沙地带,并将冲突扩散

32

现在的舆论导向都怎么了?弱势群体就一定有理?法院如果不讲证"

33

中国对锑等物项出口管制引关注,商务部:不针对任何特定国家和地区

34

中老缅泰外长举行非正式会晤

35

新加坡发生水獭斗殴事件,场面相当惨烈,没看过水懒打架,来看看

36

王昶回应取关700人

37

文脉华章|心向往之

38

商务部:将进一步放宽外国投资者战略投资上市公司的限制

39

泰国政局"三足鼎立"佩通坦为何能够顺利当选?

40

全市首家区级茶叶行业工会联合会在静安成立→

20

俄罗斯罗斯托夫州一商场发生火灾约百人被疏散

20

他信之女当选泰国新总理,泰媒:振兴经济将是她上任后首个挑战

20

俄罗斯法院再次延长4名音乐厅恐袭案嫌疑人羁押期限

20

罕见暴雨袭击珠峰地区

20

女子铁饼冯彬摘银

20

全红婵家乡连夜修路

20

酒泉市林草局:贯彻二十届三中全会精神保障

20

王宗源谢思埸进决赛

20

#祝南阳市长跑运动协会西峡跑团授旗仪式圆满成功

热门攻略

1

张继科发文祝贺马龙

2

利比亚油田停产时间延长美国石油销售并未获得多大提振

3

市十八届政府第53次常务会议召开

4

联合国机构:以军发布新撤离令,加沙居民已“无处可去”

5

美挑拨无效!刚送走布林肯,越南火速开启访华,对菲律宾划清界限

6

上海公布市域线票价机制方案:两大机场互通单程26元,只需40分钟

7

郑钦文无缘闭幕旗手

8

船到法国,船员不得不说的一些见闻,女人热情,经历令人长见识

9

土耳其伊兹密尔省发生森林大火部分地区大火逼近居民区

10

美联储古尔斯比:失业率上升是一个警示信号

11

点“绿”成“金”|吃干“榨”净绿色青菜头垒起百亿大产业

12

古特雷斯:联合国准备为加沙儿童接种脊髓灰质炎疫苗

13

国乒男团进4强

14

海南坡鹿:从极度濒危到“呦呦鹿鸣”

15

佳县召开2024年度招商引资工作委员会第二次会议

16

商务部:支持各地开展精准、透明、合规的招商引资活动,把更多高质量的外资引进来

17

滨州市生态环境局与多部门联合开展“企业环保法律服务日”活动

18

福建省政府10位领导分工更新!

19

国家一把手时间最长的领导人

20

人类或能延长至130岁

20

美国新屋开工:7月下滑6.8%需求脆弱

20

曲阜市姚村镇召开网格员业务能力提升培训会

20

秋季香菜种植全指南:老农揭秘快速出苗的秘诀,别错过!

20

孟加拉国政局风云突变哈西娜流亡背后印度战略版图面临重塑?

20

潍坊寒亭:优化政务公开助力人居环境整治提升

20

谢瑜的偶像是马龙

20

俄国防部:已拦截12枚袭击克里米亚大桥的导弹

20

俄罗斯主动归还日本土地,只提出一个条件,日本为何不敢接受

20

上门给中方施压无果,500万人口小国恼羞成怒,放话扩大对华制裁

20

韩检方调查文在寅夫妇银行账户,共同民主党27名议员发联名声明:明显的政治报复,应立即停止

20

乌军攻入俄本土,中国外交部表态。近期,对于乌军突袭俄库尔斯克,中国外交部发言人表

20

圣卢西亚奥运首金

20

美国共和党副总统候选人万斯所乘飞机出现紧急情况迫降

20

#日本研究机构预测全球变暖将导致大米产量下降#日本

20

网约车订单层层转卖

20

杨军在通山县调研重点项目建设时要求夯实底盘加快发展

20

印尼总统佐科发表任内最后一次国情咨文

20

法国外长:讨论如何应对伊朗可能袭击以色列“不合适”

20

这几种配菜种植大揭秘,感兴趣的朋友快来尝试!

20

俄国防部称正在库尔斯克方向逐步摧毁乌军

20

迈巴赫送考少年发声

20

产城人融合政社企共建钱塘区推进产业社区“邻里模式”

20

台风“安比”将以巅峰16级,#强台风袭击日本!

20

区政协开展“教育信息化及教学设施提升工程”重点视察活动

20

男孩遭铁链栓脖拖行

20

普京与俄联邦安全会议成员召开会议

20

转运当你转运的时候就会看到这个视频~无论是有意还是无意~这是天意~从即刻开始~你将摆脱困境~不好的事全部解脱。

20

最高人民法院党组成员、政治部主任李成林参加王佳佳法官遗体告别仪式并看望慰问家属

热门游戏

  • 1
    吉铁路公司党委副书记、总经理黄鑫一行到陕煤集团座谈交流

    射击枪战 /热度:57252

    点击下载

    第八届金砖国家工业部长会议在俄罗斯下诺夫哥罗德召开

  • 2
    古特雷斯:联合国准备为加沙儿童接种脊髓灰质炎疫苗

    射击枪战 /热度:98513

    点击下载

    上海市委中心组学习会专题学习党的二十届三中全会精神

  • 3
    以色列情报:伊朗一再推迟报复袭击,或暗杀以高官

    射击枪战 /热度:76074

    点击下载

    #俄罗斯利器#S500

  • 4
    崩坏3 刘清漪霹雳舞摘铜

    射击枪战 /热度:18755

    点击下载

    撒谎毫不脸红-北溪爆炸后的西方政客和媒体

  • 5
    原神 伊朗副总统上任10天就辞职,美伊又展开秘密外交,极力避免开战

    射击枪战 /热度:09664

    点击下载

    深化国资国企改革(学习贯彻党的二十届三中全会精神)

  • 6
    出发吧麦芬 国台办:依法惩治极少数“台独”不涉及广大台湾同胞

    射击枪战 /热度:79859

    点击下载

    数字赋能2024年度云南省“数字国资”大会举办

  • 7
    永劫无间手游 立秋时节温差显著,籽粒发芽正当时太早太晚皆不宜

    射击枪战 /热度:97645

    点击下载

    小莫谈奥运夺金可能

  • 8
    向僵尸开炮 安徽省蚌埠市人大常委会原副主任汤春义接受审查调查

    射击枪战 /热度:52372

    点击下载

    欧洲疾控中心:欧洲地区猴痘新毒株感染输入病例或增多

  • 9
    鸣潮 俄罗斯法院再次延长4名音乐厅恐袭案嫌疑人羁押期限

    射击枪战 /热度:57560

    点击下载

    苏丹中部一村庄遭袭致80人死亡

  • 10
    艾塔纪元 特斯拉召回168万辆

    射击枪战 /热度:50697

    点击下载

    为博眼球?男子自称代表中国人给日本人道歉?低头鞠躬说对不起!

关于我们 | 联系我们 | 加入我们 | 网站地图 | 自助投稿 | 在线举报 | 玩家心声 | 最新咨询 | 新游试玩体验 | 游戏竞技教学 | 游戏技巧 |