×

狂飙 落地 模型 残酷 意义

不落地,无意义:狂飙的AI大模型竞争到底有多残酷?

jnlyseo998998 jnlyseo998998 发表于2023-04-26 14:50:04 浏览15 评论0

抢沙发发表评论

“我实在不行了,论文实在是跟不上,代码实在是跟不上。Just too much(太多了)。”

说出这些有点垂头丧气话的,不是别人,正是业界AI大牛,被认为是“中国AI布道人”、前百度集团总裁兼首席运营官、现奇绩创坛创始人兼CEO的陆奇。在近期的一次分享活动上,陆奇直截了当地表示自己跟不上大模型时代的狂飙速度。

作为国内针对大模型最有发言权的人之一,陆奇都难以穿过迷雾真正看透大模型时代的走向,并被后者的发展速度所震惊,我们也就能够知道天翻地覆的变化即将到来。纵览当下大模型领域的态势,或许用“百舸争流千帆竞”来形容最合适不过。

面对大模型时代带来的大机遇,有能力的企业都在积极推出自家的相关产品,并积极抢占生态位。甚至大模型还成为了一个“噱头”,不少企业都抛出来去蹭热度、提高关注度。但无论造势如何浩大、声量如何喧嚣,唯有真正落地,企业方有机会“成王”。

纷纷入局,白热化阶段跃然而至

人人都知道一个必然趋势——未来,是一个模型无处不在的时代。

只有站在风口上,才有扶摇直上九万里的可能。国内国外资本市场、企业的注意力,都在被大模型吸引,并纷纷入局。例如在美国,今年1月到3月有很多资金投入到大模型领域,且每个月都保持着高增长。国内也基本一样,商业模式、盈利模式有初步规模,基础设施、平台应用、生态体系在加速推进,且科技巨头、初创公司等都在进入。

猝不及防间,大模型时代在发展初期就迅速进入白热化阶段。这主要体现为:模型推陈出新、企业棋布错峙。而在这场“大模型混战”中,我们看到诸多熟悉的身影。

在模型方面,各大企业纷纷推出自家的大模型。比如,百度文心大模型包含NLP、CV等在内的系列大模型。文心大模型包含NLP大模型、CV大模型、跨模态大模型、生物计算大模型、行业大模型等。与Bing类似,文心一言有望优化C端用户搜索、创作体验;ToB方面,百度已开放大模型API接口,在文案、AI作画、开放域对话方面赋能企业。对于具体行业,百度推出文心行业大模型,以“行业知识增强”为核心特色。

至于阿里巴巴的通义大模型,则由通义-M6模型融合语言模型和视觉模型组成,率先应用在硬件终端天猫精灵和软件通义千问。通义大模型包括统一底座“M6-OFA”,三大通用模型“通义-M6”“通义-AliceMind”“通义-视觉大模型”,以及行业层面的不同垂直领域专业模型。

展开全文

而腾讯混元大模型采用热启动降低训练成本,文字视频等多领域表现优异,已在广告游戏等多场景落地。此外,华为在算法、算力上储备较为丰厚。比如“鹏城云脑II”获全球IO500排行五连冠,拥有强大的AI算力和数据吞吐能力。

字节跳动的AI探索基础扎实,在语言大模型和图像大模型初步布局。字节跳动的AIGC大模型将从语言和图像两种模态发力,预期在今年年中推出大模型。字节跳动在算力、算法、数据方面并无短板,目前模型可用于图文、视频内容生成等,飞书则推出智能AI助手“My AI”。

除了这些科技巨头外,还有其他企业也在大模型领域伸出自己的“触角”。4 月 10 日在商汤技术交流日活动上,商汤科技推出大模型体系“商汤日日新大模型”,包括自然语言生成、文生图、感知模型标注、以及模型研发功能。此外,商汤科技还宣布推出商汤自研中文语言大模型应用平台“商量”。

而互联网大佬杀入战场进行创业,也在成为潮流。继王慧文后,又一位互联网大佬——搜狗公司创始人王小川携5000万美元,杀入大模型领域创业。在这个全新时代,属于各路大牛的“诸神之战”也愈发精彩。

狂飙,加速狂飙!所有有实力入局的企业、大牛都在提速,试图抢占大模型新时代的制高点。对于科技领域来说,这样热闹的景象已有很长时间不曾出现。大模型的亮相与进化,看起来要打破存在已久的桎梏和瓶颈。

落地更重要,竞争的核心角力点

百舸争流,奋楫者先;中流击水,勇进者胜。

在看似热闹的大模型领域,众多企业现在还只是处于“亮剑”状态,并未展开贴身肉搏的白刃战。这主要是因为企业不只是要对自家的大模型进行长时间且持续性的训练,还要在应用层面进行摸索,并尽可能地发展更多的合作伙伴、赋能更多场景。

这也意味着,大模型领域的参与者其实都非常清楚:落地更为重要。否则,残酷的一面就会出现——狂飙的车轮会把华而不实的凑热闹者狠狠碾过。

大模型领域的确在蓬勃生长,但繁荣态势能够持续多久,依然要取决于能否落地,并在应用层面实现质的突破。也就是说,大模型要通过良性循环让自身健康发展。可以看到的是,落地正在成为企业在大模型领域展开竞争的核心角力点,也是通向“王座”的必由之路。

在落地这一方面,不少企业已经开始有了实际案例。

比如,百度在AI方面布局多年,具有一定大模型先发优势。当前已经有650家企业宣布接入文心一言生态,还有更多的企业在排队,申请文心一言API调用服务测试的企业已突破6.5万。目前百度文心行业大模型在能源、金融、航天、制造、传媒、城市、社科以及影视等领域,与国网、浦发、吉利、TCL、人民网、上海辞书出版社等均有案例应用。

阿里通义大模型在逻辑运算、编码能力、语音处理方面见长,集团拥有丰富的生态和产品线,在出行场景、办公场景、购物场景和生活场景均有广泛应用。4月11日,2023阿里云峰会在北京举行,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇在会上表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。

腾讯混元大模型则已经在广告投放、游戏制作投入使用,比如在广告业务中应用AI模型,助力广告主提升广告创作效率、提升广告推荐系统的内容理解能力,大幅提升了广告效率,实现降本增效。目前,腾讯集合集团内资源与顶尖人才,正在全力打造类ChatGPT对

话式产品,预计投入使用后将对QQ和微信生态有一定优化。

华为与B端合作紧密,现在及未来应用以ToB为主。华为盘古大模型是基于ModelArts研发设计的系列模型,在物流、药物研发、气象预测等多领域已实现落地。目前,盘古CV大模型已覆盖物流仓库监控等领域;NLP大模型覆盖了智能文档检索、智能ERP和小语种大模型;科学计算大模型则应用于气象预报、海浪预测等方面。

可以看到,众多企业不仅在开展新一轮打模型竞赛,还希望借助大模型能力打造“模型即服务”的范式。产业链的丰富则将触发新一轮变化,并刺激应用层面的百花齐放。

落地为王,是对大模型时代风向非常清晰的认知。这也能够理解,为何企业更愿意发力大模型和产业的结合。这也让“客户”和“MaaS(模型即服务)”成为高频热词,“接入我们的大模型”则成为共同目标。随着大模型应用的想象空间被进一步扩充、潜力被进一步挖掘,未来自然加速而至。