界面新闻记者 | 佘晓晨
界面新闻记者 | 佘晓晨
阿里大模型“通义千问”正式面世后,阿里加速推进生态网的建设,在其一众产品中进行应用测试。
几天之前,阿里云曾宣布大模型“通义千问”开始邀请测试。而在4月11日的云峰会上,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。
例如,钉钉接入通义千问测试之后,可以自动生成工作方案,或者在会议纪要后自动生成总结和待办事项,也可以拍一张功能草图自动生成小程序。
除了自家产品的测试,阿里云正在用大模型撬动更多企业合作的机会。阿里云智能CTO周靖人介绍,阿里云将推出企业专属大模型产品,目前已经与首批企业进行合作共创。企业可以在阿里云上调用通义千问的能力,也可以结合企业自身的行业知识和应用场景,训练自己的企业大模型。
对于如何实现这种企业专属模型的服务,周靖人在接受界面新闻等媒体的采访中表示,阿里云会为企业提供一个专门的数据空间,企业可以将相关的信息放入到这一专属空间,且不需要做任何数据的预处理,包括PPT、Word、图片、视频和知识图谱等形式的信息。
展开全文
在这一过程中,阿里云提供一键式生成大模型的能力,在企业的授权下理解企业各种模态的数据,这些数据将和通义千问结合在一起,解决行业特定的一系列问题。
周靖人称,企业也可以参与模型的开发过程,提个性化的诉求,包括特别注意点、行业规范等。
大模型研发背后需要底层算力、网络、存储、大数据、AI框架等众多复杂技术的支撑,在其引爆全球科技圈之后,云计算厂商如何用底层技术为大模型的训练提供支撑、如何为企业提供相关服务,成为行业的又一个竞争点。
周靖人进一步补充称,阿里云可以把企业专属模型部署在公共云甚至企业专属的区域中,其中,第一种使用模型的方式是通过对话和模型进行验证、交流和交互,类似于通义千问的产品形态,也可以做一些定制化服务,集成到企业需要开发的网页里。
另一种方式是通过API的方式把模型的能力释放出来,这就需要更多的开发者采用不同的方式进行调用。
和AIGC(生成式AI)在C端的应用不同的是,大模型在B端的应用必须做到更加准确。“一个问题没回答对,对于企业来说都不可接受。”周靖人认为,这方面怎么保持更多的鲁棒性(指一种系统的稳定性),是今天专属大模型要解决的问题。
正如前几家巨头发布大模型之后,更多行业开始踊跃加入大模型的应用探索,发布会当天,阿里云宣布将与OPPO安第斯智能云联合建立OPPO大模型基础设施。此外,吉利汽车、智己汽车、奇瑞新能源、毫末智行等企业将与阿里云在大模型相关场景展开合作。
但在具体选择和哪一家大模型合作上,企业的考量标准似乎还未清晰。
周靖人表示,企业或开发者更关注如何把模型的能力应用和释放出来,解决当前的业务问题。他认为,参数的大小并不代表模型的大小和好坏。且不同模型之间、不同参数之间,原则上也不完全可比,“参数只是模型复杂度参照的一个指标。”
对于和ChatGPT的差距,他认为,GPT在各个方面确实处于领先地位,“这是科技进步的一个必然阶段。”而对于包括阿里云在内的科技大厂来说,除了继续追赶大模型的训练和进行安全评估之外,成本的降低依然是一大难题。这也是阿里云接下来重点要攻克的方向。张勇当天表示,未来希望在阿里云上训练一个模型的成本,能够降低到现在的十分之一,甚至是百分之一。