×

跃进 范式 文心 百度 言首秀

文心一言首秀,百度的AI范式跃进

jnlyseo998998 jnlyseo998998 发表于2023-04-06 14:31:07 浏览20 评论0

抢沙发发表评论

文丨潘几鹤

“帮我写一首思乡的歌曲。”

第一时间拿到邀请测试码的小何,输入了这个问题,很快,对面抛出了几段惆怅的歌词:

“在远方的天空,是否还有家乡的月亮?看着天边的夕阳,我的心中充满惆怅……”

网线那头,与小何互动的,是3月16日,百度正式启动邀请测试的生成式AI产品文心一言。它基于百度新一代大语言模型,作为ChatGPT的关键对标产品,当天的首秀备受海内外关注。

新闻发布会上,百度创始人、董事长兼首席执行官李彦宏亲自出席并做现场演示,足见重视。

从演示效果来看,文心一言某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性,均逐渐接近人类水平。

展开全文

“确实不能说完美。”李彦宏说,最近一段时间,他接到了不少人询问“真的ready了吗”,尽管大语言模型还远未到发展完善的阶段,但一旦有真实的人类反馈,文心一言的进步速度会非常快。

中国AI市场已处在爆发性增长前夜,商业价值的快速释放,有赖于革命性产品的引领。外界翘首以待,真正来自全球一线大厂的商业化产品落地。

现在,百度第一个补上了空缺位。

国产第一枪

ChatGPT虽好,但暂不支持中国IP使用,中文语义理解的准确性也有待加强。

世界科幻文坛最高奖“雨果奖”得主郝景芳说,她使用一个汉化版本、底层模型基于ChatGPT做的中文机器人,提问是否知道“鸡娃”,得到一个标准的外国机器人答案:

“鸡娃”就是母鸡的小娃。

中国的普通用户期待使用门槛更低、更懂中文的自家版本。

发布会现场,李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。

其中,值得一提的是中文理解能力。

“‘洛阳纸贵’是什么意思?”“用洛阳纸贵四个字写一首藏头诗。”

面对需要深层次理解中国文化的问题,文心一言能迅速给出解释和创作回答。

由于使用的是扎根于中国市场的大语言模型,文心一言具备先进的自然语言处理能力,拥有对中文语言,以及对中国文化的深层次理解。

这意味着它将比国外开发的模型,更适合中文用户和中国市场。

接下来回到最基础的能力范畴。

从文学创作、商业文案的创作能力来看,文心一言与ChatGPT的水平不相上下,可以准确回答“《三体》作者是谁”等问题,能给公司起名、写slogan、写新闻稿。

复杂的数理逻辑推算,也不在话下。例如经典的“鸡兔同笼”问题,文心一言按步骤算出了正确答案。

据业内人士评估,百度的大语言模型,较ChatGPT可实现整体持平,局部超越。

需要指出的是,ChatGPT并未实现底层模型的显著突破,其最大的创新在于文本内容生成,巧妙地通过交互式对话的方式,基于人类反馈进行强化训练,在体验上带来智能的感觉。

现阶段的生成式AI,主要是单模态的,信息处理主要依靠文字。

由单模态智能向多种模态融合方向演进,是文心一言、ChatGPT等生成式AI的一个明确发展方向。

围绕下一代多模态模型的创新,李彦宏现场展示了文心一言生成图片、音频、视频的能力,甚至还能生成四川话等方言口音,已走向“Chat”之外更大的范畴。

未来文心一言势必会继续强化多模态生成能力,技术能否超车,得看这个关键落点。

生态护城河

生成式AI领域,能参与的初创公司寥寥无几。做出ChatGPT的OpenAl,尽管是家创业公司,身后也站着投资100亿美元的微软。

进入门槛高,因为实在太烧钱了。

资料显示,跑通一次100亿以上参数量的模型,算力至少需要1000张GPU卡,按一张GPU五万元的市场均价计算,1000张GPU意味着单月至少5000万元的成本。

业界测算,GPT-3单次训练成本至少需要460万元,资金消耗速度惊人。

单算力这个维度,就筛掉了一大批入局者。

那么,凭什么百度能做?

13年前,对AI的未来满怀信心的百度,早早开始加码AI,做马拉松式、压强式的投入。

累计下来,近10年的研发投入超1400亿元,每年研发占收入比例都超过15%。

在一个高投入见效慢的领域,保持耐心和决心是储备先发优势的唯一道路。

十年如一日的日积月累,带来的是AI人才矩阵、技术水平和数据规模的无短板领先,构筑起生态护城河。

作为全栈自研AI技术架构的公司,百度在IT四层技术栈,芯片(昆仑芯)、框架(飞桨深度学习框架)、模型(文心大模型)和应用(搜索等),均有深度自研。李彦宏表示,放眼全球,能在四层架构的每一层都有领先产品的公司,几乎没有。

这带来的底气,是四层技术栈可实现端到端优化,尤其是框架层和模型层之间,具有强协同性,能帮助构建更高效的模型,显著降低成本。

其中,文心一言所处的模型层,市面上主流的大模型仅由几家科技巨头以及少数研究机构掌握,初创公司只能依靠开源模型,进行应用创新。

百度首席技术官王海峰介绍,作为新一代知识增强大语言模型,文心一言在ERNIE及PLATO系列模型的基础上研发,关键技术,包括监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。

前三项是这类大语言模型普遍采用的技术,文心一言做了进一步强化和打磨;后三项是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。

多年自研,大量投资,形成的产品反应速度是一般厂商很难快速跟进的。

去年9月,李彦宏给出判断,无论是在技术层面还是在商业应用层面,人工智能都有了巨大的进展,有些甚至是方向性的改变。

有观点推测,或从那时开始,百度就在做文心一言的开发。

无法低估的价值

正式测试前,官宣与文心一言达成合作的企业,已超过650家,遍布互联网、媒体、金融等行业。

他们将优先内测试用文心一言,在百度技术团队协助下,打造联合解决方案,先一步探索AI+的新范式。

产品还没见着影子,“朋友圈”就提前搭好了。市场对内容生产智能化的火热态度,可见一斑。

看到文心一言正式测试的消息,一位刚升级做爸爸的网友,很兴奋地留言,“给孩子取名字的事,可以委托文心一言来帮忙了!”

写剧本、敲代码、给孩子取名……人们不必苦于智能语音助手的傻瓜式回答,聊天机器人的到来,开启的是一个以人为本的数字智能时代。

北京师范大学教授、教育部特聘教授喻国明认为,以文心一言、ChatGPT为代表的新一代智能互联技术,是对人类的又一次重大赋能赋权。

“它突破了不同人群在资源使用与整合方面的能力差异,使每个人至少在理论上可以用一种社会平均线之上的语义表达和资源动员能力,进行社会性的内容生产和对话。”喻国明表示。

相较C端,新生产力工具对千行百业的赋能、提效,更是指数级的。

李彦宏预测,大语言模型将为云计算、行业模型精调和基于大模型的应用服务,带来巨大的产业机会,尤其在应用层面,会有更多杀手级应用、现象级产品出现。

拿AI客服来举例,目前在各领域应用广泛的智能客服,经常会出现答非所问、回答死循环的问题,被吐槽“听不懂人话”。

若能用上文心一言的技术能力,快速推理用户的提问逻辑,不仅能提高解决问题的效率,还能赋予人性化的沟通体验,建立情感连接。

开放文心一言大模型,帮有需要的企业离客户更近,创造更大的商业价值,在这方面百度想得很清楚。

公司明确多次表态,未来支持更多企业构建自己的模型和应用,赋能交通、能源、制造等实体经济领域,实现生产效率的大幅提升。

新闻发布会当天,百度宣布,百度智能云将面向企业客户开放文心一言API接口调用服务,搜索“百度智能云”进入官网,即可申请接入并体验文心一言能力。

李彦宏透露,百度智能云接下来会有重要动作宣布,主题围绕文心一言的云服务和应用产品,既有公有云服务和也可以做私有化部署。

“我们相信,人工智能会彻底改变我们今天的每一个行业。AI的长期价值,对各行各业的颠覆性改变,才刚刚开始。”李彦宏说。