深圳特区报讯(记者 周雨萌)“帮我画《灌篮高手》中的樱木花道”,只见两三秒时间,对话框便生成了樱木花道的头像;“帮我写一篇百度文心一言的新闻稿”,一篇约300字左右的短讯就生成了……昨日,百度正式发布新一代大语言模型、生成式AI产品——文心一言,并开启首批内测,本报记者率先体验了一把与这款AI产品的对话。
文心一言是继OpenAI发布ChatGPT后,中国第一款生成式语言大模型产品。在此次体验过程中,文心一言都能快速捕捉关键词,并准确给出想要的答案,全程的使用体会是流畅、好用。
百度创始人、董事长兼首席执行官李彦宏在会上多次提及,这类大语言模型还远未到发展完善的阶段,进步空间很大,未来这段时间它一定会飞速发展,日新月异。
现场,李彦宏也演示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。其中,文心一言可以续写知名科幻小说《三体》,共提出五个续写《三体》的建议角度,并准确回答了《三体》作者、电视剧角色扮演者等事实性问题。
在面对“于和伟和张鲁一有哪些共同点”这类问题,文心一言基于推理能力也得出了正确答案。文心一言还顺利完成了给公司起名、写Slogan和新闻稿的创作任务。体现出其具有对话问答、总结分析和内容创作生成等综合能力。
此外,文心一言还表现出优秀的中文理解及多模态生成能力。例如,其能正确解释成语“洛阳纸贵”的含义、其对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。更有趣的是,文心一言能够生成四川话等方言语音。
据介绍,文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。
文心一言是百度过去多年投入AI、持续努力的延续。百度首席技术官王海峰道出了其背后的技术:“文心一言是新一代知识增强大语言模型,是在ERNIE及PLATO系列模型的基础上研发的。其关键技术包括监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。其中,后三项是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。”
据了解,百度是全球为数不多,在“芯片-框架-模型-应用”四层进行全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,到搜索、智能云、自动驾驶、小度等应用,各个层面都有领先的自研技术。
目前,百度是全球大厂中第一个做出对标ChatGPT产品的企业。李彦宏指出,无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。
文心一言和生成式AI代表了一个新的技术范式,自今年2月百度官宣“文心一言”以来,包括深圳报业集团、金蝶等已超过650家企业单位宣布接入文心一言生态。很多企业也已经意识到,这种新的技术范式将会影响到千行百业。
会上,李彦宏预测,大语言模型将带来三大产业机会。第一类是新型云计算公司、第二类是进行行业模型精调的公司、第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。
“我们相信,人工智能会彻底改变我们今天的每一个行业。AI对各行各业的颠覆性改变才刚刚开始。未来,将会有更多的杀手级应用、现象级产品出现,将会有更多的里程碑事件发生。”李彦宏说。