随着ChatGPT“声名大噪”,今年两会上围绕着ChatGPT的声音也层出不穷。科技部部长王志刚在“部长通道”上表示,要像ChatGPT一样做到算法的实时性和有效性并不容易——我国在这方面做了很多布局,也有一些成果,但要达到ChatGPT的效果,可能还有众多工作要做。
与此同时,ChatGPT带来的风险也不可忽视。目前,已有不少用户发现它给出的回答并不准确,而在这之外,ChatGPT还存在着例如技术垄断、资本扩张、数据滥用、算法歧视、隐私侵权等诸多风险,可能产生负面影响。
对此,有代表委员建议建立大型科技企业+重点科研机构的产研协同创新模式,加强人工智能机器学习的基础研究,并呼吁政企协同,打破信息孤岛。
1
所需算力巨大,呼吁加大相关投入
据了解,GPT-3模型所需的算力是3640PFlops-day,意思是以每秒执行364亿亿次运算的速度计算一天,也是当前世界上超级计算机研制的最高水平。也因此,训练ChatGPT需要的算力不可小觑。
在长期深耕算力领域的全国政协委员、中国科学院计算技术研究所研究员张云泉看来,之所以有观点认为ChatGPT的核心竞争力是算力,是因为算力的门槛很高,需要顶尖的硬件基础和高昂的成本投入。
此外,张云泉指出,由于各国的技术上存在差异,且这一次OpenAI对ChatGPT后续的改进算法并没有开源,这说明后面这几步非常关键。“这种算法的改进,包括编码、指令、对齐等聊天方面的算法都是有专利的,可能在短期之内不会向外公布。更让人忧虑的,是去年美国开始在算力上制裁中国,包括限制英伟达高端芯片A100,以及下一代H100芯片的出口,后来还出现了带宽和内存降低了的“阉割”版A100。虽然国内目前也在研发中国版AI芯片,但还没有一家能够完全对标英伟达A100或者H100。所以我建议咱们国家一定要加大在ChatGPT相关研发上的投入,要在芯片、算法上集中人才和力量,争取早日实现突破,打破垄断,弥补差距。”
2
展开全文
语料库存在差异,建议打破“信息孤岛”
在算力的改进之外,人工智能基础研究也同样重要。全国政协委员、南京大学计算机系主任兼人工智能学院院长、欧洲科学院院士周志华同样表示,ChatGPT的成功显示出“大模型大数据大算力”这条路具有潜力,产业界多半会跟着当前最火热的路线走,但学术界应该鼓励百花齐放。
他还在今年的提案中提及,当前人工智能领域中基础研究被应用研究“淹没”的现象较为明显,应加强人工智能机器学习的基础研究。
除此之外,也有意见认为,由于中英文存在的语料库大小差异,国内研发同类产品的预期成本可能比国外要大。第十四届全国政协委员、360集团董事长周鸿祎认为,由于中文语料库相比较小,ChatGPT的中文表现得确实不如英文好。
他认为,知识是无国界的,要开发ChatGPT类产品要有一种开放的、全球化的心态,“一定要能够从全球获取知识。如果只拿中文语料训练它,在知识维度上它就会缺乏全球视野。”
目前,中国互联网内仍存在着“信息孤岛”的问题,屏蔽外部链接、“二选一”等恶意排除竞争对手的行为频频出现、屡禁不止。周鸿祎指出,这可能会阻碍中国ChatGPT的研发:“如果你的数据我拿不到,我的数据也不给你,最后大家训练出来的产品能够真正超越ChatGPT吗?我觉得会比较难。”
“信息孤岛”可能是出于竞争的需要,但是对用户体验是一种伤害。因此,周鸿祎希望政府出台政策来解决这个问题,大家可以公平地拿到互联网全量数据。我们也需要把做研究的人和产业化结合起来,形成一个生态,创造出适合的土壤,这样才能培养出“参天大树”。
3
或可利用ChatGPT“反制”黑客攻击
南都记者注意到,此前已有多名专家指出,ChatGPT存在着一定的负面风险,此前已有多名专家呼吁警惕利用ChatGPT的黑客攻击。周鸿祎指出,ChatGPT的安全问题已经从技术问题变成了社会伦理问题,甚至变成了一个人类面临的不可预知的问题。“因为ChatGPT掌握了非常多的编程知识,我也很担心ChatGPT成为黑客作恶的工具。”
全国政协委员、奇安信董事长齐向东认为,ChatGPT的诞生标志着人工智能已经成为科技革命的核心技术,能极大提高生产力。但需要警惕的是,这也会带来新的安全隐患。
“现在,高水平的黑客只是一小部分人,大部分攻击者都是‘小打小闹’。但人工智能技术能让黑客的水平跃升,因为它懂得更多的漏洞知识,懂得更多攻击方法,甚至会写攻击代码。”齐向东解释。
当然,人工智能可以成为网络安全防护的有力武器、极大提高网络安全防护效率。周鸿祎指出,人们也可以探索用ChatGPT搭模型来解决攻击的自动检测、建立知识库。“如果用得恰当,ChatGPT也可以扮演正义助手的角色。 ”
综合:南都记者胡耕硕