在震惊科技行业的AI聊天机器人ChatGPT发布近四个月后,OpenAI公司又发布了为ChatGPT提供支持的更为强大的下一代技术版本GPT-4。
超过90%人类考生
GPT-4根据大量在线数据进行训练,并支持微软的搜索应用Bing。“如果您在过去五周内的任何时间使用过新的Bing预览版,那么您已经体验过这个强大模型的早期版本。”微软表示。
OpenAI称,尽管在许多现实场景中它仍然“能力不及人类”,但它表现出“在各种专业和学术基准上的人类水平表现”。GPT-4还可以读取、分析或生成多达25000 个单词的文本,并以所有主要编程语言编写代码。
在谈到GPT-4比前一个版本强大在哪里时,OpenAI称,虽然这两个版本在随意的谈话中看起来很相似,但“当任务的复杂性达到足够的阈值时,差异就会出现”,GPT-4更可靠、更有创意,并且能够处理更细微的指令。
该公司表示,GPT-4响应禁止内容请求的可能性比其前一个版本低82%,并且在某些真实性测试中得分高出40%。
自去年11月推出以来,ChatGPT已经能够根据用户提示生成原创文章、故事和歌词,但它也引发了一些担忧。最近几周,人工智能聊天机器人(包括来自微软和谷歌的工具)因情绪反应过激、犯事实错误和完全“幻觉”而受到指责。
对此,OpenAI公司CEO奥特曼在Twitter上称,GPT-4是其模型“最有能力且最符合”人类价值观和意图的模型,尽管“它仍然存在缺陷”。
“它仍然存在缺陷,仍然有限,但它有明显的改进。“奥特曼写道,“它比以前的模型更有创意,它的幻觉明显减少,而且它的偏见也更少。”
两周前,OpenAI 宣布将向第三方企业开放其ChatGPT工具的访问权限,为聊天机器人集成到众多应用程序和服务中铺平了道路。
RBC Capital Markets分析师Rishi Jaluria表示,微软将从GPT-4的采用中受益。
展开全文
本月早些时候,在2023微软Azure中国年度技术峰会上,微软首次面向企业推出了Azure Open AI云服务,借助该平台,企业用户可以发掘大规模AI与商业场景结合的潜力。
谷歌发布医学大模型2.0
科技巨头们正在ChatGPT引爆的人工智能领域展开新一轮竞争。谷歌周二宣布推出基于医学大模型Med-PaLM最新版本的AI医疗健康聊天机器人。
Med-PaLM是第一个在类似于美国医疗执照考试中分数超过60%人类考生的人工智能系统。谷歌表示,该技术的更新版Med-PaLM 2在体检的问题上达到“专家”水平,准确率超过85%,得分比之前的结果高出18%。
不过谷歌医疗研究负责人Alan Karthikesalingam表示,该公司还在根据真实医生和临床医生的反应测试Med-PaLM的答案,并对偏见和潜在的伤害进行评估。鉴于医疗信息的敏感性,还需要一段时间才能推向普通用户。
根据研究机构Omdia最新发布的一份报告,虽然ChatGPT、Stable Diffusion和其他生成式人工智能为市场带来的明显兴奋和潜在机会真实存在,但生成式人工智能并无法解决任何类型的人工智能所面临的任何市场挑战,生成式人工智能并非灵丹妙药。
“生成式人工智能不会解决人工智能面临的基本挑战,偏见、隐私、责任、一致性和可解释性。”Omdia首席分析师Mark Beccue表示,“事实上,生成式人工智能在很大程度上加剧了这些问题。例如,作为大多数生成式人工智能输出来源的大型语言模型(LLM)采用公共数据进行训练,这些公共数据可能包括有偏见的内容,这意味着输出本身可能存在偏见或不恰当。”
AI大模型开发的另一个重要的问题是高昂的成本。英伟达为AI训练提供大量的GPU,其中主要用于GPT模型训练的A100芯片每一块的价格高达1万美元。分析师和技术专家估计,训练GPT-3等大型语言模型的耗资可能超过400万美元。
为此,英伟达已经宣布了一种新的商业模式,向尚无法触及AI能力的中小企业开放云端AI能力,企业可以通过租赁云服务的方式来完成AI软件的开发工作。
英伟达创始人CEO黄仁勋预计,未来10年内,人工智能的效率将再提高100万倍,因为不仅在芯片方面,而且在软件和其他计算机部件方面的技术都会发生显著改进。
“未来会出现新的处理器、新系统、新的互联、新框架和新算法,我们会与数据科学家、AI研究人员合作开发新模型,事实上,在过去的计算机发展过程中,我们已经使大型语言模型的处理速度提高了100万倍。”黄仁勋表示。
来源:第一财经