作为第一个消费级人工智能(AI),聊天机器人ChatGPT风靡全球。那么,相对于之前的AI,ChatGPT有哪些突破,AI的突破性进步对人类意味着什么?我们是否需要担心它作恶?在这一轮AI竞赛中,中国会掉队吗?

对上述问题,记者近日专访中国信通院云计算与大数据研究所所长何宝宏。他认为,与以往类似聊天机器人相比,ChatGPT的智能化程度的确有大幅提升,其文本交互能力接近于人类水平,具体又表现在具备强交互、强理解和强生成三大能力上。


(资料图片仅供参考)

以ChatGPT为代表的AIGC(利用人工智能技术生成内容)技术将促使AI产业迎来拐点,进一步带动生产力变革。ChatGPT背后的大模型技术及应用范式,将极大冲击现有人工智能产业研发路线,发展方式或将迎来新拐点。但从目前使用情况来看,ChatGPT类的人工智能应用也带来诸多风险挑战。

以下为采访实录:

ChatGPT为何轰动?

国是直通车:就计算能力与现有的技术而言, ChatGPT是什么级别?其技术牛在哪?

何宝宏:这是第一个消费级AI爆款。ChatGPT是第一款面向消费者的AI应用,主要功能为与用户进行智能化的聊天对话,属于偏任务型的多轮对话和问答系统,是公众第一次亲身体验现代人工智能的强大功能。

ChatGPT背后主要是由GPT-3.5大模型支持。作为第3.5代GPT模型的衍生模型,ChatGPT充分发挥了监督指令微调(Instruction tuning)和从人类反馈中强化学习(RLHF)等技术作用,能够理解多轮对话,表现更接近人类。因此,它比2016年AlphaGo“阿尔法狗”战胜世界冠军更具有轰动效应。我对数字技术“7年之痒”规律性的阐述,再次在AI领域得到验证:7年左右必须得变,要么升维,要么变型,要么消失。

国是直通车:ChatGPT的出现,是否意味着人类距离实现量产类人机器人的梦想又前进了一步?

何宝宏:与以往类似聊天机器人相比,ChatGPT的智能化程度的确有大幅提升,其文本交互能力接近于人类水平,具体又表现在具备强交互、强理解和强生成三大能力上。强交互性表现在通过多轮对话,其可以对过往聊天内容进行再学习,在对话中不断改进输出文本的质量;强理解能力表现在能够分析用户模糊的语言,准确理解用户意图,辨别对话中不正确的提问,拒绝不适当的请求;强生成能力表现在可以按照要求生成用于不同场景、不同形式的文字,包括邮件、小说、论文和代码等,据报道ChatGPT已通过美国行医执照、研究生考试等。

国是直通车:ChatGPT能够带来比AlphaGo更大的冲击波,实现的条件是什么?是否受限于算力,或最终受限于硬件?

何宝宏:ChatGPT的实现离不开大算力加持。OpenAI对其研发和运营的投入是巨大的,目前OpenAI训练高度依赖于微软Azure AI超级计算机支持,另据估算,ChatGPT训练一次成本约为460万美元。此外,ChatGPT运营成本高昂,按照百万级别用户量计算,每月运行成本约为300万美元。

ChatGPT会让人类大规模失业吗?

国是直通车:ChatGPT会让哪些商业前景、哪些领域从业人员受影响?有些人担心自己未来会因其失业,这种担心是否多余?

何宝宏:技术突破性的进展会带来产品与应用的变革。最直接的就是,ChatGPT推动人机交互方式进化,继而会推动人机对话在智能客服、智能音箱、智能车载等众多场景的不断深化应用,使得相关行业客服效率提升、人力成本降低。另外,ChatGPT将助力AIGC探索落地,包括在软件代码编写、工业设计、分子结构预测等科研生产领域探索应用,帮助缩短研发周期、降低试验成本。

目前以ChatGPT为代表的AIGC主要还是辅助人类,方便人们快速、灵活地生成内容。未来如何利用具备创新性的工具进行原创创作,将成从业者的核心竞争力。

国是直通车:ChatGPT未来会怎样发展?将对人类带来哪些变化?

何宝宏:以ChatGPT为代表的AIGC技术,将促使AI产业迎来拐点,进一步带动生产力变革。ChatGPT背后的大模型技术及应用范式,将会极大冲击现有人工智能产业研发路线,发展方式或将迎来新拐点。根据美国知名投资机构a16z和OpenAI创始人Sam Altman的分析,大模型的重要性不亚于底层基础软硬件平台,将在未来人工智能产业格局中发挥类似基础设施的作用,大量上层应用不再单独研发智能算法技术,只需调用大模型接口。

ChatGPT智能化的人机交互模式带来了巨大想象空间。与“阿尔法狗”的最大区别在于,它有可能改变每个人的信息获取方式。

ChatGPT会作恶吗?

国是直通车:计算技术的实现需要借助于硬件,是否可以理解为,人类始终有一把“钥匙”可以把技术可能给人类带来的伤害“锁上”?或者说,不必对ChatGPT或将来可能出现更厉害的技术过分担心?

何宝宏:存在两方面的问题:ChatGPT幻觉和ChatGPT的危害。

AI幻觉指模型过于自信,生成的内容与提供的源内容无关或不忠实,有时会出现听起来合理,但不正确或荒谬的答案。与此同时,随着ChatGPT应用增长,人们会对AI产生越来越多的信任。ChatGPT幻觉来自两个方面,一是训练数据本身,二是训练方法。AI是通过海量数据训练出来的,因此这一缺点也与大数据的问题一样:数据很精确但错得离谱。

围绕ChatGPT的新一轮有害信息和犯罪,已经在路上。AI伦理、算法偏见、信息茧房、侵犯版权、网络诈骗、网络暴力、种族主义、性别歧视等,一个也不会少。另外,ChatGPT自称不得表达政治观点或从事政治活动,但已有的一些回答案例很明显有“它”的倾向甚至价值观。还有,不管ChatGPT实际理解或事实内容如何,内容审核者都会偏好更长的答案,不管质量,先拿字数凑。

国是直通车:有研究者担心在ChatGPT等生成式人工智能的新一波创新竞赛中,会步搜索引擎、社交媒体和大数据商业的后尘,使得诚信、隐私、知识产权等伦理和法律上的权利和基本价值观沦为牺牲品。您怎么看?

何宝宏:从ChatGPT现在的使用情况来看,ChatGPT类的人工智能应用已经带来了诸多风险挑战,对此国家相关法律政策也在陆续出台。随着社会持续关注,人工智能等新技术的发展和治理也越来越受到重视。建议组织跨学科团队,深入研究ChatGPT等新技术应用对现有法律规范、伦理道德等带来的冲击,系统梳理潜在风险挑战,及早研究相关风险防范措施。鼓励各方积极参与人工智能安全技术研发、防范体系搭建和治理规则制定等工作,加快布局我国人工智能安全标准、伦理规则的研究。

中国会被落下吗?

国是直通车:ChatGPT热度飙升,近几天百度、谷歌不约而同宣布推出类似项目,是蹭热度还是有其他考量?在这方面中国公司整体上实力如何?

何宝宏:近期,随着ChatGPT持续火热,全球范围内都对以ChatGPT为代表的AIGC应用抱有更高期许,ChatGPT凭借其智能化人机交互方式有望成为互联网新入口。当前,互联网信息获取方式主要是搜索和推荐,ChatGPT具有显著差异,不再仅仅是对信息内容的呈现或推送,而是对已有信息内容消化理解后的再生成。

这一范式的变化,引起了全球互联网行业高度关注。微软宣布将ChatGPT能力与必应搜索(Bing)、办公软件(Office)等进行深度集成。据报道,谷歌管理层已经发布“红色代码”警报,全面应对ChatGPT带来的“威胁”,正紧锣密鼓地测试一个名为“学徒巴德”(Apprentice Bard)的聊天机器人。

我国大模型底层技术布局薄弱,虽然已涌现一批大模型,但均从谷歌提出的Transformer等基础模型衍生而来,当前大模型底层技术、基础架构均由国外头部企业掌握,且部分模型不开源仅提供接口服务,我国技术存在“卡脖子”隐患。

在这样的背景下,谷歌和百度宣布推出类似项目,我认为这是企业自身的商业逻辑,同时也为大家提供了更多选项,我作为用户乐见其成。另外,谷歌、百度等企业在大规模语言模型这一技术领域有着较深技术积累,一些前沿技术已经服务于我们所熟悉的翻译、智能客服等场景,至于这次推出新项目的效果,让我们拭目以待。

国是直通车:以百度多年来在AI领域的技术积累,其即将面世的类ChatGPT项目,在大模型的可靠度、数据质量、应用场景和商业模式方面,与OpenAI ChatGPT相较,可能的优势和劣势有哪些?

何宝宏:OpenAI推出ChatGPT仅仅2、3个月时间,用户数量快速增长,毫无疑问已经占得了先机,但针对这类新技术的应用场景或商业模式探索,整体上仍处于早期阶段,目前还面临技术成熟度不足、成本高等各种问题,并且如何与现有治理体系相协调也要进一步研究。对于一项新技术,人们常常会高估其短期价值,而低估其长期价值。长远来看,我认为无论是OpenAI的ChatGPT,还是百度的“文心一言”,在技术、产品方面还有很大提升空间,未来才是真正值得我们期待的。

国是直通车:英文数据库信息汇聚全球数据信息,这一优势可能是中文数据库难以企及的,中国的AI厂商应如何定位?未来要想拓展全球市场,需要如何进化和迭代自己的技术和产品?

何宝宏:数据被认为是人工智能三驾马车之一,构建高质量的数据集对于训练人工智能系统重要性不言而喻。近年来,我国企业、高校、研究机构都在数据集上做了很多工作,整体上看存在一定差距,但客观上这是一个长期工作。

越来越多人认为人工智能产业格局会发生变化,一部分AI企业会往下走,发挥基础设施作用;另外一部分企业会往上走,专注于解决行业应用问题。这对于中国乃至全球人工智能企业而言,既是机遇也是挑战,关键在于企业自身决策。(文/刘育英)

推荐内容