星火大模型加快“赶超”ChatGPT 第A7版:信创 20230530期中国工业报

    ■ 郑大海
   自ChatGPT发布以来，技术阶跃持续进化，人工智能在全球引起了广泛关注，掀起了全新的热潮。ChatGPT的推出是深度学习提出后的又一个里程碑，将为自然语言处理为核心的认知智能技术发展提供新的机遇期。
   近日，科大讯飞发布星火认知大模型。这是科大讯飞最新推出的新一代认知智能大模型，具备跨领域多任务上类人的理解和生成能力，可实现基于自然对话方式的用户需求理解与任务执行；同时，通过多元能力融合统一赋能各行各业，基于科大讯飞新一代大模型训练框架，持续从海量数据和大规模知识中不断学习进化。
   科大讯飞董事长刘庆峰表示，认知大模型正成为通用人工智能的 “曙光”，并可以实现在通用领域的 “智慧涌现”。它不仅带来了内容的生产和分发方式的全新变化、人机交互的根本性变革，也会对科研、办公、工业、互联网带来全新的颠覆和机遇。他预测，传统的靠堆时长和人力的商业模式，在未来两三年之内将被彻底改变。
加速赶超要有科学的方法和体系
   刘庆峰表示，从ChatGPT关注的48个主要任务方向和讯飞开放平台上400多万开发者团队的需求分析，通用人工智能应当具备七大维度能力，包括文本生成、语言理解，知识问答、逻辑推理、数学能力、代码能力、多模态能力等。
   认知大模型的 “智能涌现”将带来解决人类社会刚需的全新机遇。而科大讯飞已为认知大模型的 “智能涌现”做好了源头核心技术的储备。
   2011年科大讯飞便承建了语音及语言信息处理国家工程实验室，“我们提出让机器像人一样能听会说，这一次认知大模型本质上是一次对话式的通用智慧的涌现，语音和语言的核心能力是一个基础条件。”刘庆峰说。
   2014年科大讯飞推出 “讯飞超脑计划”，明确提出：让机器像人一样能理解会思考。2022年，又升级为 “讯飞超脑2030计划”，提出让懂知识、善学习、能进化的通用人工智能技术成为每个人未来发展的重要机会，让机器人走进家庭。
   刘庆峰表示，“在国家平台和讯飞超脑计划的支撑下，过去几年我们在认知智能领域取得了一系列全球领先的成果。”2017年，科大讯飞承建认知智能国家重点实验室，也就是从这一年起，科大讯飞不仅让机器在全球首次通过了国家职业医师资格考试、超过了96.3%参加考试的医生，并且在SQuAD机器阅读理解中全球首次超过人类平均水平，2022年在OpenBookQA科学知识推理中，单模型也超过人类平均水平。
   “多年以来，科大讯飞在认知智能领域有了丰富的储备和积累。”刘庆峰表示，在2022年12月15日，科大讯飞正式启动 “1+N”认知大模型专项攻关，其中 “1”就是指通用认知智能大模型，“N”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。
   刘庆峰表示：“我们要向OpenAI学习，同时也要快速追赶并努力超越，而这需要一套科学系统的评测体系。”科大讯飞通过认知智能全国重点实验室牵头设计了通用认知大模型评测体系，并与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨形成了覆盖7大类481个细分任务类型。在科学的评测体系中，推动讯飞星火认知大模型的发展。
   刘庆峰强调，“今天要看一个大模型系统到底好不好，首先要看它是不是能解决刚需、是不是真的有用，而不是一个简单的单点测试。”
大模型迸发 “智慧”火花
   无论是文本生成、语言理解，还是知识问答、逻辑推理，亦或是数学能力等，星火认知大模型都表现出色。
   星火认知大模型的七大核心能力，即多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情景式思维链逻辑推理、多题型步骤级数学能力、多功能多语言代码能力、多模态输入和表达能力。大模型更是在文本生成、语言理解、数学能力上迸发“智慧”火花。刘庆峰表示，在长文本生成上，星火大模型在国内明显领先，并且在中文方面超过了ChatGPT，并且在持续进步中。
   大模型能理解特定的句子和场景含义，随着问题的变化，灵活调整自己的答案。此外还展示了 “情感分析”能力，展现出跟人类共情的潜力。刘庆峰表示，讯飞星火的语言理解能力相比ChatGPT还略有差距，但是已超越国内同类产品。
   在数学能力中，讯飞星火大模型展现出“学霸”气质。除了常规计算、几何、情景应用等，讯飞研究院院长刘聪现抛出了复杂的计算题，星火大模型很快准确给出了答案，并给出了解题步骤。刘庆峰表示，数理能力一定程度代表了一个大模型的聪明程度。讯飞星火大模型不仅在国内系统中遥遥领先，也超过了ChatGPT。
   星火认知大模型具备很好的通识知识，能够对生活常识、科学知识、工作技巧，以及医学知识等应对自如，该能力也已超过ChatG－PT。此外，星火大模型也具备逻辑推理能力与代码能力，还将进一步升级多模态输入和表达能力，不断实现自身迭代进化。
   刘庆峰公布了今年大模型技术持续升级的三个关键里程碑节点：6月9日，将突破开放式问答、多轮对话能力明显提升、数学能力再升级；8月15日，代码能力升级以及多模态交互能力提升，希望能帮助到更多的合作伙伴及开发者团队；10月24日，将实现通用模型对标ChatGPT，中文超越ChatGPT的当前版本，英文能做到相当水平，并在教育、医疗等领域做到业界领先。
开放共建人工智能生态
   “人工智能的发展绝不是单个企业和单个科研机构的事情，而是需要大家合作共赢的。”刘庆峰说。
   讯飞开放平台新增星火认知大模型，将赋能开发者打造更具价值的AI应用。目前，讯飞开放平台已经开放了560项AI能力，并聚集了超过500万生态合作伙伴。
   在新时代的机遇下，科大讯飞将通过能力开放、插件开放、行业共创，与千行百业共建生态。
   据了解，首批来自36个行业的3000余家企业开发者将接入星火大模型，联合各行业合作伙伴共建大模型 “星火”生态。
   科大讯飞启动 “2023科大讯飞AI星火营生态计划”，面向千行百业的开发者，提供技术赋能、方案打造、赛事运营、商业运作、创业扶持等多维度资源，推动大模型的应用落地。
   科大讯飞期待联合更多行业合作伙伴共建大模型的 “星火”生态，推动人工智能与实体经济深度融合并在更多行业和应用场景中落地开花，让新一轮的产业变革真正 “星火燎原”。
   刘庆峰表示，我们要抢抓通用人工智能的历史机遇，必须要在自主可控的平台上；必须要同时做中文和英文，不能只学习中国的 “智慧”，还要向世界学习；在 “硬碰硬”的科技对比上，我们不仅要学习，还要想办法赶超。相信通用人工智能的星火一定可以在中国形成燎原之势，人工智能也将因解决人类刚需而被更深刻地载入史册。