中国电信发布大语言模型TeleChat
近日,中国电信数字智能科技分公司对外发布中国电信大语言模型TeleChat,并展示了大模型赋能数据中台、智能客服和智慧政务三个方向的产品。 电信智科副总经理何忠江表示,近年来,人工智能开始爆发性增长,并进入生成式AI时代。在这过程中,人工智能从机器智能、感知智能转化为认知智能,即通过抽象推理的方式理解自然语言。其中,GPT模型是人工智能技术发展变迁的重要代表,作为一种自然语言处理模型,GPT模型通过在大型文本语料库上的训练学习到语言模式用于生成自然语言文本,为信息检索、机器翻译和文本摘要等多类任务提供了有效的解决方案。 中国电信依托云网融合的优势,打造了中国电信的大语言模型TeleChat。TeleChat使用了大量高质量中英文语料进行预训练,并采用了千万级问答数据进行微调。同时,设计了渐进膨胀注意力机制,用于增加模型的间隔采样,扩大实际感受野;研发了自校准微调技术,将迭代后相关性偏差作为强化学习的监督信号,提升强化学习效果;并且利用知识图谱协同增强策略,通过知识图谱增强大模型的预训练和推理能力,减少大模型幻觉现象。 此外,以TeleChat为底座的教育版大模型TeleChat-E在全球大模型综合性考试评测榜单C-Eval上排名第七,前几名包括GP4、ChatGPT等知名大模型。TeleChat-E使用人工收集、标注、整理的高质量领域数据对TeleChat进 行 持 续 效 果 强 化 。 同 时 ,TeleChat-E对TransformerDecoder的损失函数进行改进,使之更加关注题目答案的生成,提高准确率。 何忠江指出,通过大模型机制,神经网络已经可以愈加拟人化。在当下,电信TeleChat大模型正在与千行百业的信息化解决方案进行融合,在诸多行业实现商业化落地。 中国电信将AI能力和数据中台深度融合,打造AI智能取数能力,基于大数据平台生成的可视化图表。目前已实现大数据中台大模型将数据平台的权限和脱敏能力打通,使用户可以获取到自己权限范围内的数据表中脱敏后的字段值,比如姓名、电话号码等。当进入到AI取数模块时,用户可以根据自身需求让大模型生成SQL、可视化图表和分析报告。 TeleChat大模型能够辅助坐席或用户快速获取文章和材料内的信息。在现场演示中可以看到,通过一站式人机融合知识中台查看产品介绍材料,再激活大模型悬浮对话框,接下来上传需要模型理解的文件,即可得到理解后生成的反馈。在TeleChat的帮助下,坐席无需阅读全文找答案,既解决了模型幻觉问题,还能够做到知识库管理权限隔离。 中国电信TeleChat大模型依托5G消息,为政务客户提供政务短信智能化多轮问答,进行行业领域的基础语言模型训练和领域问答能力微调,并基于领域问题反馈的强化学习,最终实现对行业领域专业问题的精准回答和平台推送反馈。 (郑大海)
|