记者从中国电信获悉,2023世界人工智能大会期间,中国电信数字智能科技分公司(下称电信智科)正式对外发布中国电信大语言模型TeleChat,并展示了大模型赋能数据中台、智能客服和智慧政务三个方向的产品。
(资料图片仅供参考)
电信智科副总经理何忠江表示,近年来,人工智能开始爆发性增长,并进入生成式AI时代。在这过程中,人工智能从机器智能、感知智能转化为认知智能,即通过抽象推理的方式理解自然语言。
“其中,GPT模型是人工智能技术发展变迁的重要代表,作为一种自然语言处理模型,GPT模型通过在大型文本语料库上的训练学习到语言模式用于生成自然语言文本,为信息检索、机器翻译和文本摘要等多类任务提供了有效的解决方案。”
中国电信表示,公司依托云网融合的优势,打造了中国电信的大语言模型TeleChat。据介绍,TeleChat使用了大量高质量中英文语料进行预训练,并采用了千万级问答数据进行微调。同时,设计了渐进膨胀注意力机制,用于增加模型的间隔采样,扩大实际感受野;研发了自校准微调技术,将迭代后相关性偏差作为强化学习的监督信号,提升强化学习效果;并且利用知识图谱协同增强策略,通过知识图谱增强大模型的预训练和推理能力,减少大模型幻觉现象。
此外,以TeleChat为底座的教育版大模型TeleChat-E在全球大模型综合性考试评测榜单C-Eval上排名第七,前几名包括GP4、ChatGPT等知名大模型。TeleChat-E使用人工收集、标注、整理的高质量领域数据对TeleChat进行持续效果强化。同时,TeleChat-E对Transformer Decoder的损失函数进行改进,使之更加关注题目答案的生成,提高准确率。
何忠江指出,通过大模型机制,神经网络已经可以愈加拟人化。在当下,电信TeleChat大模型正在与千行百业的信息化解决方案进行融合,在诸多行业实现商业化落地。
一是大模型+数据中台产品。中国电信演示了将AI能力和数据中台深度融合,打造AI智能取数能力,基于大数据平台生成的可视化图表。目前已实现大数据中台大模型将数据平台的权限和脱敏能力打通,使用户可以获取到自己权限范围内的数据表中脱敏后的字段值,比如姓名、电话号码等。当进入到AI取数模块时,用户可以根据自身需求让大模型生成SQL、可视化图表和分析报告。
二是大模型+智能客服产品,TeleChat大模型能够辅助坐席或用户快速获取文章和材料内的信息。在现场演示中可以看到,通过一站式人机融合知识中台查看产品介绍材料,再激活大模型悬浮对话框,接下来上传需要模型理解的文件,即可得到理解后生成的反馈。在TeleChat的帮助下,坐席无需阅读全文找答案,既解决了模型幻觉问题,还能够做到知识库管理权限隔离。
三是大模型+智慧政务产品,中国电信TeleChat大模型依托5G消息,为政务客户提供政务短信智能化多轮问答,进行行业领域的基础语言模型训练和领域问答能力微调,并基于领域问题反馈的强化学习,最终实现对行业领域专业问题的精准回答和平台推送反馈。
记者注意到,不仅仅是中国电信,国内三大电信运营商都已经入局大模型赛道。上周,中国联通发布了图文大模型“鸿湖图文大模型1.0”。中国联通称,鸿湖图文大模型是首个面向运营商增值业务的大模型,该大模型目前拥有8亿训练参数和20亿训练参数两个版本,可以实现以文生图、视频剪辑、以图生图等功能。
中国联通负责人也频频就大模型行业的进展表态。中国联通董事长刘烈宏认为,大模型是继图形用户界面和触屏手机以来,又一次人机交互领域的颠覆性革命,从知识容量和学习速度而言,人类或许比不过AI,但AI的发展离不开人类的智慧,这也是未来科技创新型企业的“必备技能”。
中国联通国际有限公司董事长兼总经理孟树森则表示,2023年以ChatGPT为代表的大模型技术进步加快人类社会进入通用人工智能时代。数字科技企业既面临着三大问题的挑战,也迎来了全新的发展机遇:第一个层面是支持大模型训练的大算力需求带来的挑战,第二个层面是绿色发展带来的挑战,第三个方面是安全可信要求带来的挑战。
据悉,中国移动也将于7月8日首次发布“九天”1+N大模型。该大模型为通用智能的“人工智能大平台”,定位为新型人工智能基础设施,承载面向国民经济主体的通用智能大模型、行业大模型等,基于泛在的算网基础设施,实现数据的高质量利用。
近期,中国移动董事长杨杰表示,随着海量数据的不断涌现,面向数据感知、传送、存储、处理全环节提供一体化支撑服务,已成为全社会的普遍需求,特别是当前AI大模型的兴起,进一步激发了对高价值数据、高性能算力、高标准算法的迫切需求,推动信息基础设施和信息服务体系向连接、算力、能力深度融合的方向加速演进。
(文章来源:证券时报·e公司)