大模型的百家争鸣,正推动AI技术加速进化。而“通用大模型+行业大模型”并行发展的策略,正被越来越多科技巨头采纳,并逐步成为一个行业共识。比如Meta此前发布的LLaMA开源大模型,其一方面要把大模型越做越大,另一方面则要把大模型做小,将其用在垂直领域。
(资料图片)
在国内,部分头部科技企业也采取同样策略。6月19日,在腾讯云举办的行业大模型及智能应用技术峰会上,腾讯云首次公布其行业大模型研发进展,并提出将依托腾讯云TI平台打造行业大模型精选商店,为客户提供MaaS(Model-as-a-Service)一站式服务。
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,过去半年,大家都为大语言模型的发展感到兴奋,在聊天问答上,市面上的通用大模型确实有让人惊艳的表现。同时,许多企业管理者也在思考,如何把大模型技术应用到自己的企业场景中,为业务经营带来更多降本增效。
“但在具体的企业场景中,通用大模型可能还不能满足企业很多需求。比如,它不一定懂行业的专业术语,不了解企业内部的独特情况,回答会比较虚、比较笼统,偶尔还会‘一本正经地胡说八道’,信息也不够及时。”汤道生说。
正因如此,在外界期待能力越来越强大的通用大模型出现时,企业也在思考,现阶段究竟该如何应用大模型。
行业大模型势在必行
过去半年,腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声收到非常多来自客户的问询,他们都非常关注AI大模型,并希望能够使用大模型。但吴运声表示,对绝大多数企业而言,自己做一个大模型要面临诸多挑战,包括资源门槛高,主要体现在计算资源和存储资源的要求上;还有投入成本高,以及专业经验少,安全、合规也是企业需要考虑的关键因素。
汤道生表示,“虽然大家对通用大模型期待很高,但它不一定是满足行业场景需求的最优解。”
通用大模型的训练一般都是基于广泛的公开文献与网络信息,这些信息可能有错误、谣言和偏见,也可能专业知识与行业数据积累不足,或导致模型的行业针对性与精准度不够,数据“噪音”过大。
而在很多产业场景中,用户对企业提供的专业服务要求高,容错性低。企业一旦提供了错误信息,就会引发巨大的法律责任或公关危机。因此,企业使用的大模型必须可控、可追溯、可修正,且必须经过反复与充分的测试才能上线。
“我们认为,客户更需要有行业针对性的行业大模型,用企业自己的数据做训练或精调,从而打造出实用性高的智能服务。企业需要在实际场景中真正解决某个问题,而不是在100个场景中解决了70%-80%的问题。”汤道生说。
行业需要“专属模型”
发布会上,腾讯云对外公布了其MaaS能力全景图。据介绍,依托腾讯云大模型高性能计算集群和行业大模型能力,腾讯云通过TI平台面向客户输出的MaaS能力,可以满足客户模型预训练、模型精调、智能应用开发等多样化需求。
其中,腾讯云TI平台行业大模型精调解决方案,具备完整大模型精调工具链,支持客户加入自己独有的场景数据,进行精调训练,客户可根据自身业务场景需求,定制不同参数、不同规格的专属模型。
事实上,模型最终要在真实场景落地,若想达到理想的服务效果,往往需要使用企业自身的数据。而在模型研发过程中,企业既要关注敏感数据的保护与安全合规,也要管理好大量的数据与标签,不断测试与迭代模型。而通过腾讯云TI平台以及模型的私有化部署、权限管控和数据加密等方式,能够帮助企业用户打造模型和使用模型。
吴运声在接受21世纪经济报道记者采访时表示,“在实践过程中,我们发现将大模型技术与行业经验、数据结合后,能够解决很多过去难以解决的问题。”
据腾讯云披露,其目前已经为金融、文旅、政务、传媒、教育等10余个行业提供了超过50个大模型行业解决方案。客户只需在大模型中加入自己独有的场景数据,就可以快速生成“专属模型”。
比如现场演示的文旅客服大模型场景,可以给用户提供不同档次的酒店推荐,甚至可以直接提供预订链接。这不仅为用户提供更加人性化的服务体验,同时也让智能客服系统实现服务商业化闭环。
不过,吴运声坦言,“现在这个模型的效果仍有很大提升空间,未来随着更多高质量数据的增加,相信效果会更好。”在他看来,现在行业大模型和产业的结合还处于早期阶段,未来随着大模型技术的突飞猛进,很多技术门类都会迅速发展。
此外,谈及行业大模型的成本问题,吴运声表示,大模型的成本主要在算力,有些场景应用行业大模型后成本甚至会降低。其举例说,很多复杂的问题,借助行业大模型后能轻松得到解决,这显然可以降低很多成本。
(文章来源:21世纪经济报道)