在认为“大模型至少有10年红利期”之后,三六零(601360)董事长周鸿祎又强调,要把大模型“关在笼子里”,让大模型刚开始先开启副驾驶模式。
7月2日下午,由北京市人民政府联合工信部、国家网信办、商务部、中国科协共同主办的全球数字经济大会在北京召开,周鸿祎在该大会的人工智能高峰论坛上作出上述论断。
在周鸿祎看来,大模型真正的机会在企业级市场,未来可能不是百模大战,而是万模群舞;要做企业级市场需要的大模型,“五化”是关键方法论,即行业化、企业化、垂直化、小型化、专有化。
(资料图片仅供参考)
“在大模型目前还有点不靠谱的前提下,政府和企业产品刚开始利用大模型的步子要小一点,不要轻易向大模型开放API、函数,要采取监控审计手段,把大模型‘关在笼子里’。让大模型刚开始先开启副驾驶模式,与现有的业务系统保持相对独立和隔离度,做到安全可控、安全落地、快速执行。”
截至6月30日收盘,三六零股价为12.54元,总市值896亿。
大模型真正的机会在企业级市场
在周鸿祎看来,大模型不是风口和泡沫,而是一场新的工业革命,但只有大模型走进千家万户、赋能百行千业,才能真正推动这场人工智能带来的革命。
具体来讲,大模型直接提高每个人、每个组织的劳动生产力,同时实现了一种通用人工智能能力的赋能,“电脑刚发明的时候也没有带动工业革命,刚开始只是一些物理研究、气象预报,高精尖的领域才用到电脑,距离普通人、普通企业很远,后来PC走入家庭和企业,才改变世界。”
业内有观点认为,将来中国和全世界可能就是一两个大模型,因此把大模型比喻为操作系统,大部分公司可能没有机会。
对此,周鸿祎不予认同。
在他看来,未来大模型的趋势不会只有一两个,而是会像数据库一样,变成每个数字化系统的标配,包括小到手机上的配置、中等规模的汽车上的配置,以及企业和政府内部的部署。
周鸿祎强调,大模型真正的机会在企业级市场,包括政府和城市;大模型的发展一方面要发展核心技术,另一方面要找各种应用场景;一个纯粹的技术只有和应用场景相结合才能创造持续不断的商业价值;未来可能不是百模大战,而是万模群舞。
垂直模型解决专业问题的能力更强
周鸿祎认为,公有大模型存在四方面问题:
首先,公有大模型是通才,但缺乏行业深度,不能满足企业级应用场景的垂直性、专业性问题。
其次,存在数据安全隐患问题,易造成企业内部数据泄露。
其三,无法保障内容可信,公有大模型存在“幻觉”,无法保障内容真实可信,有据可查。
其四,公有大模型无法实现成本可控,直接训练和部署千亿级参数大模型成本过高,企业级应用应该使用百亿级基础模型,根据不同需求,训练不同的垂直模型(如代码、法律、客服)。
周鸿祎指出,当我们带着通用大模型API走进政府、城市和企业,就会发现,光有大模型,直接用起来有很多问题。ChatGPT刚开始时很惊艳,觉得什么都能回答,但如果真的是行业专家提出很深度的问题,它的能力是有限的。
“行业内部、企业内部真正有价值的知识,公开渠道是拿不到的,光有大模型没有办法满足行业和企业的垂直场景的专业性要求。”
在周鸿祎看来,每个企业自己内部的Knowhow是核心资产,肯定不会训练到公有大模型;公有大模型使用会有数据泄露的问题,它是生成式AI,本身算法的特点就是会胡说八道,而且是一本正经、理直气壮地胡说八道。
“这个特点用来做小说、写剧本,作为聊天机器人逗闷子效果很不错,但放在企业级场景问题就很大,要是真的拿医疗大模型开的药方,你敢不敢相信?敢不敢吃?”
因此,周鸿祎指出,要做企业级市场需要的大模型,“五化”是关键方法论:
第一是行业化。要有行业深度训练的数据才有价值。
第二是企业化。需要和企业内部知识库进行配合,而且做到实时迭代更新,从而保证大模型更懂企业。
第三是垂直化。不要试图用一个大模型解决所有问题,大模型未来在企业落地形态一定是多个垂直模型组合,垂直模型解决专业问题的能力更强。
第四是小型化。在把大模型做大的同时,还有一个趋势是把大模型架构的参数、训练数据集做小。未来如果一个大模型管理自动驾驶、智能座舱,不可能在云端瞬时响应,可能每辆车都有一个大模型架构。
第五是专有化。中国市场不会是全部都是公有云的市场,公有云会占到一部分,很多大型央企、国企、政府机构对数据在哪里存储比较重视,所以专有部署能够保证安全可控。
把大模型“关在笼子里”
先开启副驾驶模式
在周鸿祎看来,传统的网络安全、网络攻击、漏洞、算法安全、数据安全问题都能够找到方法解决,“最可怕的是生成内容不安全”;构建企业级大模型应遵循安全、可信、可控三原则,大模型与企业现有数字化系统要保持相对独立,有一定的隔离度。
“在大模型目前还有点不靠谱的前提下,政府和企业产品刚开始利用大模型的步子要小一点,不要轻易向大模型开放API、函数,要采取监控审计手段,把大模型‘关在笼子里’。”周鸿祎强调。
对于企业大模型如何落地找场景,周鸿祎认为:
首先,要把大模型目前最擅长、最成熟的能力用好。
“以现在的大模型为例,最擅长的能力其实就两点,问答对话和写作生成。政府和企业使用的时候,应该先从几个成熟的角度切入,如果一上来就和企业业务系统紧密耦合在一起,做成很复杂的应用,我的经验是恐怕难以收敛。”
其次,从痛点刚需选择场景,小切口、大纵深。
“真正用大模型,你会天天算奥数题、脑筋急转弯吗?其实不会,真正需要的场景还是跟大多数人相关,办公场景是刚需。面向员工有企业知识搜索、知识管理和培训,面向领导有信息决策和舆情分析,对内有办公生成办公协作,对外有提高用户体验的智能客服。在目前企业的数字化、智能化程度不高的情况下,这些场景是企业办公的痛点,也是大模型最能够提高效率的地方。”
周鸿祎强调,大模型不是万能的,微软提供了一个很好的例子,“所有的场景都是副驾驶,可以给你导航、给你建议、给你指点,但不会乱抢方向盘”。
“我觉得,让大模型刚开始先开启副驾驶模式,与现有的业务系统保持相对独立和隔离度,做到安全可控、安全落地、快速执行。如果非要和现有系统结合在一起,很多单位的API可能都没有人维护了。”
(文章来源:中国基金报)