AI大模型正解:通用VS垂直?
来源:中国经营网 发布时间:2023-06-20 15:55:12

作为当前全球科技发展的重要专项,人工智能也是我国的重要战略先导机遇。随着大模型等技术迎来商业化应用,全球各国都在孵化和孕育各类通用的行业大模型。

不过,相较于此前一窝蜂扎进通用大模型,如何基于大模型研发针对行业细分领域的垂直的模型受到更多的关注。当前,已经可以看到不少垂类模型应用在金融、医疗、交易等场景中。


(资料图)

多位业内人士在接受《中国经营报》记者采访时表示,基于算力需求大、训练和推理成本高、数据质量不佳等挑战,未来底座大模型不会有特别多,而相比通用大模型,垂直大模型作为一种全新的生产力,随着其底层能力的不断突破,必然能实现企业的降本增效,带来上层应用的迭代和变革。

多模态大模型角逐

在“ 2023 中关村论坛”上发布的《中国人工智能大模型地图研究报告》显示,当前,中国人工智能大模型正呈现蓬勃发展态势。据不完全统计,截至目前,参数在 10 亿规模以上的大模型全国已发布了 79 个。“出品方”涵盖互联网巨头、AI概念上市公司、服务器龙头企业、科研院所与一级市场创业公司。

但纵观国内的大模型,大多聚焦在语言模型上。

中科院自动化所 “ 紫东太初” 大模型研究中心常务副主任、武汉人工智能研究院院长王金桥对记者表示,“包括ChatGPT、以及国内的大模型基本上都聚焦语言模型,我们认识世界70%的数据是靠视觉,10%靠触觉,其他的靠听觉及其他的信息,要实现低功耗更类人的智能,必须融合多模态的信息。”

不仅如此,高成本、高门槛等问题也制约着大模型在商业场景的落地。百度文心一言大模型参数量在2千亿级以上、京东言犀大模型的参数量为千亿级,腾讯混元大模型和华为盘古大模型参数量均在万亿级以上,阿里通义千问大模型参数更是在 10 万亿级以上。

王金桥表示:“未来底座大模型不会有特别多,因为底座大模型成本很高、技术门槛也高,底座大模型训练一次基本上要耗费约1000万元的电力的费用,所以不是所有的工作都能承担。国内的很多大模型还是围绕垂直行业的解决方案,模型不大,但是它们有一些行业的核心数据和业务系统的生产数据,所以他们在某些行业有一定的优势,我相信未来一定会是‘底座模型+垂直类’的模型互相融通。”

中国科学院自动化研究所副所长曾大军认为:“现有大模型的算力和能耗挑战会促使很多工作向领域专用化、轻量化的方向发展,特别是金融、教育、医疗、交通等领域,大量的工作在试图降低大模型的成本。”

凌迪科技Style3D创始人兼CEO刘郴也认为,不是每个行业都有必要做大模型,对于对于一些企业来说,训练基础模型的成本非常之高,这对于很多企业来说是不现实的。未来大模型往往都是巨头的天下,企业直接使用就可以了,但是行业模型一定要训练,大模型未来会成为整个社会的基础设施,行业模型会成为行业的基础设施。

实际上,部分公司已经意识到这样的问题,在经历过最初的迭代升级,百度、阿里、华为等公司由最初的大模型开发下探到具体的行业应用中。

如中国科学院自动化研究所基于昇思推出的全模态大模型“紫东·太初2.0”定位相当于拥有世界知识的底座模型,通过产业联合体和专家数据在智慧汽车、智能医疗、智能制造、数字政务这四个领域开展应用示范。

共建AI生态

无论是基于自然语言处理、机器视觉、深度学习、强化学习,还是垂直行业模型,并不是互联网大厂们的“玩具”,也不是闭门造车就能完成的工程。

因研发推出ChatGPT而进入聚光灯下的OpenAI,也正因闭源备受争议。马斯克作为OpenAI的创办人之一,近日在社交媒体上炮轰:“OpenAI最初是作为一家开源的非营利性公司而创建的,为了抗衡谷歌,但现在它已经成了一家闭源的营利性公司,受微软控制……这完全不是我的本意。”

OpenAI CEO萨姆·奥尔特曼(Sam Altman)表示,我们未来会有更多开源,但没有具体模型和时间表。

“虽然现在的大模型竞争火热,但无论是OpenAI还是谷歌,都没有护城河,因为‘开源’正在AI大模型领域崛起。”在一份谷歌泄露的文件中,谷歌内部研究人员认为,开源模型或将引领大模型发展的未来,这份文件中提到“开源模型的迭代速度更快,可定制性更强,更有私密性,而当免费的、不受限制的替代品质量相当时,人们不会为受限制的模型付费”。

智源研究院院长黄铁军说道:“大模型产业很难形成垄断,需要共建产业闭环。从长远来看,大模型只是标签,而不是产品、一家公司的工具,所以整个大模型开源开放生态是必然的。”

在国内,大多数人工智能大模型的发展坚持开源创新和生态引导。目前,超过一半国内发布的大模型已经实现了开源。《中国人工智能大模型地图研究报告》显示,北京、广东、上海在开源数量和影响力上均排名前三。高校和科研机构是开源主力,清华大学的chatglm-6b、复旦大学的moss、百度的文心系列大模型在开源影响力上位居三甲。

昇思MindSpore开源社区的理事长丁诚对记者说道:“从开源社区的角度来看,我们是非常希望大模型生态能够互融互通。大模型训练过程当中,数据是非常核心的资产,各家大模型训练能把相关的数据贡献出来做开源共享,是可以集整个产业之力达到中国或者全人类更好的大模型。对于算法的核心资产,目前的确各家都有自己的核心武器,如果大家更开放一点,把这个东西以开源的方式共享出来,在技术上可以互通有无,可以实现更好的大模型为整个产业服务。”

在王金桥看来,业内都认为ChatGPT代表着人工智能的iPhone时刻,可以看到iPhone的生态是闭源的,安卓是开源的,但现在OpenAI的代码、模型、参数都不开放,也不申请专利,今年还迅速涌现非常多的开源开放的模型。“国内有这么多模型,这是依赖于全球开源体系集体智慧的贡献,开源开放才能实现我们的互融共通。而且越来越多的模型会开源开放,更多的模型会加入社区,来适配国产化的硬件,这样才能建立起相当于整个国内开源开放的体系,使我们能够基于中文的单模态或者多模态,实现互助融通的发展。”

(文章来源:中国经营网)

标签:

猜你喜欢

AI大模型正解:通用VS垂直?

作为当前全球科技发展的重要专项,人工智能也是我国的重要战略先导机遇更多

2023-06-20 15:55:12

财通资管旗下财通资管新能源汽车混合年内跌10%

截至2023年6月19日,财通资管旗下的财通资管新能源汽车混合发起式A(013更多

2023-06-20 16:00:26

飞猪“618”机票次卡爆款累计成交额破3亿元-今日

“618”大促接近尾声,6月20日,新京报贝壳财经记者获悉,今年“618”更多

2023-06-20 16:00:21

招商银行信用卡可以提前还款吗?提前还分期的信用

招商银行信用卡可以提前还款吗招商银行信用卡可以办理提前还款。持卡人可以根据已出账单、未出账单...更多

2023-06-20 15:45:31

向象牙制品说不!大连海关查获象牙制品2件

据海关总署办公厅官方微博@海关发布消息,近日,大连海关所属大连周水更多

2023-06-20 15:11:33

涉嫌受贿罪 最高检依法对范一飞决定逮捕

最高检消息,中国人民银行原党委委员、副行长范一飞涉嫌受贿一案,由国更多

2023-06-20 15:10:54

环球快讯:哈尔滨铁路7月1日实行新的列车运行图

中国铁路哈尔滨局集团有限公司(以下简称哈尔滨局集团公司)20日发布消息更多

2023-06-20 14:07:02

焦点热门:我国成功发射试验二十五号卫星

北京时间2023年6月20日11时18分,我国在太原卫星发射中心使用长征六号更多

2023-06-20 13:59:47

当前视讯!这场“村晚”节目选拔活动真精彩

6月20日,江北区优秀群文节目展演暨“大地欢歌& 183;乡约四季”乡村村更多

2023-06-20 13:52:59

观热点:深度合作!中国工商银行双APP同时入驻云

为深入贯彻中央经济工作会议关于扩大内需、促进消费的工作部署,落实人更多

2023-06-20 12:58:41