发布日期:2024/09/03文章来源:钛媒体
8月28日,第十届中国国际大数据产业博览会(简称数博会)如期而至。不同于很多大会,一届、两届以后关注度就直线下降,即便已经经过十载,数博会的举办依旧是整个行业关注的焦点。
大会期间,各省市政府、服务供应商都带来了过去一年间在数据产业的成果,而本届大会也受到了国际的关注,现场有不少来自异国他乡的数据产业从业者。
数博会在见证了贵阳这座城市成为中国大数据产业标签的同时,也见证了中国大数据产业高速发展的这十年。仅过去的5年间,贵州大数据产业规模就实现了翻番。据统计,2023年,贵州大数据电子信息产业年总产值(收入)达2200亿元、五年实现翻番,软件和信息技术服务业增速位居全国前列、规模5年增长5倍,云服务“首位产业”收入占全省软服收入70%以上。
这其中,作为贵州省数据产业发展的重点地区——贵阳市,成绩更是令人赞叹。2023年,贵阳贵安软服业收入突破800亿元,增长20.6%。数据早已成为贵阳这座“山中之城”新的名片。
从数据资源到数据资产,数据越来越重要
十年弹指一挥间,回看2015年,彼时数据这个词才刚刚被大家所“知晓”,无论是企业、政府,还是个人对数据的重要性似乎都还没那么重视,甚至有很多企业不知道数据为何物。
10年间,伴随着云计算的发展,企业对数据有了初步的认知,从原本觉得数据“一文不值”,逐渐变得越来越重视自身数据安全,再变得认识到数据的重要性,开始尝试用自身的数据,甚至外部的数据赋能业务发展,寻找新的增长点。
2020年4月,国务院发布文件《关于构建更加完善的要素市场化配置体制机制的意见》此次意见首次把数据和土地、劳动力、资本、技术四大传统要素并列,成为第五个生产要素。这也让数据成为政府、企业关注的焦点,随后的几年数据产业发展步入了快车道。
尤其是在2022年底,ChatGPT横空出世以后,新一轮AI的浪潮席卷各行各业,企业对于数据的重视程度越来越高。而2023年10月,国家数据局的正式成立将数据的重要性推到了最高峰。
国家数据局局长刘烈宏28日表示,当前,数据作为新型生产要素已经深刻融入经济社会各领域,加快构建以数据为关键要素的数字经济,离不开强有力的数据产业的支撑,国家数据局将从优化产业布局、培育多元经营主体、强化政策保障等3方面系统布局培育壮大数据产业。
与此同时,刘烈宏在开幕式上介绍,数据产业是一个新兴产业。从技术创新看,数据可信流通技术加速迭代;从资源配置看,数据有力促进了其他生产要素的创新性配置;从应用成效看,数据与业务融合更加紧密,深度赋能产业转型升级。培育数据产业,是推进数据要素市场化配置改革的重要途径,也是发展新质生产力、推动高质量发展的必然选择。
回看中国数据产业发展历程,中国信息通讯研究院云计算大于数据研究所所长何宝宏将中国数据产业发展大致分为三个阶段。
第一阶段,因为大数据技术的发展,企业实现了原始数据到数据资源化的转变;第二阶段,受益于区块链、隐私计算等加密技术的发展,2020年至今,绝大多数企业实现了数据资源到数据资产的转变;第三阶段,在何宝宏看来,如今到2030年,通过信托、数据要素市场化等方式,数据资产将变成企业的数据资本,成为企业资本积累的重要举措。
而数博会这十年也见证了数据从资源向资产转变的过程。显然,中国数据产业经历了从数据基础建设到数据应用,再到数据资产的阶段,而这个变化也可以从数据服务商与甲方客户需求的变化看出。
从数据服务供应商角度来看,以神州数码为例,神州数码企业云业务集团数云融合本部总经理肖凯告诉钛媒体APP,从神州数码数据业务发展来看,也可以分为三个阶段。第一阶段,数据服务商更多的是基于数据技术帮助客户进行定制开发,数据技术服务等。
第二阶段,在肖凯看来,场景化和行业化的数据应用的发展,让数据产业步入了第二阶段,“比如营销领域数据分析,客户生命周期数据分析,端到端供应链数据分析等,以及在零售行业、医药行业等利用通用的数据技术和行业数据应用来形成标准的数据解决方案以及数据安全标准产品等”肖凯告诉钛媒体APP。
第三阶段,也是我们目前正在经历的阶段,企业开始在数据要素、数据资产、数据服务方面进行布局和探索,通过数据本身的价值向客户提供数据+产品+AI的综合数据业务能力,同时也正在逐渐形成我们的行业数据指标、数据资产等。
从甲方用户需求角度看来,原先,用户更关注数据平台、数据工具的采购和使用,如今,用户更关注数据价值的利用,以及数据与自身核心业务的深度融合,“用户从原先关注数据技术先进性,转变为更加关注数据应用场景的落地,”肖凯告诉钛媒体APP,“数据在行业,甚至产业链中的应用和整合,以及数据价值的‘变现’已经成为绝大多数用户关注的焦点。”
数据驱动,行业侧大模型落地成本届焦点
数据在AI时代也愈发显得重要,何宝宏表示,伴随着大数据产业的发展,数据质量越来越高的前提下,人工智能已经逐渐从以代码为中心,转向以数据为中心的人工智能,“当下企业需要通过加强数据治理和增强数据质量,来解决模型输出效果。”何宝宏指出。
钛媒体APP注意到,本届数博会,有一点就如同其他大会一样——AI也“攻占”了数博会,现在的参展商、各个分论坛,无一不在展示、谈论着大模型的应用落地,而这其中绝大多数都是在探讨大模型在行业侧的应用落地。
“如果说2023年是大模型元年的话,那么2024年就是大模型在行业侧应用的元年。”浪潮云总经理颜亮在与钛媒体APP的对话中表示。
确实,2023年,各大厂商都在“卷”模型参数大小,而2024年开年至今,厂商将“讲故事”的方向转向产业侧,不断有小模型和大模型+小模型的解决方案涌现,为企业本地化部署铺平道路。
在颜亮看来,生成式AI的快速发展也并不是偶然,他认为,此轮AI浪潮的火热离不开作为底层基础设施的云计算的发展成熟,“因为公有云、行业云等云基础设施成熟了,才让新一代的人工智能能具备改变环境的能力。”颜亮如是说。
不同于以往,新一轮的人工智能不再是功能性的智能,而是系统性的智能,“从智能角度出发,新一轮的AI浪潮带来的是整个智能组织性的提升,”颜亮告诉钛媒体APP,“在行业侧来看,每个部门都在寻找大模型可以落地的应用场景。”
而本届数博会的展区表现也与颜亮的观点一致,各个厂商都在展示着自身在AI大模型行业侧应用的成果。京东云在现场带来了代表性的大模型数字人的展示与互动,作为大模型率先落地的几个产业,京东云言犀数字人在技术、效果和商业化上率先冲线,完成了最大规模的产业实践,引领数字人行业从技术突破到商业化跨越。
钛媒体APP注意到,今年4月,采销东哥AI数字人引发4000万人围观,引爆数字人热潮。在京东618,言犀数字人携手5000个品牌稳定开播,直播累计时长超过40万小时,累计观看人次超过1亿,互动频次超过500万次,格力董明珠等21位总裁数字人在京东直播间集结“出道”,开启了行业首个总裁数字人大规模实践。
除了数字人直播带货的探索以外,京东云此次还展示了京东大模型在零售、物流、健康等领域的实际应用,以及京东在智能体平台、智能编程助手等方面的落地实践和产业融合应用创新。
不仅是京东,其他厂商的展区也多多少少都能看到大模型在行业侧的探索成果展示。马蜂窝针对自身旅游行业推出了旅游行业的垂直大模型:AI旅游助手;中科富创结合物流领域,推出了物流AI大模型,用于降低全社会物流成本;以奇安信、360等为代表的安全厂商,也在此次数博会上带来了AI+安全的大模型产品.......
透过本届数博会,虽然可以看见众多头部科技厂商在行业大模型方面的应用尝试,不过就目前行业应用来看,并未有“杀手级”应用出现,可以说行业大模型的成熟应用落地还有很长的路要走,对此,IDC中国区研究总监卢言霞表示,无论是“toB”还是“toC”,应用大模型落地首要面临的挑战就是数据与AI融合,“当下开发模型,纯靠企业内部数据是不够的,肯定要融合更多外部的数据源。”卢严霞指出,而这也从侧面反映出了为何此次数博会生成式AI会如此火爆——因为数据是大模型落地过程中不可或缺的存在。
大模型的应用落地已经是“产学研用”各方关注的焦点,何宝宏也为大模型切实落地指明了方向,他表示,当下行业需要更多的关注逐步将基础模型作为一种智力服务展现出来,“从技术角度出发,如何将模型进一步产业化,变成基础设施,这中间还有很长的路要走。”何宝宏指出。
而行业大模型是落地“智能+”的最后一公里。在浪潮云首席技术官孙思清看来,算力基础设施、行业数据集、模型算法,以及可信赖的服务、可持续的运营成为行业智能的关键要素。也是将模型产业化,变成智能服务的过程中,必备的因素。
数据安全始终是首要前提
众所周知,大模型需要大规模的数据集进行训练,数据的多样性和广覆盖,对于模型的性能至关重要。目前,国内基于中文语义的大模型训练所需要的中文数据总量不够,且质量不高,同时数据流通还面临信息安全等问题。
在这个过程中,数据安全就成为了大模型落地过程中的首要前提。本届数博会的主题是“数智共生”,这个时代数据驱动了人工智能的发展。而数据的共享和传播不仅是大模型落地的关键,更能让数据产生更多价值,让企业获得更多利益,但数据被窃取会导致企业核心竞争力丧失。因此,数据安全是数字经济和数据交易的核心问题,只有解决了安全疑虑,数字经济才能快速发展。
对此,奇安信集团董事长齐向东在本届数博会期间向钛媒体APP表示,数智共生是数智时代的大势所趋,数博会的这一主题深刻体现了数字化、智能化赋能千行百业,成为推动数字经济高质量发展的新引擎。安全是数智共生的基石,是一切科技链、创新链、产业链的底板,一旦出现问题,不仅会打击链上企业,更会破坏整个供应链的稳定和效率。
无独有偶,永利皇宫董事长权小文也在与钛媒体APP交流中指出,本届数博会的主题,深刻揭示了数据与智能技术的深度融合,强调了在数字化转型的过程中,智能技术与数据的共生关系,不仅为经济创新和产业升级提供了新路径,也为构建一个更加安全、高效、可持续的数字经济生态指明了方向。
与此同时,权小文告诉钛媒体APP,数据安全行业正迈向场景化、实战化的安全解决方案,以适应数字经济的快速发展和多样化的安全需求。“实现数智共生的核心在于将智能化技术与实际业务场景紧密结合,依托创新技术的研发与应用,通过精准识别和精确防御,为不同行业和企业提供定制化的安全策略。”权小文强调。
为了解决企业安全的疑惑,齐向东提出了“数据三角”,在数据的生产域、应用域和流通域,三个维度出发聚焦安全问题。
生产域方面,网络环境相对封闭,最高的风险是内鬼盗窃,最大隐患是“三员”:管理员、技术员、操作员。他们掌握特权账号,很容易主动泄密,或者被收买、被利用。另外,生产数据的物联网设备、各种传感器和IT系统,也可能成为机密传输、数据篡改的工具。
应用域方面,应用环境全面开放,最高的风险是黑客攻击和后门,最大隐患是API。据统计,八成以上的黑客攻击和九成以上的后门是通过API接口实现的,API接口数量越多,漏洞和后门隐患越大。
流通域方面,比较依赖第三方平台,最高的风险是数商违规,最大的隐患是技术平台漏洞。全局数据、重要数据和敏感数据以及一般数据,都需要以业务场景为导向,不能违背数据权属方的意愿、不能违反个人信息保护法律、不能损害国家利益等原则。上述原则一般通过技术平台保障,一旦出现漏洞,就会发生重大数据安全事故。
“‘数据三角’互为支撑、互相影响,其安全问题也不能孤立解决,”齐向东指出,“构建统一的体系化安全体系,覆盖“数据三角”的每个域,是确保数据安全的关键。”
十年的数博会,可以看作是中国数据产业发展的一部简史,见证了贵阳这座城市“蜕变”的同时,也见证了中国数据产业快速发展的十年,在这个数据愈发重要的时代,数据产业已经成为一个国家综合国力的体现,但当下绝大多数企业离具备数据驱动业务发展还有很长的一段路要走,这其中数据安全的问题显然是首要面临的难题,但不是仅有的问题,企业还要面对如何做好数据治理,提升数据质量的问题。