数据“跃动”,“新”力量重塑商业格局
在中经传媒智库举办的“发掘数据新力量”闭门会上,与会人员共同探讨了当前数据应用所展现的可见商业场景及数据治理、合规方面面临的问题。 文|朱耘 ID | BMR2004 数字化时代,数据已成为关键的生产要素,不断催生出新的商业模式和丰富的应用场景,它打破了传统的商业边界,重塑着产业格局。从精准营销到个性化定制服务,从智能供应链管理到金融科技创新,数据的力量无处不在。企业通过挖掘和分析海量数据,能够更准确地洞察消费者需求,优化产品和服务,提高运营效率,开拓新的市场空间。可以说,谁能更好地驾驭数据,谁就能够在激烈的市场竞争中抢占先机,引领行业发展的潮流。 尽管数据已成为关键生产要素,但企业在数据资产如何入表,如何保证数据安全与合规的情况下,更好地发挥数据要素的乘数效应,依然有很多问题亟待解决。在2024年9月13日中经传媒智库举办的“发掘数据新力量”闭门会(以下简称“数据闭门会”)上,与会人员共同探讨了当前数据应用所展现的可见商业场景及数据治理、合规方面面临的问题。 01 数据应用新场景 毋庸置疑,我们已迈入了数字化的新时代,数据不仅是资源,更是生产要素。《数字化赋能高质量发展》主编、著名数字化专家赖家材认为,数据时代,对我们提出的首要挑战是要建立“数据思维”。牛顿的经典力学纯粹是理论研究,到了爱迪生时代,做科学研究采取的方法是“科学实验”,提出假设,通过实验尝试和验证。而在今天的数据时代,所谓数据驱动,即通过大量的数据在一起,做关联性判断。 在营销界,数据驱动有个经典案例——啤酒与尿不湿效应,沃尔玛经过数据分析与消费者洞察发现,尿不湿与啤酒总出现在一张购物单上,原来是男性顾客给孩子买尿不湿时总会买啤酒,于是沃尔玛就在尿不湿的货架旁边摆上啤酒,在便利消费者的同时增加啤酒的销量。 在数字化浪潮的推动下,数据的应用场景正不断拓展和创新。北京师范大学法学院博士生导师吴沈括认为,单就数据谈数据,或者只谈数据产业,不具有可持续性,必须跟实际的场景、业务相结合,即所谓发挥数据的“乘数效应”。白海科技首席增长官洪磊也坦言,数据本身创造不出商业模式,不带来新的价值,但可以通过数据做优化,提升效率,变相优化商业模式与商业结构。 北京国信钧元科技有限公司常务副总经理王杰伟正在做与数字乡村领域相关的工作,并提出了“DOD模式”,即以乡村数据要素增值为导向的数字乡村建运一体模式。 2023年,国信钧元在为安徽某县做数据乡村建设时,帮助相关县设计发行了一笔专项债,该专项债还款测算中,43%用的是数据资产,这其中包括了数据资产的运营、服务收益、数据资产化等。“数据跟行业结合,需要找到跟行业有真正结合的点。”王杰伟说。 说起数据的应用,就不得不提大模型。当ChatGPT横空出世,引发了全球范围内对大模型的高度关注和热烈讨论,国内也掀起了一场“百模大战”,这使得业内有这样一种声音:通用大模型所需要的数据将严重不足。平安科技前沿技术部门负责人王磊认为,在大模型技术差距方面,只要最新技术思路保持有迹可循,中国和美国的差距也就是一年左右的时间,各大互联网企业在“卷”大模型,在其看来没有太多的商业机会,巨头的“厮杀”最终活下来也就1—3个,而机会在垂直大模型领域,即在原来自有产品基础上加大模型,形成更具竞争力的产品,未来将有更大的商业机会。王磊认为,国外的微软、国内的美图、金山办公等就是沿着这条路在走,在原有产品的基础上增加了大模型,使产品体验发生了显著甚至颠覆式的变化,客户黏性增强,有的产品甚至将付费模式由原来的授权模式变为了订阅模式。 王磊说,2023年年中,平安集团的客服升级为大模型加持的智能客服,运营一年多来,有较多改善,其中一点是转人工的比例明显下降。中国平安年报显示,当前80%的客服电话都由机器人完成,降本提效明显。 北京金杜律师师傅所合伙人吴涵认为,目前各垂直领域亟需“行业知识图谱”,这是人类组织总结出的行业规则、规律与评判标准,需要“专家系统+大模型”,而专家系统应该是所有垂类模型的“底座”,这才能减少所有需要由“人工审核”造成的庞大工作量。 02 优质数据即竞争力 在数据新场景的不断拓展中,数据与实际业务结合带来了诸多的创新与变革,在此过程中,数据不仅仅是一种资源,更是企业在激烈市场竞争中脱颖而出的关键。 投资机构负责人刘振龙也认为,未来在行业(垂直)领域,大模型将展现出显著的商业机会。对于真正有行业资源、行业数据的大模型,其优势和价值在现阶段表现明显。比如一家数据公司拥有中国运营新能源车辆(仅限于运营车辆,如公交车、网约车等)的运营数据,点开系统可以查看一辆车的车牌号、所在位置、电池状态、电池使用年限、电池电量等信息。这些数据具有独特性,对保险公司而言,非常有价值。 当前新能源汽车的保险费用相对较贵,用户购买保险时,保险公司并不了解电池的状态及是否存在隐患。不过,对于那些拥有全部运营电动车数据的企业而言,也需要通过合作机构,真正运营好这些数据,以突显其数据价值。 “整个互联网行业,已经把数据驱动做到了极致,反而是垂直领域里的数据,本身并不在互联网上。”洪磊认为,今天数据要素最热的领域,恰恰是原来并没有那么多数据化与信息化的领域,数据赋予了极大地提高效率的可能性。过去互联网通过数据,全部是“流量变现”的模式,而现在数据结合人工智能,提升了工作效率,这就是数据作为生产要素与过去提及的大数据的本质区别。 作为风险投资人,颜骏和他的团队对于当前数据行业各个细分领域逐一做了分析。数据行业各细分领域主要包括算力、算法、数据和场景应用。他认为,算力基本是巨头玩家,集中度很高,小公司成功的机会很小,同时随着算力价格的不断降低,将成为数据领域的“基础设施”,可以低成本使用;算法方面,多数企业是在开源代码的基础上做调整,纯技术理论上的精度差异,在实际应用中差别不大;场景应用,是能产生差异度的地方,而整个产业中,最核心的就是数据源,没有优质数据,就没法做出高质量的场景应用,所掌握数据的稀缺性成为很多创业公司的核心竞争力。 在数据领域,类似这样的案例有很多。北大能源研究院电力组分析师汪若宇谈到,在电力领域,目前国内电站的基础数据往往都是不公开的,但仍有国外网站借助卫星数据,统计和公开全球各大火电厂位置、装机量等数据;新能源领域,仍然“靠天吃饭”,存在诸多不可预测性,大模型的应用未来将非常广泛。 数据行业的发展,会用到大量的电力,特别是大模型每推理一次,耗电量巨大。有数据显示,一个拥有1760亿参数的大模型,光是前期训练它,就得花掉43.3万度电,这相当于大约2082个中国家庭(三口之家)一个月的用电量。 不仅是训练,应用大模型,算力背后也对电力的使用提出了新的要求。一是应对新能源发电不确定性。储能产业是围绕电力行业的一条新细分赛道,可利用算力加强响应能力;二是应对用电量不确定性。汪若宇坦言,当前电力领域的预测与实际用电量存在一定的“脱节”问题,需要更好地优化相关预测模型。 03 数据资产入表的意义与价值 不言而喻,数据已成为企业的重要资产,特别是在优质数据成为企业核心竞争力的当下,如何有效管理和利用这些数据资产,使其发挥最大价值,是企业面临的关键问题。其中数据资产入表是一项重要的举措。 事实上,有些企业拥有一定的优质数据,为了产生新价值,需要从各个维度采集数据或购买数据,以便产生新价值。为此,企业付出了相应的成本,并产生预期收益价值,且可计量,这就属于数据资产的范畴(也属于数据入表的范畴)。 北京国信钧元科技有限公司将帮助企业梳理数据业务,总结为三件事:第一,帮助企业梳理从公司投入信息化开始产生的数据值多少钱?数据资产有多少?第二,企业通过梳理数据了解业务,了解未来这些存量数据还能做什么事?第三,企业给数据做资产管理,助力企业相关业务能够有效带动市场良性循环发展。 与会人士都认为,尽管当前数据很热,所有人都意识到了数据有用,且目前已经沉淀了大量的数据,但是数据有什么用,怎么用?依然需要进一步思考。 而数据资产入表不是终极目标,通过入表实现作价,形成交易是数据资产入表的目标。在数据交易实践中,王杰伟发现,如果企业单纯将自己的数据资产作价,放到交易所或市场中寻找买家,完全没有市场。但是从需求出发,比如A公司拥有大量的数据,同时在市场上找到了另外几家企业的数据,几方数据联合起来产生更大的收益,这样才有可能产生交易与收益。 数据资产入表,首先要对数据进行登记与确权,吴沈括认为其意义在于,一是证明数据所属权;二是具有程序价值,在诉讼中作为证据;三是登记后使得该数据具有排他性。如果把数据资产跟房屋资产做对比会发现,房屋资产会在国家法定的登记机关登记注册,但是数据资产的登记,散落在各个地方,这是当前数据行业一个普遍问题。 同时,在企业数据资产入表的实践过程中,需要追溯数据源头,但往往存在确权不明、合规不明等问题。吴涵认为当前数据资产入表的现状看似很热,实际真正入表的企业不多,入表的价值也远远低于人们的期待,且容易产生泡沫。刘振龙认为,相较于非上市公司,上市公司对于合规、监管的要求更为严格,在数据资产入表方面,应该率先建立相应标准。 为便利数据交易,全国成立了诸多的数据交易所,但目前没有相关行政命令或法规要求交易必须场内完成,因此,数据交易场内与场外同时存在,这使得国内各大数据交易所运营存在挑战。 04 数据治理 吴沈括将2019年定义为数据领域具有战略意义的一个年份。这一年,全行业对于数据有了全新的认知,特别是在人工智能语境下,数据资源、数据流转等问题的重要性,被提升到了关系国家未来发展及重塑国际格局的重要高度。 数据要素固然重要,但是对于多数企业用户来讲,数据安全问题还是让企业非常担心,因为数据的特点是“易复制性”。吴沈括观察到,目前大部分企业对于数据合规工作做得不错,或者说有意识保护数据安全。但是,当数据走向市场,包括上下游企业,如何能够得到有效的责任机制设计,是当前一个较大的挑战。 从数据的归属来看,目前大体分为三类,即公共数据、企业数据和个人数据。当前在所属权上争议较大,但应用广泛的数据是个人数据,如何授权及保护个人数据不被滥用,考验着数据生产方、使用方及监管部门的智慧。以患者的医疗数据为例,该数据属于患者本人,如何使用归患者本人支配。但是某医院所有使用了B超检查产生的数据,可否用于医疗研究,在法律层面至今存在争议。金杜律师事务所曾尝试利用区块链技术解决,即建立一个平台,将相关数据投入到该平台,当其他用户通过平台使用了相关个人数据,个人可以从中获得相应的代币,该代币仅用来兑换医疗领域的相关服务,比如减少排队等候时间等。 吴沈括提出,做任何的大模型,AI Agent首先要从产业安全和意识形态安全的角度出发来统筹设计开发路径,即思考根本性的问题:AI要完成一个什么样的目标,它的价值到底是什么?此问题当前是“见仁见智”,凝聚共识是当前一个非常大的挑战。 事实上,通用模型在意识形态领域可能出现“不安全”的问题,得到了诸位专家的共识,并且这也是监管的一个难点。如果在互联网领域,出现不当信息、言论等,监管部门可以立即责令下架,但通用模型或AI Agent出现类似问题,不可能采取下架措施,因为所有的应用都融入其中,下架后无法使用。正所谓技术发展得太快,使得我们决策的时候,不能像以前那样,让新事物“先飞一会儿”,现在需要对监管、治理等做及时更新。 在数据重塑商业格局的当下,与会专家们看到了数据带来的机遇与挑战。然而,数据的故事远未结束,数据的潜力也远未被充分挖掘。未来,数据在应用领域、数据安全与治理、数据资产的价值挖掘等方面,仍有诸多问题值得深入探讨。《商学院》杂志将持续关注数据领域的发展动态。 来源 | 《商学院》杂志10月刊