徐心、蔡瑶:数智流——企业数据资产的建设路径丨清华经管说
企业数据资源资产化是实现数据价值的一次重要飞跃。在推动数据资产化的同时,企业的能力、绩效和价值也将得到提升,最终形成长期的、不可模仿的竞争优势。清华大学经济管理学院管理科学与工程系教授徐心及其合作者蔡瑶聚焦微观企业层面,引入“数智流”体系框架,解构数据资产的建设与管理模式,帮助企业实现从数据资源到数据资产的跨越。
数据已成为数字经济时代的基础性战略资源、重要生产力和关键生产要素。自2019年十九届四中全会首次将数据增列为生产要素以来,我国围绕数据要素、数字中国等出台多项政策文件,为释放数据要素价值、加快推动数据资产化、培育高质量经济发展新动能谋篇布局。数据的要素化包含数据资源化、资源资产化和资产资本化三个阶段。其中,企业数据资源资产化是实现数据价值的一次重要飞跃,其本质在于利用数据要素赋能生产、技术、市场、管理、创新等价值链各环节,进而优化业务流程、提升企业绩效、催生新知识新业态,并持续推动企业数字化转型。与此同时,企业也可将数据资产独立封装,以数据产品或数据服务的形式在市场上进行交易,进而获得收入。
然而,实现数据资产化的过程并非一帆风顺。首先,在大多数企业中,数据往往呈现分散化、碎片化和未经初步加工的原始状态。麦肯锡全球研究所(McKinsey Global Institute)的数据显示,制造业是目前数据最多的行业,平均每年产生1.9PB的数据。其中,在供应链、采购、工厂运营以及合规和质量管理阶段会生成大部分数据。但其数字化建设还停留在数据要素化的第一阶段,即数据收集与原料加工阶段。其次,数据资产化要遵循因地制宜、循序渐进的原则。然而,很多企业在面对市场竞争时,盲目引入新技术,在没有充分评估业务场景的情况下,就匆忙开启数字化变革。当缺少规划或规划与业务现实不相符时,数据资产化会产生“水土不服”,导致企业面临更大的转型阻力。最后,实现数据资产化需要大量投资,企业财务上的投资压力、已有投入的沉没成本等,都将对数据资产化进程产生影响。
面对企业数据资产化进程中的困境,本文聚焦微观企业层面,引入“数智流”体系框架解析数据资产的建设与管理模式,帮助企业实现从数据资源到数据资产的跨越。本文提出的“DIKW数智流体系框架”能够较好地解释组织管理实践中的各种现象,揭示从原始数据跃迁至智慧的基本规律,是企业推动数据资产价值创造的“指南针”。本文聚焦数据转化为智慧的全过程,从解构数据资产、数智流的信息学内涵、数智流的经济价值及数智流的构建四个方面进行系统阐述。在DIKW体系框架下,构建数据资产化的标准化体系和设计方法,为企业构建健康高效、数智赋能决策体系提供参考模型,也为企业等主体系统规划与推进数字化转型工作提供理论支撑和操作指引。
数智流:解构数据资产
由“数据(Data)、信息(Information)、知识(Knowledge)、智慧(Wisdom)”构成的DIKW数智流体系揭示了从数据到智慧的层级关系(见图1)。DIKW体系最早可以追溯至托马斯·斯特尔那斯·艾略特(Thomas Stearns Eliot)所写的诗《岩石》。他写道:“我们在哪里丢失了知识中的智慧?又在哪里丢失了信息中的知识?”后来经过教育家哈蓝·克利夫兰、米兰·瑟兰尼及管理思想家罗素·艾可夫等学者的发展、完善,经典的DIKW金字塔体系逐渐形成。数据、信息、知识、智慧构成一个纵向的金字塔分层结构,四个层次依次递进。这是一个数据管理和分类的过程,数据从分散无序走向分类有序,不断沉淀进化,最终形成抽象的、普适的智慧,数据价值从而得到更充分的释放。
DIKW体系中,数据、信息、知识与智慧之间既有联系,又有区别(见图2)。数据是DIKW体系中最基础的一个概念,它是认识对象的客观留痕,是形成数据资产的最原始的素材。信息是有一定含义的、经过加工处理的、对决策有价值的数据,企业在业务场景下对原始数据进行加工处理形成的指标、特征、标签等,都可以称为信息。知识是在理论的指导下,通过智能化模型等提炼不同维度信息之间的关联获得的规律性认知。智慧是以知识为基础的正确的判断能力,关注的是对未来的预测。从采集数据、提炼关联信息、发现新规律、研究出新理论到创造新的知识或技术,是数据与实体二者不断迭代演进、归纳演绎形成普适智慧的过程。
数智流的信息学内涵
数智流以信息学的科学内涵为支撑。数智流具有双螺旋结构,包括数据螺旋和知识螺旋(见图3)。沿着DIKW体系,从数据螺旋可以看到:从单点数据到全局数据,实现了从数据到信息的演变;从单领域到跨领域信息,实现了从信息到知识的归纳;从已有知识延伸到预测未来,实现了从知识到智慧的跃迁。从知识螺旋可以看到:从数据到信息,需要加入对业务场景的认知;从信息到知识,需要理论作指导;从知识到智慧,需要创造引领。因此,企业在实现数智流的过程中,应当遵循“三个联系”——将全局信息与业务场景相联系,将理论知识与多领域相联系,将已有知识与未来预测相联系,基于数智流的双螺旋结构,重构核心业务模式,实现从数据要素到数据资产的转变,实现企业数据价值创造。
为了帮助企业更好地理解DIKW体系,下文将以本研究团队与国内某头部保险公司的合作为例,详细阐释在DIKW体系下如何实现从原始海量数据到数据智能的跃迁转型。
原始数据。客户服务中心是重要的服务渠道,该保险公司2022年在客服中心建设上投入了4071亿元人民币,积攒了海量客户与客服之间的语音通话数据。
从数据到信息(对场景的描述)。在保险业务场景下,如果客户服务不好,就会降低客户满意度,进而影响客户留存。因此,客服质检是该保险公司的一个重要场景。高效精准的客服质检,不仅有助于提升服务质量,还能帮助企业在竞争激烈的市场环境中获取竞争优势,开拓新的市场份额。传统质检方式以人工手段(包括随机抽样质检和事后回访)为主,存在耗时长、结果延迟、人工成本高、样本规模小(只能完成所有通话记录的2%)、覆盖率低等问题。所以,该保险公司考虑以智能化方式升级和改造质检项目,提升质检效率。在该场景下,研究团队首先对2700通原始服务通话数据(超八千小时)进行数据降噪、录音切片、说话人识别等处理(见图4)。然后,给切片后的语音片段打上情绪标签,作为训练数据。通过CNN训练模型,判断出客户在一通服务通话中的情绪变化(见图5)。通过对非结构化原始数据的加工处理,形成对决策有价值的情绪数据即信息。
从信息到知识(以理论作指导)。认知与情感表达的神经生理学基础理论“过程组成理论”(Process Component Theory)以及达尔文的《人和动物的情感表达》等相关文献表明,生物体会随时间推移发生改变以响应环境。假设服务质量是环境,客户会基于对服务质量的判断,作出相应的情绪反应。因此,研究团队研究了通话服务质量与客户情绪变化的关系,通过建立分析模型,对客户的不满情绪进行监测,捕捉客户负面情绪波动、负面情绪持续时间及负面情绪在每一通电话中的位置,研究这些负面情绪与服务质量之间的相关性。
智慧。为将知识转化为可用于实践的管理工具,研究团队搭建了情绪计算平台(见图6),计算客户在服务过程中的情绪变化,基于客户情绪变化预测服务质量。通过对原有质检业务进行智能化升级和改造,质检部门可以优先调听平台监测到的存在负面情绪的通话录音。相比原先的人工质检方式,数智赋能让该公司的质检效率提高了十倍。
价值创造:数智流的目标及其管理
为什么参照DIKW体系,企业就能够实现数据资产化,产生出经济价值呢?可以借助两个管理学的理论框架——实物期权和“VRIO模型”来对这一问题进行解释。
实物期权
斯图尔特·迈尔斯(Stewart Myers)在1977年首次将金融期权理论引入实物资产投资领域,提出实物期权这一概念。他认为,在对高度不确定性的实物资产投资项目进行评估时,传统价值评估理论往往会低估实际价值。一个实物资产投资项目的价值不仅包括目前所拥有资产的使用价值,还包括对未来投资机会选择的柔性价值,也就是说,实物资产投资的整体价值等于现有资产价值加上其未来成长机会价值。罗伯特·麦克唐纳(Robert McDonald)和丹尼尔·席格(Daniel Siege)在1986年就开始运用期权方法来判断最佳投资时机。目前,实物期权理论已经广泛应用于经济生活的各个方面,成为一种全新的评估工具,在竞争和战略决策、企业价值估计、企业投资决策、高新技术及风险投资管理、企业并购与企业治理等方面,都得到创新性应用。
实物期权理论较适用于可以分步分层投资的项目,推动企业实现数据资产化的数智流正是这样一个分步分层的过程。数据作为一个战略性新兴要素,对其大规模的研发投入常常并不能即刻获得回报,因此,公司经常面临这样的抉择:是否要投入大量资金开展数字化转型。根据DIKW体系,建立数据仓库,实现数据的整合和集中,只是数据资产化的第一步。当企业完成从原始数据到数据智能的跃迁转型,将会整合或升级企业资源,催生形成新的产品、商业模式和组织框架,进而驱动新兴产业形成,企业也将获得绩效增长的新引擎。因此,应该从实物期权的角度来评估数据资产的投入产出,从而作出科学决策。
VRIO模型
企业能够在市场上长期立足,是因为拥有核心竞争力。1991年杰恩·巴尼(Jay B. Barney)提出VRIO模型(见图7),帮助企业分析竞争优势和弱点,明确企业的资源和能力,正确评估有潜力成为企业可持续竞争优势的资源或能力。该模型指出有四个因素影响可持续竞争优势,分别为:有价值(Valuable),即企业的资源和能力能增加价值;稀缺(Rarity),即具有大部分或者所有竞争者没有的资源或能力;不可模仿(Inimitable),即资源不容易被模仿;组织性(Organization),即企业被有效组织起来。四个因素都满足时,企业才能获得可持续的竞争优势。
用VRIO模型对D、I、K、W四个元素进行分析,不难发现,原始数据如果只是价值不高的、分散杂乱的数据整合,企业将处于竞争劣势。试图脱离企业专有场景和理论指导,仅靠现代信息化智能技术完成数据资产化来获得可持续竞争优势也是不太可能的。智能化技术普及范围广,智能化人才早已不是稀缺资源。没有价值的原始数据加上可模仿、不稀缺的智能化技术会使企业处于竞争劣势。
在DIKW体系下,数据、信息、知识和智慧可以被看作企业的组织资产。拥有客户、产品、服务和运营方面可靠、高质量的数据,并在业务场景下生成有价值的信息,这种资产并不是特别稀缺,因为每个企业都可以实现从D到I的转变,享有平等竞争力。企业有能力且能够结合理论把信息归纳为知识,这就再往前走了一步,拥有临时竞争力。能够进一步将多个有价值的资源叠加、整合,真正利用知识进行组织再造、业务流程再造、品质变革,让知识跃迁为智慧,就形成了可持续竞争优势。从数据到智慧的过程,极大地强化了企业各部门之间的战略协同和资源整合,有效地推动了企业数字化变革的进程,大力地促进了企业数据资产价值创造。简而言之,企业数据资产化同时推动了企业能力、绩效、价值的提升,最终形成长期的、不可模仿的竞争优势。
数智流的构建
如何构建数智流?在已有研究成果的基础上,本文提出了一个数智流的构建框架(见图8)。首先,企业要从管理层面变革组织管理方式,将数据变革作为公司整体战略的重要组成部分。其次,从原始数据跃迁至数据智能,实现企业数据资产化,释放数据价值,需要焦点部门及多个部门协同发力。最后,在构建数智流的过程中,管理理论与实践、技术与业务模式应当协同发展。数智流的构建并不是以“数字技术为导向”,而是将数字技术与业务模式紧密结合,以推动业务增长、再造核心业务模式作为数字战略的核心目标。
具体而言,企业可以通过以下步骤来构建数智流。第一,进行数据盘点,整合业务流程数据,清洗并建设原始数据。第二,包括数字、文字、图像、符号等的原始数据不经过处理是不具有价值的,因此,要综合运用技术、人力资本等,在具体业务场景下,对原始数据进行加工和处理,形成信息。第三,整合“企业家的规则性理论”和“学者的科学权威的规范性理论”( 见《由实践到科学:企业家发展管理理论的方法论》,本刊2021年第4期),基于特定的业务场景,在智能技术的支持下,进行科学建模,形成知识。第四,以知识指导企业实施业务升级和改造,再造业务模式、重塑管理模式,提高价值创造能力,重新塑造竞争优势,完成数字化转型。这一过程反过来又能够促进企业形成新的业务场景和数据,从而实现基于DIKW体系的数据资产闭环管理。
基于数智流构建框架,在与某商业银行合作的顾客价值提升项目中,本研究团队助力其完成了从数据到智慧的跨越,实现数据资产化。
首先进行数据整合。将该银行在各个业务流程中(借记卡部门、综合理财部门、网银部门、营销部门等)产生的数据(交易的金额、交易的时间、转账、查询、浏览、开户时长、营销渠道等)进行整合,作为本次项目的原始数据集合。
其次是信息提取。银行的具体业务需求是理解顾客的风险偏好,并为他们提供相应的投资理财建议。此前,银行开展营销业务是根据顾客的高频浏览记录来提供投资建议,但效果欠佳。因此,本项目聚焦于理解顾客的风险偏好和决策机制,旨在优化金融产品的营销实践,从而提升理财产品推荐的有效性。研究团队提出了一种数据驱动的风险偏好测量方法。鉴于目前业界和学界缺乏有效的大规模动态风险偏好测量方法,本项目基于顾客的行为大数据,利用机器学习算法,提取用户对理财产品的风险偏好这一信息。
再次是进行科学建模,形成知识。西蒙1947年出版的《管理行为》首次阐述了个体如何以及为什么作决策。基于行为决策理论,研究团队探寻了商业银行场景下顾客进行投资组合调整的决策机制。研究团队认为,调整投资组合是一个寻找解决方案的过程,目的是缩小当前投资组合与风险偏好之间的差距。金融信息搜索被视为是影响投资组合调整速度的关键因素,调整方向和熟悉度也被认为是关键情境因素。因此,研究团队构建了动态调整模型和工具变量,以深入研究顾客进行投资组合风险调整的决策机制。
基于开发的风险偏好测量工具和发现的投资组合风险调整规律,研究团队设计了面向顾客投资组合调整的营销策略。通过电话营销的实地测试发现,与基于高频浏览的推荐策略相比,基于风险偏好的推荐策略使购买转化率提高了十倍。
最后是智慧的形成。研究团队为商业银行生成数据驱动的风险偏好测量方法,深化了对风险投资组合调整决策机制的理解,为商业银行实现智能化营销提供了参考和指导。这些理论和实证研究为企业更好地理解和满足不同顾客群体的需求,为进一步开展精准营销提供了有力支持。
STEP:应对数智流构建的挑战
在构建数智流过程中,大多数企业都会遇到如下问题。首先,从“数智流”技术的底层架构来看,核心在于将各个领域的数据结构化,然而,现实中企业往往面临数据交互问题。数据要素无法互联互动、互信互认、开放共享,造成数据碎片化。其次,从原始数据中提取出的信息由单个业务专有,可复用程度低。再次,企业往往从直觉出发进行决策,缺乏科学理论指导。最后,企业往往很难科学严谨地评估数据资产,无法准确衡量数字经济价值。
对于构建数智流过程中的挑战,可以从STEP四个维度来应对,即组织结构(Structure)、手段工具(Tool)、经济机制(Economic mechanism)、方式流程(Process)(见图9)。
组织结构
企业数字化转型是从底层架构到业务模式、组织架构再到制度等多个层面的整体的转型升级,是牵一发而动全身的变革。要做好数字化运营,首先需要厘清企业价值链全流程中的智能化应用场景,通过体系化的设计,从根本上对价值链各个环节进行数智变革。构建企业的“数智价值链”,促进数据要素价值化、资产化。
数智价值链就是在波特提出的经典价值链(见图10左)基础上增加一个数智活动(见图10右)。“数”指企业在运行过程中产生的大数据,“智”指人工智能等分析技术。在数字经济时代,数智活动将成为企业价值链必不可少的价值增值活动,成为企业价值链中的关键一环。总体来看,数智价值链中的数智活动具有三个职能。
一是数据,从价值链各个活动采集并整合数据资源,并在此基础上完成数据加工和特征工程。此过程对应DIKW体系中的数据和信息。数据整合及内部流通涉及用户隐私保护问题,企业可以借助新技术(如差分隐私技术),促进不同商业组织和部门间的数据流通和隐私保护。
二是计算,基于机器学习、深度学习等先进的算法和模型,以企业具体的业务需求为导向,在理论的帮助下,从大数据中挖掘商务智能,赋能科学决策。此过程对应DIKW体系中的知识层面。
三是评估,科学衡量数智化项目产生的经济价值。数据资产的价值评估已成为推动数据资产化、价值化不可或缺的重要环节。构建科学的资产估值体系以及制定完善的数据资产定价机制对促进数据要素市场健康发展具有至关重要的意义。
数智价值链是对传统企业价值链的全流程赋能,涉及企业经营管理的所有部门,需要以制度创新驱动,建立企业层面的科学管理平台。
手段工具
数据资产作为日益重要的战略资源,贯穿数据采集到应用整个生命周期,需要建立完善的体系进行管理。按照DIKW框架建立数据资产管理平台,建立一套覆盖数据“采、存、管、用”等整个生产运营过程的数据管理规范,从制度上保障数据资产管理工作可行和可控,同时控制数据在整个流程中的成本消耗。依托数据资产管理平台实现大数据全生命周期的管理,支持以价值创造为导向的数据资产应用开发。
构建数据资产管理平台,首先要采集数据并对其进行加工、特征提取,然后分门别类地入仓,之后根据实际的业务场景进行数据建模,获取各类数据服务(含数据应用平台),加速对业务的赋能(见图11)。
数据资产管理平台是企业内部全局统一的数据资产门户,也是一站式治理和开放的数据资产管理体系,能够充分释放数据要素在业务中的价值。
首先,数据资产管理平台可以帮助企业实现数据的互联互通。制定企业内部统一的从数据存储到使用过程的流程规范,打破数据孤岛,实现企业内数据高效共享。
其次,有效的数据资产平台可以帮助企业避免重复基建。多个项目分属价值链的不同活动,由不同的业务部门负责管理,导致重复基建。数据资产管理平台将数据资源统一管理,有助于相关部门及时查询到已存在的、可立即使用的数据资产,避免重复投入。
再次,构建数据资产管理平台有助于企业全面掌握现有数据资产状态,按照DIKW体系对数据资产进行全面盘点,包括企业已有信息、创新项目,以及在完成项目过程中使用到的理论、模型、数据等,为上游业务应用夯实数据基础。
最后,基于数据、信息、知识到智慧的盘点,构建面向企业数据资产的知识图谱,实现端到端的数据“血缘”分析。通过分析数据平台数据分布和访问状态,协助数据管理人员形成对数据生命周期的管理策略,有效发现和挖掘当前数据平台或者数据库中的关键数据,同时,为管理业务部门需求,满足业务部门对数据使用的要求提供有效的数据支撑。
经济机制
企业内部市场化就是改变内部市场运行的经济机制,将高层管理总体调控之下的行政关系变为等价交换的经济往来关系,以“看不见的手”自发运行。企业内部市场化采用“按劳分配”的方式独立核算各部门绩效,改变各部门之间利益均摊、权责不清的状况,让各部门直接面对内部市场,以此激发出主观能动性和创造力。
在企业数字化转型过程中,每个部门都需要进行数据整合和处理,形成信息特征。企业实施某个项目,要用到多个部门的数据和特征,从数据到智慧,实现数据资产化,产生经济收益(见图12)。从企业内部市场化的角度看,各业务部门以数据参股项目并获得分红。在这一过程中,要设立有效的“成本分摊机制”和“利益分配机制”,强化业务部门以价值为导向并有效使用企业数智资源的意识,并以市场机制为数智部门提供的服务“埋单”, 帮助企业建立起基于价值的激励机制与分配机制。
机器学习为衡量各个部门的数据绩效、促进企业内部市场化提供了解决方案。机器学习通常使用一些特征描述样本属性,并以特征权重反映特征对目标变量的影响程度,以此衡量特征的重要性。如图12所示,实施项目1的过程中,使用了5个特征,其中,业务部门1提供两个特征,业务部门2提供两个特征,业务部门3提供一个特征。项目1为企业带来经济收益后,将计算每个特征在项目中的重要性,并按照特征在项目中的权重价值给予回报。
基于定量方法建立的企业内部市场机制,有助于数据要素流通产品价格的形成,有助于提出面向不同应用场景的数据产品定价、收益评估方法,从而建立公平高效的收益分配机制,完善数据要素由市场评价贡献、按贡献决策报酬的相关机制。
方式流程
让数字化创造看得见的价值,其实回答了所有企业在数字化建设中都会面临的首要问题:数字化意味着什么,如何衡量数据资产的价值?
以A/B测试为代表的因果推断方法,为科学评估数字化运营的经济价值和投资回报率提供了有效途径。对照实验的核心逻辑在于以完全随机的方式,将项目单元分为若干个实验组和对照组,在每个组实施不同策略,观察对比不同组最终实现的业务目标,得到不同策略的经济价值估计。
前述保险公司与商业银行实现数据资产化的案例中,也采用了A/B测试,即让一部分用户使用原始方案,另一部分用户使用智能化方案,统计对比不同方案的结果,以判断数据资产化带来的价值。除此之外,谷歌、亚马逊、今日头条等公司都建立了专门用于对照试验的企业级基础设施,建设和优化数字化运营的评估机制,提升企业利用数字化能力变现的效率。
结语
本文立足于国家数字经济深化发展的重要战略需要,提出了DIKW体系框架,详细阐释了数据要素转化为数据资产的基本步骤、重要实践、关键环节和瓶颈,旨在构建数据要素及其价值释放的微观理论框架,对数据要素资产化相关文献作出理论拓展,并在实践中有效指导微观企业实现从数据到智慧的转变,提升组织绩效和生产绩效,促进企业数字化转型,为加快我国数字经济高质量发展提供学理支撑。
作者:徐心:清华大学经济管理学院教授,人工智能与管理研究中心主任;
蔡瑶:清华大学经济管理学院博士后。
(本文转载自清华大学经济管理学院 ,如有侵权请电话联系13810995524)
* 文章为作者独立观点,不代表MBAChina立场。采编部邮箱:news@mbachina.com,欢迎交流与合作。
备考交流
最新动态
推荐项目
活动日历
- 01月
- 02月
- 03月
- 04月
- 05月
- 06月
- 07月
- 08月
- 09月
- 10月
- 11月
- 12月
- 11/03 上海线下活动 | 港中大MBA课程2025级招生宣讲暨校友分享会
- 11/03 上海站 | 港中大MBA宣讲会暨校友分享会
- 11/03 学长学姐校区见面会 | 香港大学在职MBA(大湾区模式) 十一月线下咨询会报名
- 11/03 下週日見!2025年入學交大安泰MBA第一場港澳台申請者沙龍重磅來襲!
- 11/06 讲座报名 | 房地产市场的破局与重构
- 11/12 统考倒计时45天 | 清华科技创新MBA学姐备考分享&答疑等你来!
- 11/13 线上活动|备考经验高密度输出,招生动态前瞻解析,11月13日交大安泰MBA考情解析+笔试技巧分享会开启报名!
- 11/14 公开课抢位|人工智能、数据和人才@北京
- 11/14 申请冲刺 | 港中大(深圳)MBM2025级第四批次招生启动!
- 11/14 活动日程 | 11月14日港中大(深圳)MBM2025级招生说明会