从“数据科学”视角,看懂数字化转型
数字化转型是数字经济时代下重要的产业实践,其背后有没有方法论来指导呢?自然是有的。方法论主要来自于三个方面,分别是:业务视角、IT视角、数据视角。
业务视角,不言自明,基础是传统的管理学方法论,既包括企业的战略制定、人力资源、财务管控,也包括一切和数字化项目实施落地相关的项目管理活动等。
IT视角,方法论大多来自于传统信息化建设相关的方法沉淀,比如:系统需求分析、系统架构设计、软件设计模式、产品设计、UI/UE设计等。
数据视角,是数字化建设独有的方法论视角,把数据作为“本体”,一切活动围绕数据来看待数字化转型实践。
通过认识和挖掘数据的本质、规律、价值、活动,实现对数字化转型的系统规划并展开具体的方案设计。
数据科学是关于数据的学科,数据分析、数据挖掘、数据预处理、数据检索、数据建模、数据架构设计都属于数据科学的技术细分领域。
数据科学的数字化视角,是一个理论的观察视角,从数据科学看数字化应用场景,类似于基于物理公式的视角来看自然界客观的物理现象,如雷、电、雨、雪 ...
数据科学可以让“数字化”活动抽象化、清晰化、本质化、结构化,在解决数字化问题时,通常需要把“业务域”中具体的经营问题或生产问题动态映射到“数据域”,得到等价的“数据科学问题”,在“数据域”中对原问题进行求解。
上述过程,实际上也是广义上“数字孪生”想要达到的产业实践意义。
值得注意的是,业务域问题变成数据域问题,总是近似等价的,期间可能要忽略掉很多非数据域可描述或定义的“细节”,比如:外部风险、情绪干扰、操作性误差、系统性误差、财务约束、系统性能约束等。
尽管如此,从数据科学的角度来解释、预测、控制一项数字化活动,仍有巨大的借鉴意义:
一是可提供理论上的价值边界。
站在数据科学的视角,可以借助统计学、信号学等基础学科理论,清晰地定义和量化从数据中产生的价值,了解数据价值链的形成路径,评估数据给业务带来增长的程度。
例如,采用Value of Information(VoI)分析,一种基于贝叶斯统计框架的量化模型,从不确定性减少的预期收益方面,评价数据收集实验的必要性和经济性。
在此基础上,可以有效地评估数据的价值潜力,以及数字化项目在收益上的必要性,更好地开展数字化项目实施决策。
二是可聚焦业务上的实施范畴。
通过把业务问题抽象成数据问题,对业务场景进行建模,寻找“数据驱动”的业务解决方案。在数据模型图、数据流程图的基础之上,可以更清晰、更精准地识别目标业务问题关联的核心业务域,更加有效地聚焦数字化项目的重要业务范畴。
通过数据建模手段,可以构建结构化的业务条线组织形式,有效地梳理数字化项目相关的业务单位、部门,以及组织内外的重大“干系人”。
在此基础上,还可以明确地定义业务活动中的责任关系、利益关系,开展更为科学、公平的业务决策。
三是可凝练技术上的求解路线。
有时,很多业务问题难以在业务域中直接找到解决方案,而通过把业务问题转化为等价的数据科学问题,相当于拓展了求解问题的技术手段,提高了处理业务需求的能力上限。
大数据的方法可以运用于传统问题的求解,充分发挥计算机技术的强大算力优势,弥补了人在面向信息量大、决策维度复杂、低延时等场景的复杂决策问题的能力短板。
例如:通过将非结构化的文本数据转化为稠密数值空间的向量数据,实现文本信息的深度语义融合与匹配,使得机器可以识别和理解“人”感知不到的信息,并完成在海量数据库中进行内容匹配的复杂任务。
四是可揭露内容上的特殊线索。
数据科学提供了一系列统计函数和分析模型,通过在数据对象上进行各种不同的模式变换操作,可以实现信息的深度线索提取,强化凸显原先在业务域视角中被隐蔽埋藏的信息。
例如,通过离群点分析算法,可以在海量数据集中快速识别到与“总体”分布不一致的特殊数据样本,背后可能反映了异常的用户行为或产品质量。
再例如,通过图数据分析,建立业务对象之间的关联关系,在图上进行路径挖掘算法,计算识别“长距”节点,挖掘潜在的语义或社会关系关系。
综上,数据科学可以为业务分析提供评价能力、解释能力、分析能力,以及信息强化能力,基于数字化的业务应用也只有在数据科学的加持下,才能真正高效能地释放数据要素综合价值。