分布式时代已至,数据如何更有价值?
近年来,随着数字技术的发展,云计算又一次步入了变革的时代。尤其在2022年,随着“东数西算”工程的正式启动,在“东数西算”相应政策的引导下,越来越多的大型、超大型数据中心在8大节点、10大集群内“拔地而起”。一张无形的算力网,已开始编织。数据中心逐步向着两极化发展——边缘侧,小型、微型数据中心;集群内,大型、超大型数据中心。
无论是连通各大集群内大型超大型数据中心,还是连接边缘侧小型、边缘数据中心,分布式云计算都已成为这张算力网络最重要的支撑。在此背景下,云计算步入分布式时代。
数据已是重要资产
2020年,中共中央国务院在《关于构建更加完善的要素市场化配置体制机制的意见》中,首次将数据与土地、资本、劳动力并列为关键生产要素,并提出加快培育数据要素市场的要求。
2022年12月,中共中央国务院正式发布的《关于构建数据基础制度更好发挥数据要素作用的意见》中提出,构建数据产权、流通交易、收益分配、安全治理等制度,初步形成我国数据基础制度的“四梁八柱”。
今年两会期间,新一轮国务院机构改革方案揭晓,本轮机构改革将组建国家数据局,由国家发展和改革委员会管理,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等。
与此同时,在企业数字化转型逐步深入的当下,数据已经成为几乎所有行业企业资产的重要组成部分之一。
国家层面,数据是国家基础性和战略性资源,已成为社会经济发展的新型生产要素,正以前所未有的深度和广度参与社会生产生活,由“数据赋能”带来的价值对各行业各领域均有不可估量的重要作用。
企业层面,数据是企业重要资产,成为企业业务不可分割的一部分,企业对待上云的态度已经从“要不要”逐步转变为“如何上”,让云计算,数据更好地赋能企业业务,推动企业发展。
无论是政策层面,还是企业层面,云赋能、数据安全、信息安全等方面的问题已成为当下亟待解决的问题之一。日前,在浪潮数据云业务战略发布会上,浪潮集团执行总裁、总工程师,浪潮云董事长肖雪表示,近年来,从国家政策层面不难看出,发展数字经济的总体路径和顶层规划不断推出,数字化赋能实体经济发展已经成当下的重点发展方向。放眼全球,数字经济也已成为当今世界发展的主旋律,“在此背景下,如何建立基于数据空间的海量数据可信自由流动的体系,推动我国向数据强国全面演进,充分发挥数字价值,一直是浪潮云努力的方向。”肖雪指出。
“云网边端”如何一体化?分布式“赋能”!
“东数西算”工程快速推进建设的一年有余的时间内,全国范围内的算力调度问题是当下亟待解决的问题,也是“东数西算”工程能否真正“照进现实”的关键所在。
在西部地区,有着充足的算力和能源供应;在东部地区,有着大量的算力资源需求。这时候就需要编织一张更智能的算力网络,让东西部数据中心间的数据、算力实现实时、快速地流通。分布式云计算就是实现智能快速算力网络建设的关键核心技术,亦是“云网边端”一体化的重要基础技术之一。“物理上分散建设,逻辑上统一管理”——在笔者看来,这是形容分布式技术最贴切的话语。
在浪潮看来,分布式云计算也将成为未来企业数字化赋能的重要抓手之一。对此,肖雪表示,自2021年浪潮云第二次战略发布定义了中国分布式云概念以来,几年的时间内,浪潮云进行了大量的实践,构建了以数据为核心,以“云网边端”为支撑的分布式数据云体系,打破算力“壁垒”,解决了数据传输延迟高、算力资源利用率低、数据安全等问题,并逐步形成了7个核心中心,113个区域中心,实现了493个分布式云节点,打造了覆盖中国密度最大的分布式的算力网络,不仅于此,“基于分布式网络,浪潮云打造了以整体运维、算力调度、一体化服务为中心的OpsCenter为核心的算力调度,支撑政府企业和行业不同计算的需求。”肖雪指出。
肖雪认为,仅仅依靠传统的数字基础设施,是不能够满足当下数据为要素的驱动模型的,如何在分布式云中建立一个适合数据流通的,且足够安全的“数据通道”,是当下推动数字经济发展的关键,“为了更好的让数据发挥赋能的作用,浪潮云推出了数据云的概念,目标是让数据、算力都‘动起来’,基于分布式云的体系,打造分布式数据云,为数字经济提供算力动能、数据动能、算法动能,实现降本增效的数字化赋能。”谈及浪潮数据云的核心理念时,肖雪如是说。
分布式云尚处“发展期”,如何“应对自如”?
虽然分布式云有着更安全、能帮助企业降本增效等优势,但就现有技术而言,分布式云尚处于发展期,想要成熟的应用还有两大挑战需要面对。
首先,数据安全问题一直是企业在选择云产品时最关注的问题之一,金融和政务领域尤为关注。
在分布式架构下,数据将在多个数据中心之间流通,分布式数据中心在架构更为复杂以后,安全面临的挑战也越来越多。在流通的过程中,如何搭建防火墙,构建安全协议,确保数据安全,成为分布式架构应用过程中面临的一大挑战。
肖雪表示,浪潮云在安全体系建设早已布局,他指出,浪潮云始终以数据安全作为核心研究方向,以安全运营的理念推动服务模式的创新,通过安全运营中心、安全产品和安全运营的全栈式安全服务,建立闭环安全防护机制,“目前,浪潮云的安全运营中心作为组织保障,贯穿制度、人员、技术,能够实现主动、持续、精细化的全生命周期安全管控。”在介绍浪潮云安全运营中心时,肖雪指出。
除此之外,笔者注意到,浪潮云也是国家网信办云服务安全评估通过数量第一、唯一一家“双试点”单位,浪潮云在安全方面的布局与能力,“可见一斑”。
除了安全问题以外,当下热议的算力调度也是分布式云计算需要面临的一大挑战。算力资源的管理是当下面临的难题。地处不同位置的数据中心,如何在应对业务数据流突发情况时,进行高效的算力资源调度,实现不同地理位置的数据,统一管理,将成为算力调度方面需要面临的一大挑战。利用分布式数据共享治理模式,将集中式、分布式数据治理“融合”,实现共存,是当下比较常见且成熟的手段之一。
会上,浪潮云首席技术官孙思清表示,浪潮云打造了一个云原生算力平台,利用分布式技术,将不同类型的算力资源整合起来,具备极强的异构计算的能力,从而将闲置的算力资源充分利用起来,让算力更“智能”,最终实现降本增效的目的。“浪潮云有一个原生的算力平台,能够优化算力调度能力,从多维算力的调度,从图像、视频,还有文本不同模式计算的算力的需求,包括算力的利用率,还有机器学习等,将闲置的算力资源充分利用起来。”孙思清强调。
展望未来,肖雪表示,浪潮云将从四个方向不断优化浪潮数据云的能力。
首先,夯实数据基础,“面对云管边端的数据场景,浪潮云通过一体化基础设施,引导多元数据主体加入大数据供给‘洪流’中。”肖雪强调。
其次,在运营数据要素方面,肖雪表示,浪潮云将进一步推进公共数据定向开放,以及数实深度融合,构建统一标准,开放开源共享的建立安全可靠的数据运营体系。
再次,肖雪指出,要建立产业生态,打造数字教育流通的体制/机制,构建应用服务高地,“下一步,浪潮云将持续通过汇聚多元数据,构建多层次市场结构的数据资源体系,激活数据产业活力,打造数据要素和服务的生态圈。”肖雪如是说。
第四,进一步优化安全可信体系,确保数据的安全可信可溯源。肖雪表示,可信、安全是数据自由流通的首要前提及重要保障。基于此,更好地完成数据的确权、构建一套更加安全的体系始终是浪潮云的目标,“数据安全一直是浪潮云的主攻方向,以安全云中心为理念,在此基础上进行服务模式的创新。”肖雪指出。目前浪潮云以安全云中心作为核心,贯穿了制度、人员、技术三个方面,实现主动、持续、精细化的数据全生命周期的安全可控。
据悉,浪潮云通过安全云中心,安全产品和安全运营全栈全服务,建立完善的防护机制,并与国内高校和国家级科研机构成立联合实验室和研究院,关注数据全生命周期的安全防护,不断充实技术实力,保障用户上云用数过程中的安全稳定。
除了不断优化自身技术及服务水平外,浪潮云还一如既往的推进开源开放生态建设,以及标准化的制定。笔者注意到,在此次浪潮数据云战略发布会上,在赛迪顾问的指导下,由浪潮云担任理事长单位的“数据云联盟”(简称联盟)正式成立。据悉,联盟将秉持“推动数据融合创新,促进数据云生态繁荣”的愿景与使命,集合数据相关领域的企业、高校、科研机构,以及咨询机构,共建开放性的数据云生态圈,目前已有493家成员单位。