数据访问的爆炸式增长影响工程师的团队效率
企业年复一年地产生更多数据,但保存数据的位置数量正在急剧增加。数据的激增以及我们用来保护数据的方法伴随着市场变化——经济、技术以及客户行为和营销策略的变化,仅举几例。
事实上,您甚至可能听说过IDC新的《2021-2025年全球数据领域预测》,该预测预计全球数据生产和复制在预测期内将以23%的复合年增长率扩大,到2025年达到181泽字节。2020年的数据量为64.2泽字节,比2012年的6.5泽字节增长了十倍。
顺便说一句,一个zettabyte等于1,000,000,000,000,000,000,000(1021)字节,或近2500亿张DVD,这比您预期的要多得多。
虽然不断增长的数据使公司能够设置基线、基准和目标以继续前进,但它提出了一个问题,即究竟是什么导致了它,以及它对您组织的工程团队效率意味着什么。
是什么导致了数据爆炸?
从2022年开始,大数据分析显示信息消费急剧增加。这一趋势始于2020年,当时由于大流行的限制,个人主要呆在家里。当时它在一年内从41泽字节跃升至64.2泽字节。据专家介绍,近200泽字节的数据需要额外的存储容量。从2020年到2025年,存储库类别将以每年19.2%的速度增长。
事实上,Statista预测,到2025年,世界将产生略多于180泽字节的数据。
早在疫情之前,产生和交换的内容和信息量就一直在不断增加。想想Domo的统计数据,在家工作的人数从18个月前的大约15%增加到现在的50%以上(在疫情期间有时接近100%)。Zoom和Microsoft Teams等协作解决方案越来越受欢迎。这意味着更多的位和字节。
事实上,每天有超过300,000个组织和1.15亿用户登录Microsoft Teams。Zoom也拥有大量用户。在鼎盛时期,该公司每分钟举行近200,000次会议。任何平台上的每一分钟都需要大量存储空间来建立连接。
Domo还检查了世界人口。大约60%的人口拥有互联网连接,活跃用户超过50亿。他们中的大多数是移动的并利用社交媒体。无论如何,在我们这个小地球上,这就是每个人的大量数据。
数据爆炸式增长对工程师团队效率的影响
数据过载是全球企业面临的一个日益严重的问题。企业必须一遍又一遍地筛选大量数据,以识别和掌握其复杂性。这意味着适当保护这些数据会给大多数企业带来巨大的财务和人力成本。随着数据日益增长,每个业务团队都受到影响,使他们远离核心职责。
这种数据增长热潮对于组织来说很重要,因为如果它还没有影响到您的客户,它很快就会影响到您的客户。如果他们还没有开始询问有关大数据和数据分析的问题,他们很有可能很快就会提出问题,因为处理大量数据的团队不可避免地会出现不一致,并且无法对其进行适当的评估。公司的竞争能力将越来越取决于其利用数据、应用分析和集成新技术的能力。
除了内部开发之外,外部数据扩展(来自政府来源、外部供应商等)将出现爆炸式增长。尤其是工程团队,很快就会被与竞争数据、新产品和服务发布、市场发展和行业趋势有关的大量信息所淹没,从而导致信息焦虑。
爆炸性的数据增长可能难以处理
标题有点夸张,但“大数据”一词并非如此。今天的数据工程师必须处理比以往更多的数据,而且没有放缓的迹象。虽然大量数据对行业有利,但数据的增长速度超出了任何人的预期,这导致了一些问题。
表现不佳
即使是最强大的设备,所有这些数据也会造成负担。报告和模型在试图解释流经它们的大量数据时会卡顿。如果您不小心,您的工程师的数据需求可能会超出您计算机的容量。
对于大多数工程师团队来说,时间是宝贵的。您不能在几份报告上浪费他们的时间。但是,有一些方法可以解决这个问题。如果您还没有,迁移到云可能是一个现实的选择。云数据仓库提供了各种优势,包括比传统仓库更具可扩展性和弹性的能力。
无法获取数据
对于难以足够快地提取数据集的工程师来说,所有这些数据可能是压倒性的。较旧的ETL技术可能会产生大量代码并进一步减慢您的流程,但没有帮助。一个潜在的选择是使用ELT系统——提取、加载和转换——根据需要与数据进行交互。它可能与您的数据治理政策相冲突(更多内容见下文),但它可能有助于建立更广泛的数据视图并为您的主要模型提供更好的数据集。
数据管道维护
对数据管道的不断增长的需求和大数据的增长趋势使其看起来更像是一场海啸,并使维护现有管道成为数据工程中的一项重大挑战。
代码也有变化。命令式编程正在被声明式编程所取代。对低代码甚至零代码系统的日益重视,减少了维护并减轻了数据工程师的负担。
其他行业害怕自动化,但在这种情况下,数据工程师是他们的朋友。
无法正确管理数据
数据治理不是游戏。它为您可能希望避免的数据工程增加了一层官僚主义。另一方面,替代方案可能会导致关键数据值和定义不一致。这意味着在多个集成和报告中循环的不正确数据的可能性。
考虑一下您的公司有多少个互连系统。如果应用程序之间未同步特定字段,则可能会在错误的时间从错误的位置提取报告,从而导致错误的数据。如果字段未实时更新,则尤其如此。
爆炸性的数据增长可能是加强您的工程团队的机会
尽管数据爆炸最终可能会停止,但无论您喜欢与否,公司和个人仍将继续每天每秒生成新信息。这为IT行业的任何人创造了机会,他们随时准备提供企业所需的工具来收集、存储、管理和分析可供他们使用的大量数据,并将其用于自身优势。
这种数据爆炸式增长可以成为数据分析师和工程领导者将更多数据纳入其开发流程以更好地了解其团队真正需要的职责的途径。例如,更好的数据可以帮助管理层更清楚地了解他们的团队,方法是评估行为指标以发现团队的微妙之处、建立增加员工人数的案例或提供更好的团队反馈。
工程团队可以利用客观数据来建立更明智的产品路线图,消除可能的障碍,并避免与其他团队、领导层和董事会成员的误解。工程师将通过数据驱动的策略更深入地了解生产周期的潮起潮落,从而使他们能够更好地为团队配备适当的人员和资源。
成为数据驱动的组织是必须的
每天都有越来越多的人访问互联网和手机网络。IT、电信和娱乐公司已经发现了使用更多带宽和存储以及更广泛和更好服务的新方法。因此,数据扩张不太可能很快放缓。随着更多技术的发明,它似乎每隔几年就会增加一个数量级。
然而,值得注意的是,技术仍然只是一种工具。虽然爆炸性数据会对不同的组织职能产生负面影响,但它仍然可以被操纵、保护和利用,以推动您的业务实现正增长。正如许多人所指出的那样,我们仍然是决定技术会发生什么的人,而不是相反——还有什么比成为数据驱动的组织更好的利用技术的方式呢?