沃卡惠移动端logo

沃卡惠  行业资讯

资讯详情

数据分析项目是什么?该怎么做?

2023-08-01 09:37:504636

不当跑数机

我要做项目

很多做数据的同学都有这个强烈的心声。每天机械地跑数,完全不知道数据有啥用的状态确实很不好。大家都想有个独立负责项目的机会。

然而,很多同学心中充满疑惑:

●什么是数据分析项目?

●为啥我在公司里没见过数据分析项目?

●我在网上百度了泰坦尼克、淘宝电商、美国信用卡的代码,ctrl C+ctrl V一遍,算不算个项目?

今天就从第一个问题说起:什么是数据分析项目。

01什么是项目

项目本身的含义是:在特定时间期限内,将人力、物力组织起来,达成特定产出目标。这一句话虽然简单,却带出了项目三大关键维度:时间、成本、产出质量。这三个维度,就是俗称的“项目铁三角”(如下图所示)。

图片

之所以叫项目,是和常规工作对应的。

●项目:特定时间,特定人群,特定产出。

●常规工作:每天都干,固定一群人,干完就行。

你看同样是铁路,做老铁路的养护,兢兢业业一辈子也没人知道;但是新建一条线路,必定是张灯结彩,锣鼓喧天,鞭炮齐鸣。我们都喜欢做项目,不爱沉溺在常规工作里,大致也是如此。在企业里有些部门项目很多,经常动不动搞个大新闻,有些部门项目很少,就只能忍气吞声了(如下图)。

图片

02什么是数据项目

灵魂拷问:数据在公司里的地位,更像【单选题】

  1. 销售
  2. 运营
  3. 品牌
  4. 供应链

一个残酷的真相是:虽然老板们嘴上嚷嚷的“大数据”“人工智能”“数字化转型”,但是在大部分企业里,数据更像供应链。虽然大家嘴上都说这玩意很重要,是未来,是趋势。可到头来,一你不能为公司挣钱,二你是服务其他人的脏活累活。

这种尴尬处境,就注定了数据的地位高不到哪里去。地位稍微高一点的,是可以直接拿数据挣钱(比如出售数据、数据服务的咨询公司、第三方服务公司、互联网toB产品)或者等着数据圈钱(招一堆程序猿,向VC爸爸证明自己是人工智能大数据公司)的少数企业。地位不高,自然分配的项目就少了。

03什么是数据分析项目

分配项目少的核心表现是:数据的工作一但拆开,就通通变成日常工作。

图片

是滴,写代码的又不是他们,他们完全理解不了“接一下那个数据”七个字背后,你到底得付出多少努力。这一点还比不上供应链呢,至少大家看到堆积如山的物料,会觉得他们辛苦。大家看数据的眼光,更类似家里的老妈子:“你一天天对着电脑在弄啥呢”。

因此,数据类工作想要立项,就只剩一种办法:毕其功于一役!在一个跟数据一点关系都没有,但听起来贼牛逼的名字(是滴,说的就是商业智能)的包装下,把上边这些脏活累活打包全干了。

其中最为合法、公开,有存在感的,莫过:带数据大屏的BI项目。无数传统企业的数据部门,就是靠着做大屏项目博得老板欢心的。

图片

当然,这种局面在这两年有变化。阿尔法狗一声汪汪,给无数老板们带来了人工智能的希望。当面对解决不了的问题的时候,人们总寄希望于某个自己耳朵听不懂、别人口中很神奇的力量。在过去是《周易》铜钱八卦,在现在是人工智能算法。于是很多算法项目纷纷上马。

实际上,在自媒体大肆炒作之前,就已经有很多利用算法改进业务的成功案例,比如通过算法识别违约风险,提高外呼成功率,提升用户点击率,预测用电数/话务量,等等等。

但这些应用有着非常严苛数据质量和非常明确的应用场景。并不是说随便捞几条数据丢进模型一弄就有效果的。更不是说脱离管理制度、资金投入、基础建设、业务配合,只要代码一运行钞票就从屏幕里喷薄而出。于是很多贸然趟进算法浑水的项目都悲剧收场。

不过没有关系。很快,大家就找到了新的自己耳朵听不懂、别人口中很神奇的力量:数据中台!于是重新的一轮眼见高楼起,眼见高楼塌又在2020年开始上演。

04数据分析项目的症结在哪里

站在项目铁三角的角度,对比数据和其他项目,症结非常容易看到:

图片

即使是数字本身,也很难体现价值。比如原因分析,即使不看数据,业务自己也能猜到几条原因。如果仅仅局限在业务提一个假设数据验证一个,那就跟叼飞盘的汪子没啥区别。虽然自己跑得辛苦,人家还认为你就是个打杂的。

以上,才是数据分析项目立项少,成功难的本质原因。当然,更要命的是,很多新人意识不到这一点(特别是研究生刚毕业,写了几篇名字高深的论文的)。他们炫耀着自己的图表、模型、代码,像一个在班里炫耀新买的变形金刚的小学生。内心满满的:“我好厉害吧”。忽视了真要运货,最普通的翻斗车都比擎天柱大哥强。

想破局,还得紧紧抓住项目铁三角:

时间

1、平时建立监控体系,把劳动力从临时取数解放出来。

2、基于日常数据,积累经验,捕捉战机!

3、在关键时机引发业务危机感,承接独立负责的项目。

成本

1、平时尽一切可能推动数据质量改善。

2、在时机合适时推动数据基础建设前进。

3、每次项目考虑最少数据,最简单模型解决战斗。

质量

1、基建类:多做从0到1的工作,填补空白,彰显成绩。

2、方法类:建立推理逻辑,带着业务的思路走,做教练、不做老师。

3、建议类:提100个假设,撑爆业务的脑袋,掌握输出成果的主动权。

Baidu
map