大数据时代的到来,数据分析成为炙手可热的职业。但是很多门外汉想学,对着浩瀚繁杂的技术,只能望而却步。
纠结到底要不要学会SQL啊,要不要学Python啊,但是归根到底这背后的意义都是一样的。
因为数据分析并不是单独存在的,需要我们自己去整理,去处理数据。
比如把一堆Excel给合并起来,也许下一步的任务就是分析了,但这一步却少不了。比如用花名册生成员工卡,把这说成是数据分析有点太扯了,但是这才是经常会出现在生活中的事情。
还要特别强调一点,数据分析并不只是个技术问题,甚至可以说主要问题并不在技术。有很多同学可能认为只是掌握一些相关的技能后就会做数据分析了,这是不会对的,做好数据分析重点在于掌握业务知识。需要知道什么需要分析。果。
但是,我们还是要掌握技术才能大幅度的提升工作效率。
Excel
几乎人人都会用Excel,因为这是最基础的数据分析和处理技术。
Excel能干啥和怎么干,网上资料一大把,就不过多的赘述了,哪怕是门外汉,多多少少的也会Excel。。这是基础中的基础,现在哪怕是再牛的数据分析师都绕不开这玩意儿。
敏捷BI
敏捷BI可以做多维分析,可以通过各种分类方式去看数据统计。
敏捷BI的代表产品主要是国外的几家,PowerBI、Tableau之类;其实Excel本身也有个透视表,可以做基本的多维分析,但细节做得还不够好。
润乾报表
前面说了,我们还会碰到用花名册生成员工卡这种烦人事,敏捷BI帮不了这个忙,润乾报表就擅长了。
润乾报表是国产报表工具(也算BI吧)不假,但是它不是以BI技术出现的,因为它没有敏捷BI的本事,只是个做报表的工具而已。
Excel可以做静态的报表,行列根据数据量变化的表,但是出现多片多层分组交叉的情况时,数据变了每个月都要重做一次,稍有不慎就会搞错。这种出报表的事,你说它算不算数据分析呢?
润乾报表来做这些就会很简单,做一次模板之后,数据变了一键搞定,动态行列多层报表毫无压力。
那为啥只提润乾报表,其它国产报表工具不行吗?
因为只有润乾报表提供了面向非专业职场人员的使用方式以及相关的课程资料,确实也有其它报表工具也能做复杂报表,但都是面向专业技术人员的(也许哪天也有产品会加入到职场市场),处在你这一级的同学搞不定(再往后学就可以啦)。
易明建模
还有另一条线的数据分析技术,也就是现在很热门的人工智能(数据挖掘、机器学习、…),这里涉及的运算要复杂得多(不过也离不开常规数据处理技术来准备数据),动不动就是概率论、统计学之类的公式了,这一点都不简单了,远远超出中学水平,没好好念数学课的大学生都搞不懂。
易明建模把这些复杂的人工智能算法都封装起来了,使用者只要把数据准备好(就是Excel的表格即可),丢进去,它就能自动建出模型了,然后就可以预测了。因为这里固化了顶尖统计专家数十年的经验,对于大部分商业场景,它比不熟悉机器学习算法的程序员做得还好。
那为什么又把这东西单提出来?没有其它自动人工智能的产品吗?
有,但又是太沉重,你还是搞不定,不适合这一级的选手。
这三种技术(产品)门槛都比较低,也就是要写点公式,仅仅比Excel难一点点,可以并列为第1级。
易明建模其实使用起来最简单(连公式都很少填),但需要了解一些数据挖掘知识(算法不用懂,要对建模预测的机制有点概念,也要学会如何评价模型的好坏),而且人工智能业务也显得高端一点,算作1.5级也行吧。
SPL
涉及到复杂的技术时,虽然每一步还是四则运算难度,但步骤多了用一个公式很难写出来,要分几步才行,过程中还可能有判断。
但是如果会用编程,就很简单了。
这个道理好懂,但为啥是这个SPL,编程语言不是很多吗?
结构化数据,能很方便地处理结构化数据的程序语言。只有SPL和SQL,还有Python看起来也能对付。
但还有很多场景下没法用数据库也就没法用SQL。程序员也要对文件数据做处理,有多个数据库的情况也没法直接跑SQL,能跑SQL的数据库叫关系数据库,还有一堆不是关系数据库的数据库,比如MongoDB,还有json,xml这些奇怪格式的数据。这时候,掌握SPL技术就方便多了,它不要求有数据库,啥场景都能算。
而且,SQL在处理很多有过程运算的时候也不方便,企业应用中常常会出现我们前在说过的长达几K十几K的SQL。而大多数情况用SPL要简单得多,开发效率也就高得多。有过企业报表开发经验的同学都知道,报表没完没了做不完,开发成本极高。而我们的国产报表工具已经把呈现解决得很好了,仍然会出现这种现象,主要就是因为用SQL或Java等去实现数据计算的难度太大效率太低。会了SPL,这些事就会轻松多了。
SQL
程序员世界里的数据分析处理技术,SQL是首当其冲的。数据库可能是存储最多数据的地方,而这里的数据主要就是用SQL来耍,不会SQL很难在数据圈里混。
简单SQL长得像英语,语法学起来很容易。如果已经掌握了结构化数据的概念和运算,估计也就看上几小时语法书就能上手写查询了,按说不应该是个专业级的技术。但是,你学会了没地方用啊,得有个数据库才能跑SQL,安装数据库以及把数据倒腾进去来做查询,都是很专业的任务,会折腾这种事的你已经是个半职业的程序员了。
倒是可以用SPL来学,SPL中也实现了常见的SQL,可以让使用者针对文件执行SQL。不过,如果学会了SPL,在处理分析文件数据时也没必要学SQL了,SPL的运算处理能力要远远强于SQL。
SQL入门容易,但精通很难,复杂的SQL始终还是很复杂的。三行五行的简单SQL通常只会大量出现在教科书和培训班,现实中用于做数据分析的SQL语句,说起长度时我们通常是用K(千字符)而不是用行作为单位的。