数据科学家,要比软件工程师更擅长统计学,比统计学家更擅长软件工程。

1.学好统计,数学和机器学习

推荐书:《赤裸裸的统计学》,《深入浅出统计学》,《数据分析思维》

2.学好编程

学会使用数据分析的编程语言,如R,Python,SAS,SPSS。

3.理解数据库

学会使用关系数据库MySQL,非关系型数据库MongoDB.

4.学会数据预处理,数据可视化和报表

数据报表可以1使用Power BI,Tableau等。

5.提升到大数据级别

使用分布式处理大数据集,所用软件为Hadoop,Apache Spark等。

6.通过实战进行加深巩固

7.在社区和大牛,新手交流