我是数学专业想要做数据这块,是学大数据好还是python好

2025-05-17 10:50:27
推荐回答(2个)
回答1:

本人只能从个人经验给你一点建议,希望你少走一点弯路。
首先,你说到你刚接触大数据,你要明白大数据范围超级广,你具体想要学习哪个方向呢?数据挖掘?还是机器学习深度学习?亦或nlp(自然语言处理)?
我给所有问我大数据该怎么入门的人都会有如下建议:学好数学!学好数学!学好数学!重要的事说三遍,不然你怎么理解各种模型的构建?所以从理解算法开始,什么svn啦,knn啦,k means啦,总之各种聚类分类的算法,把它搞懂,绝对有用。
言归正传,回到语言的选择问题。java和python这两个语言,我给你从这几个方面解释一下:
1. python是脚本语言,无需编译,java则是需要编译的语言
2. 我在letitcode(大概是这么拼)上测试过好多次,同一个功能的程序竟然是java性能好很多
3. 平时我们做项目,都是用python写个demo去测试,真正发行的版本,是用java写的
4. 许多大数据平台(如spark),都提供多种语言的接口,所以你不用担心学一种语言没处用的问题
看到了吧?python和java的地位差别在企业中就是一个低一个高,氮素!以我个人的观点来看,我还是建议你先学python。
为啥腻?我可不是要坑你,而是因为:
1. 很多java中几行的代码,python中一行就搞定,学会了python,还怕学不会java?
2. python上手快,简洁事儿少
3. (个人经验)我学数据挖掘入门是用的scikit-learn(一个python库),当时用的超爽的好吧!几分钟搞个模型出来。当然现在看来那不算什么啦,可当时真的体验很好,特有成就感。相反拿java写程序我就各种别扭,总觉得啰嗦得很
4. 其实,我觉得scala更适合大数据…linkedin后台好像就是它写的,但是我觉得scala难,再加上种种原因,一直没来得及学
以上就是我的看法。
最后给你推荐个小工具:jupyter notebook,一个在线交互式编译器,不但支持python在线编译,还支持matplotlib及各种绘图库哦!在你前期做数据清洗和特征提取的时候很有用。

回答2:

大数据和Python的话,其实都是不错的选择。
不过就目前市场上的发展现状来说,学习Python更好一些,因为Python相对于其他的语言来说,语法简单、功能强大、上手容易,更适合新手学习,同时Python开发效率很高,其他语言几行代码的事情,Python一行就可以搞定了。同时Python在数据分析、人工智能等领域都是首选语言,应用领域非常广泛,可以从事的岗位多,工作机会多,待遇也都很不错。