数据科学更多的不是研发算法,而是应用算法。不是开发模型,而是定制化模型。数据科学,大数据, 人工智能,机器学习领域,不需要什么数学基础有多好,不需要是工科的专业,也不需要多高深的文凭,其实高中学的扎实都足够了。 为什么这样说? 现在各种算法和模型都已经有现存的模块了,大多数的工作不是研发新的算法和模型,而是知道如何应用现成的算法和模型,甚至就是调参数而已。最需要的是对于某个行业的精深的行业知识和规律的了解,对于市场的了解。很多人会有误解,甚至很多软件工程师都有误解。这是我一个文科生自学5年后的感受:更需要对于商业的了解,多于对于算法,模型和数学的了解。 我的很多朋友都是写java的,十几年了, 还是在写代码。 我5年前学python,大数据, 人工智能,结合我对商业和市场的了解, 马上开发了一个全新的领域,独特的算法解决了20多年没解决的问题。 我研发的算法核心不是多高深的数学,而是认知事物的核心规律,知道如何整合和借鉴现存的模块去达到目的,解决问题。 很多大数据,人工智能的算法的核心思路都是90年代发现的很简单规律。 你的问题是自己没有真正进入python和数据科学领域,站在自己十几年的java的工作经验来评价python , 看不到python的成长的路径,这是认知边界。可能说的有点重,但是动机是希望有些启发, 不是要怼你。 补充两点: 1. 很多人工智能的教授和Phd到现在都不明白的一件事: 人脑总结的某个行业或者事物的最深刻的规律, 很多时候就是一句最简单的话可以表述出来的, 这才是最高的算法. 这个规律目前无论什么算法和计算框架都不可能找到. 比如: 英国语言学家 J.R.Firth 1975 说: "you shall know a word by the company it keeps" , 英国哲学家Ludwig Wittgenstein 说:“ the meaning of a word is its use in the language” . 意思是如果要了解一个词的意思, 就应该可以通过上下文预测应不应该使用这个词. 这就是自然语言说的 distribution similarity 。 这个最简单的规律导致了现在各种人工智能的自然语言处理方面的各种高深的算法和框架. 可是这些算法和框架都不可能总结出这么一个简单的规律, 只有人的大脑才可以。 2. 如果在 1. 深刻了解所在行业规律, 2. 数学和算法,3. 与众不同的思维 中排序, 我建议是 1》3》2 。