数据科学吧 关注:168贴子:193
  • 1回复贴,共1

1.数据科学的定义是什么?

只看楼主收藏回复

百度百科:数据科学是利用科学方法、流程、算法和系统从数据中提取价值的跨学科领域。
Investopedia:Data science is a field of applied mathematics andstatisticsthat providesuseful information based on large amounts of complex data orbig data.
关键词提取:应用数学、应用统计、基于复杂/大数据、提供有价值的信息
所以我们可以这样总结:
①数据科学的工具是数学、统计、算法、系统等科学方法。
②数据科学的目的是获得有价值的信息。
③数据科学的对象是数据。
由此看来,数据科学像工科,是一门研究应用技术与工艺的学科。
对于数据科学其下的属性,我们需要理解的更深一些。
工具没什么好说,都是外在之物。
目的中有两个点,一个是价值,一个是信息。什么是价值?客体能满足主体的效用与效应。在数据科学中,客体是数据分析结果,主体是人类或人类的目的。对于价值的确认,我们现在有研究价值、商业价值等。所以,我们做数据科学,不是为了将数据形变拆分糅合建模,而是带有目的地去形变拆分糅合建模。信息,指分析的结果,或者未经分析的结果,一个数据处理后的结果,包含着信息,但却未必都能分析出来。所以无目的地数据科学,也仍是数据科学,只要它最终提供了有价值的信息。只是我们通常无目的地探索,不会有很好的发现,这也就是为什么科学研究需要养成良好的基础,方便日后高屋建瓴。
对象是数据,那么什么是数据?万物皆数据,自然的数据,人的数据,星球、空气、行为等等等等,全部都是数据,全部都隐含着丰富的信息,只等待一个聪明的探索者来发现它。数据构成世界,科学将改变世界。


IP属地:广东来自Android客户端1楼2022-07-28 14:34回复
    跟cs区别大吗 ds考研有必要去cs吗


    IP属地:江苏来自iPhone客户端2楼2023-07-17 09:22
    回复