唐宇迪:入门数据挖掘,我最推荐这本书

原创 数据小兵  2019-10-10 12:14  阅读 193 次
视频课程《SPSS统计分析:从入门到实践提高》

在《什么值得读》人工智能入门书精选推荐系列的第二篇中,唐宇迪老师为我们推荐了一本他极力推荐的数据挖掘入门书。

入门数据挖掘,我最推荐这本书    文/唐宇迪

伴随着人工智能与数据科学行业的发展,人们越来越重视数据的价值。作为用户,我们每天在使用各种产品时产生了大量的数据,各大公司就会利用我们产生的数据,去挖掘里面的信息,以便更好的为我们服务。

那么问题来了,怎么在这些数据中挖掘出更多的价值?数据挖掘是怎么做的?你又有没有机会做数据挖掘的工作呢?

今天我给你推荐一本数据挖掘的入门书,机械工业出版社的《数据挖掘:概念与技术》,让你找找感觉。

推荐这本书给大家主要有3个原因。

第一,这本书具有明确的学习路径,是一本非常合格的入门引导书。

入门一个行业或者一项技术,就好像在一张白纸上绘制地图,最大的困难就是找到从哪儿开始,边界多大,主干在什么地方,怎么在白纸上一步步绘制出这个完整的地图。

这时候我们最需要一个有明确学习路径的指导手册,带着我们一点点画出来。

《数据挖掘:概念与技术》这本书就是一本非常合格的学习路径引导书。

它先从整体上介绍数据挖掘的核心概念,阐述学习数据挖掘过程的核心路线,从最基础的数据本质入手过渡到数据可视化,从统计学的基本概念引入数据分析的核心思想与应用,最后从当下热门的机器学习技术延伸到数据挖掘的任务流程与实践方法,一步步由浅及深的讲解整个数据挖掘的生命周期。

按照书中的指引一步步攻克每一个知识点,实际动手操作每一个案例内容,就可以建立起数据分析的基本入门框架,以后再面对复杂的问题心里就有底啦。如果想从事这方面的工作,找一个数据分师的实习岗位也是没有问题的。

第二,《数据挖掘:概念与技术》这门书对每个知识点都给出了详细的定义。

拿第二章认识数据来说,这一章讲数据的属性。起初我以为数据就是1、2、3、4这样的数字,不知道数据还会分成什么连续值、离散值,更不知道数据挖掘是要做什么事。

书中用一个简单的数据可视化的DEMO,讲明白了数据的很多属性,让我忽然意识到,原来我们生活中的点点滴滴,都是数据,只不过呈现的形式不同罢了。我们看到的图像、视觉信号是数据,听到的声音是数据,就连拿在手里的奶茶都能用种类、大小、甜度、温度等各种数据来表征。

这给我一种豁然开朗的感觉,简直颠覆了我对数据的认知,那种快感让我欲罢不能。那段时间手里无论有多忙,我都会抽出时间就一心往下读,深入到数据中去探索下一个知识点。

第三,这本书介绍了一个实用性非常高的数据挖掘流程,实际工作中可以套用。

《数据挖掘:概念与技术》这门书具有非常强的实用性,因为它提出了一个解决数据挖掘问题的核心流程。

这个流程是,先将实际的问题转换成数据挖掘要处理的对象,比如一个项目要落地必须有执行的算法,就是好几个数学公式,如何将实际问题转换成一个具体的算法就是流程的第一步。

接下来要让这个算法更好的应用到实际的数据里,最后根据结果改进算法让它更适合于我们手里的数据源。按照这样一个流程我们就可以完成一个实际的工作了。

在实际做项目的过程中,当我遇到问题迷茫的时候,总会想起这本书,遵循书中数据挖掘的任务流程,参考每一个知识点的含义,把这个流程应用到自己的项目应用其中,最终把项目做出来。参考性非常强。

总之,如果你想入门数据挖掘这个热门领域,推荐你读这本《数据挖掘:概念与技术》。它深入浅出,从数据本身出发讲解数据挖掘过程中的一系列方法与实际应用技巧,一步步带你进入数据挖掘的殿堂。

本文地址:http://www.datasoldier.net/archives/1549
版权声明:本文为原创文章,版权归 数据小兵 所有,欢迎分享本文,转载请保留出处!
SPSS在线视频学习
欢迎订阅SPSS训练营微信公众号

评论已关闭!