A. 机器学习,数据挖掘的书有哪些

《机器学习实战》:本书第一部分主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法、朴素贝叶斯算法、Logistic回归算法、支持向量机、AdaBoost集成方法、基于树的回归算法和分类回归树(CART)算法等。第三部分则重点介绍无监督学习及其一些主要算法:k均值聚类算法、Apriori算法、FP-Growth算法。第四部分介绍了机器学习算法的一些附属工具。
《数据挖掘-实用机器学习技术》:本书介绍数据挖掘的基本理论与实践方法。主要内容包括:各种模型(决策树,关联规则、线性模型、聚类、贝叶斯网以及神经网络)以及在实践中的运用,所存任缺陷的分析。安全地清理数据集、建立以及评估模型的预测质量的方法,并且提供了一个公开的数据挖掘工作平台Weka。Weka系统拥有进行数据挖掘仟务的图形用户界面,有助于理解模型,是一个实用并且深受欢迎的工具。
《数据挖掘:概念与技术》:本书全面地讲述数据挖掘领域的重要知识和技术创新。在第1版内容相当全面的基础上,第2版展示了该领域的最新研究成果,例如挖掘流、时序和序列数据以及挖掘时间空间、多媒体、文本和Web数据。本书可作为数据挖掘和知识发现领域的教师、研究人员和开发人员的一本必读书。

B. 有哪些数据分析、数据挖掘的书推荐下

1. 深入浅出数据分析 (豆瓣) 这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。
难易程度:非常易。
2. 啤酒与尿布 (豆瓣) 通过案例来说事情,而且是最经典的例子。
难易程度:非常易。
3. 数据之美 (豆瓣) 一本介绍性的书籍,每章都解决一个具体的问题,甚至还有代码,对理解数据分析的应用领域和做法非常有帮助。
难易程度:易。
4. 集体智慧编程 (豆瓣) 学习数据分析、数据挖掘、机器学习人员应该仔细阅读的第一本书。作者通过实际例子介绍了机器学习和数据挖掘中的算法,浅显易懂,还有可执行的Python代码。
难易程度:中。
5. Machine Learning in Action (豆瓣) 用人话把复杂难懂的机器学习算法解释清楚了,其中有零星的数学公式,但是是以解释清楚为目的的。而且有Python代码,大赞!目前中科院的王斌老师(微博: @王斌_ICTIR)已经翻译这本书了 机器学习实战 (豆瓣)。这本书本身质量就很高,王老师的翻译质量也很高。
难易程度:中。
6. 推荐系统实践 (豆瓣) 这本书不用说了,研究推荐系统必须要读的书,而且是第一本要读的书。
难易程度:中上。
7. 数据挖掘导论 (豆瓣) 最近几年数据挖掘教材中比较好的一本书,被美国诸多大学的数据挖掘课作为教材,没有推荐Jiawei Han老师的那本书,因为个人觉得那本书对于初学者来说不太容易读懂。
难易程度:中上。
8. The Elements of Statistical Learning (豆瓣) 这本书有对应的中文版:统计学习基础 (豆瓣)。书中配有R包,非常赞!可以参照着代码学习算法。
难易程度:难。
9. 统计学习方法 (豆瓣) 李航老师的扛鼎之作,强烈推荐。
难易程度:难。
10. Pattern Recognition And Machine Learning (豆瓣) 经典中的经典。
这些都是在“绿色BI论坛”http://www.powerbibbs.com 找到的,这个论坛经常有数据分析的干货分享,你可以看一下。

C. 求高手推荐学习数据挖掘的方法以及详细的学习过程。

个人建议如下:
第一阶段:掌握数据挖掘的基本概念和方法。先对版数据挖掘有一个概念权的认识,并掌握基本的算法,如分类算法、聚类算法、协同过滤算法等。
参考书:《数据挖掘概念和技术》(第三版)范明,孟小峰 译著。
第二阶段:掌握大数据时代下的数据挖掘和分布式处理算法。现在已经进入大数据时代,传统的数据挖掘算法已经不适用于
参考书:《大数据:互联网大规模数据挖掘和分布式处理》 王斌 译著。
第三阶段:使用Hadoop进行大数据挖掘。Hadoop里面有一个Mahout组件,几乎包括了所有的数据挖掘算法,包括分类、聚类、关联规则等。
参考书:Hadoop实战(第二版).陆嘉恒 著。
另外,数据挖掘是数据库技术、人工智能技术、机器学习技术、统计学习理论、数据可视化等一系列技术的综合,所以,要想学好数据挖掘,这些技术也得懂的呀。
推荐入门时先看浙江大学王灿老师的数据挖掘课程,网上搜下。
期待与你一起学习数据挖掘,共同揭开数据之美。望点赞。