大规模数据分析和建模.基于Spark与R

R语言以其对于统计分析、建模和可视化的有力支持, 成为很多数据科学家、算法人员和机器学习从业者的首选语言。而Spark则得益于其高效的计算性能和良好的接口, 成为人们处理大数据问题的利器。但两者一直以来都在各自的领域开疆拓土; 本书的目的是通过R语言使用Apache Spark, 以使两者发挥出更大的效能。本书第1-5章简单地介绍了如何大规模执行数据科学和机器学习项目。第6-9章介绍了使用Spark进行集群计算时令人激动的基本概念。第10-13章涵盖一些高级主题, 包括分布式R、数据流和社区贡献等。