sparkr
r是一套自由免费的软件,具有入门容易、使用简单之特色
R是一套自由免费的软件,具有入门容易、使用简单之特色,目前多应用于机器学习、资料探勘、文字探勘、统计分析及巨量资料分析等领域。 本书第1至5章先介绍R的基本操作及应用,包括认识R语言特性、资料读取及写入方式,接着介绍R的绘图功能及相关套件之运用;第6至9章介绍各类学习算法,如:决策树、K平均算法、基因算法等,每一章节都加入范例供读者即时练习;第10至12章介绍关联性规则、社群网络分析、文字探勘及图形化资料分析工具等内容,将R软件在资料分析上的使用作更完整的补充,对于没有程式设计经验的读者来说,本书是入门的**选择;第13章及14章加入巨量资料分析介绍,读者可先了解Hadoop基本原理并充分结合R与Hadoop之功能;读者亦可了解Spark基本原理并充分学习SparkR之功能,进而导引读者进入巨量资料分析的殿堂;第15章加入SparkR应用,读者可了解如何应用SparkR。 1. 各章节皆附范例实作,帮助初学者从做中学,增加练习机会,同时培养自行撰写程式之能力