Python与大数据分析

Python and Big Data

大数据的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理和有效管理; Python语言的简洁、易读以及可扩展性,非常适合用于大数据的处理和管理等工作。在国外用Python做科学计算的研究机构日益增多,一些知名大学已经采用Python教授程序设计课程。例如卡耐基梅隆大学的编程基础、麻省理工学院的计算机科学及编程导论就使用Python语言讲授。

Python具有丰富和强大的库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C/C++重写,而后封装为Python可以调用的扩展类库。Python语言的核心只包含数字、字符串、列表、字典、文件等常见类型和函数,而由Python标准库提供了系统管理、网络通信、文本处理、数据库接口、图形系统、XML处理等额外的功能。Python标准库命名接口清晰、文档良好,很容易学习和使用。

使用Python做大数据分析工具,有如下优点:首先, Python完全免费,众多开源的科学计算库都提供了Python的调用接口。用户可以在任何计算机上免费安装Python及其绝大多数扩展库。其次,Python是一门更易学、更严谨的程序设计语言。它能让用户编写出更易读、易维护的代码。最后,Python有着丰富的扩展库,可以轻易完成各种高级任务,开发者可以用Python实现完整应用程序所需的各种功能。

由此可见,Python语言是非常适合初学者学习的编程语言,并且也是大数据处理和分析的首选工具。

教学安排

课程涵盖但不局限于以上内容.

课序号:CMP245

先修课程:《高等数学》或《线性代数》等相关数学课程,建议先修一门编程(C/C++/Java)

参考教材

1.《Python基础教程》[挪]Magnus Lie Hetland著;司维,曾军崴,谭颖华译

参考书目

1.《Python for Data Analysis:利用Python进行数据分析》[美]Wes McKinney著;唐学韬

2.《Python核心编程》(第2版)[美] 丘恩(Chun W.J.) 著;宋吉广 译

参考网络

1- Python tutorial 2.7.14

2-廖雪峰-Python教程