《Python与网络爬虫》

本课程是面向全校的本科生开设的专业基础课程之一,旨在培养学生应用计算机解决大数据处理和管理中实际问题的基本能力。现今是大数据时代,网络爬虫技术是我们获取大量数据的一项非常好用的手段,熟练掌握爬虫技术对学生的程序能力提高和科研都有很大好处。

学习python语言有很多好处,Python语言的简洁、易读以及可扩展性,非常适合用于大数据的处理和管理等工作。在国外用Python做科学计算的研究机构日益增多,一些知名大学已经采用Python教授程序设计课程。例如卡耐基梅隆大学的编程基础、麻省理工学院的计算机科学及编程导论就使用Python语言讲授。

python爬虫用来收集数据是最直接和常用的方法,可以使用python爬虫程序获得大量的数据,从而变得非常的简单和快速;绝大多数网站使用了模板开发,使用的模板可以快速生成大量相同布局不同内容的页面,这时只需要为一个页面开发爬虫程序,因为爬虫程序也可以对同一模板生成的不同内容进行爬取内容。

教学安排

课序号:CMP257

先修课程:《高等数学》或《线性代数》等相关数学课程

参考教材

1.Python3网络爬虫开发实战 第2版》崔庆才,人民邮电出版社

2.《Python基础教程(第2版 修订版)》[挪]Magnus Lie Hetland著;司维,曾军崴,谭颖华译,人民邮电出版社,2013

参考书目

1.《Python网络爬虫从入门到精通》明日科技 编著,清华大学出版社