課程目標:
讓學員從零基礎開始全面系統地掌握Python數據分析與挖掘的相關知識,并能夠勝任Python3數據分析及數據分析與挖掘中級工程師以上的工作,學完后,能夠讓學員掌握Python3基礎知識、編寫Python爬蟲進行互聯網數據采集、Python大數據分析與挖掘等方面的知識,并能夠對一些大型網站的數據進行采集與分析等,完成類似的中大型數據分析與挖掘項目。
詳細課程大綱:
核心模塊概覽:
Python基礎知識(4課時)
Python爬蟲技術(12課時)
Python數據分析與挖掘技術(24課時)
第一階段:Python基礎
第1周 Python零基礎入門(4小時)
課程介紹
Python初識
Python語法基礎
Python控制流
Python函數
Python模塊
Python文件操作
Python異常處理
第二階段:Python爬蟲技術
第2周 網絡爬蟲理論與簡單爬蟲編寫(4小時)
網絡爬蟲初識
網絡爬蟲原理
正則表達式
Urllib庫實戰
爬蟲的異常處理
爬蟲的瀏覽器偽裝技術
Python新聞爬蟲實戰
第3周 復雜網絡爬蟲的編寫與Scrapy框架(4小時)
爬蟲防屏蔽手段之代理服務器實戰
圖片爬蟲實戰
微信爬蟲實戰
多線程爬蟲實戰
Scrapy框架的安裝
Scrapy框架常見命令實戰
第4周 Scrapy框架深入實戰(4小時)
第一個Scrapy爬蟲
Scrapy自動爬蟲實戰
Scrapy自動登陸爬蟲實戰
用Scrapy爬取某大型商城網站的數據
第三階段:Python數據分析與挖掘技術(24課時)
第5周 Python數據分析與挖掘技術基礎(4小時)
快速了解數據分析與挖掘技術
Python數據導入實戰
Python數據可視化分析實現
第6周 Python數據清洗、集成與變換(4小時)
Python數據清洗實戰
Python數據集成實戰
Python數據變換實戰
學會預處理大規模數據
第7周 Python數據規約與文本挖掘(4小時)
Python數據規約實戰
Python文本挖掘之關鍵詞提取
Python文本挖掘之自動匹配推薦實現
第8周 Python數據建模與分類實現(4小時)
Python數據建模概述
Python數據分類實現過程
常見分類算法
KNN算法
貝克斯方法
回歸分析與決策樹
第9周 Python數據分析與挖掘聚類實現與回歸分析(4小時)
聚類常見算法
聚類三法實戰(劃分法、層次法、密度法)
K-Means算法
Python數據回歸分析實現基礎
人工神經網絡算法
第10周 Python降維技術與大型數據分析與挖掘項目實訓(4小時)
Python數據降維分析實現
大型社交網站用戶行為基本數據分析與挖掘分析項目概述與實現思路
大型社交網站用戶行為基本數據分析與挖掘分析項目數據預處理實戰
大型社交網站用戶行為基本數據分析與挖掘分析項目數據建模實戰
大型社交網站用戶行為基本數據分析與挖掘分析項目終極實戰