課程名稱
數據分析》
升級版
梁斌
資深算法工程師
查爾斯特大學(
)計算機博士,從事機器學習、計算機視覺及模式識別等相關方向的研究,在計算機視覺等國際會議及期刊發表
余篇學術論文。現就職于澳大利亞某科學研究機構
,負責算法改進及其產品化、數據分析處理及可視化。
課程簡介:
近兩年來,數據分析師的崗位需求非常大,
的崗位技能需要掌握
作為數據分析工具,
語言的易學性、快速開發,擁有豐富強大的擴展庫和成熟的框架等特性很好地滿足了數據分析師的職業技能要求。
本課程以
案例驅動
的方式講解如何利用
完成數據獲取、處理、數據分析及可視化方面常用的數據分析方法與技巧。每章節中都會引入
或工業項目數據集
,通過這些實際案例讓學員輕松掌握使用
分析來自不同領域的數據,
隨課代碼
及案例代碼均會提供給學員自行實操。
升級內容:
據
的調查報告顯示:企業中的大部分數據都是非結構化數據,這些數據每年都按指數增長
。因此,本期升級課程在《
數據分析》第一期的基礎上,主要新增了非結構化數據分析以及常用的分析建模方法,從而幫助學員及時更新并掌握最新的數據分析知識。
具體新增內容如下:
使用最新版本的
作為分析工具
新增數據分析常用的建模知識
新增使用
處理和分析時間序列數據
新增使用
進行文本數據分析
新增使用
進行圖像數據處理及分析
升級
全部隨課項目
,并提供更詳細的分析步驟
面向人群:
想了解和學習典型的數據分析流程和實踐方法的學習者
想接觸和
學習非
結構化數據
比如:文本、圖像等
分析的學習者
想學習數據分析中常用建模知識的相關從業人員
尚不會使用
的數據分析師從業者
想轉行從事數據分析
師行業
的學習者
想使用
實現機器學習的工程師
學習收益:
通過本課程的學習,學員將會收獲:
熟悉數據分析的流程,包括數據采集、處理、可視化等
掌握
語言作為數據分析工具,從而有能力駕馭不同領域數據分析實踐
掌握非結構化數據的處理與分析
快速積累多個業務領域的數據分析項目經驗
掌握使用
實現基于機器學習的數據分析和預測
掌握數據分析中常用的建模知識
開課時間:
年
月
日
學習方式:
在線直播,
共
次課,每次
小時
每周
次(
周六、日,下午
直播后提供錄制回放視頻,可在線反復觀看,有效期
年
課程大綱:
第一課
工作環境準備及數據分析建模理論基礎
課時
課程介紹
語言基礎及
新特性
使用
和
進行科學計算
數據分析建模理論基礎
數據分析建模過程
常用的數據分析建模工具
實戰案例:科技工作者心理健康數據分析
第二課
數據采集與操作
課時
本地數據的采集與操作
常用格式的本地數據讀寫
的數據庫基本操作
網絡數據的獲取與表示
解析網頁
爬蟲框架
基礎
回歸分析
回歸
實戰案例:獲取國內城市空氣質量指數數據
第三課
數據分析工具
課時
的數據結構
的數據操作
數據的導入、導出
數據的過濾篩選
索引及多重索引
統計計算和描述
數據的分組與聚合
數據清洗、合并、轉化和重構
聚類模型
實戰案例:全球食品數據分析
第四課
數據可視化
課時
繪圖
繪圖
繪圖
交互式數據可視化
繪圖
實戰案例:世界高峰數據可視化
第五課
時間序列數據分析
課時
的日期和時間處理及操作
的時間序列數據處理及操作
時間數據重采樣
時間序列數據統計
滑動窗口
時序模型
實戰案例:股票數據分析
第六課
文本數據分析
課時
文本分析工具
分詞
情感分析
文本分類
分類與預測模型
樸素貝葉斯
實戰案例:
微博情感
分析
第七課
圖像數據處理及分析
課時
基本的圖像操作和處理
常用的圖像特征描述
分類與預測模型
人工神經網絡
實戰案例:電影口碑與海報圖像的相關性分析
第八課
機器學習基礎及機器學習庫
課時
機器學習基礎
機器學習庫
特征降維
主成分分析
實戰案例:識別
用戶性別
第九課
項目實戰:通過移動設備行為數據預測使用者的性別和年齡
課時
交叉驗證及參數調整
特征選擇
項目實操
課程總結