![]() 人工智能,下一場互聯網革命!2017年機器學習工程師正在成為IT行業需求缺口最大的崗位,機器學習平均年薪較其他崗位平均年薪高。并且隨著從業年限遞增,機器學習從業人員平均薪酬漲幅高。機器學習從業人員平均月薪分布,超過70%從業者月薪為20K-50K。 【課程內容】 —————-數學基礎—————- 本階段主要從數據分析、概率論和線性代數及矩陣和凸優化這四大塊講解基礎,旨在訓練大家邏輯能力,分析能力。擁有良好的數學基礎,有利于大家在后續課程的學習中更好的理解機器學習和深度學習的相關算法內容。同時對于AI研究尤為重要,例如人工智能中的智能很大一部分依托“概率論”實現的。 一、數據分析 1)常數e 二、概率論 1)微積分與逼近論 三、線性代數及矩陣 1)線性空間及線性變換 四、凸優化 1)凸優化基本概念 —————-python基礎與高級應用—————- 隨著AI時代的到來以及其日益蓬勃的發展,Python作為AI時代的頭牌語言地位基本確定,機器學習是著實令人興奮,但其復雜度及難度較大,通常會涉及組裝工作流和管道、設置數據源及內部和云部署之間的分流而有了Python庫后,可幫助加快數據管道,且Python庫也在不斷更新發布中,所以本階段旨在為大家學習后續的機器學習減負。 一、容器 1)列表:list 二、函數 1)lambda表達式 三、常用庫 1)時間庫 四、爬蟲 1)正則表達式 —————-機器學習—————- 機器學習利用算法去分析數據、學習數據,隨后對現實世界情況作出判斷和預測。因此,與預先編寫好、只能按照特定邏輯去執行指令的軟件不同,機器實際上是在用大量數據和算法去“自我訓練”,從而學會如何完成一項任務。 所以本階段主要從機器學習概述、數據清洗和特征選擇、回歸算法、決策樹、隨機森林和提升算法、SVM、聚類算、EM算法、貝葉斯算法、隱馬爾科夫模型、LDA主題模型等方面講解一些機器學習的相關算法以及這些算法的優化過程,這些算法也就是監督算法或者無監督算法。 一、機器學習 1)機器學習概述 二、監督學習 1)邏輯回歸 三、非監督學習 1)高斯混合模型 四、數據處理與模型調優 1)特征提取 —————-數據挖掘與項目實戰—————- 本階段主要通過音樂文件分類和金融反欺詐模型訓練等項目,幫助大家對于上階段的機器學習做更深入的鞏固,為后續深度學習及數據挖掘提供項目支撐。 項目一:百度音樂系統文件分類 音樂推薦系統就是利用音樂網站上的音樂信息,向用戶提供音樂信息或者建議,幫助用戶決定應該聽什么歌曲。而個人化推薦則是基于音樂信息及用戶的興趣特征、聽歌歷史行為,向用戶推薦用戶可能會感興趣的音樂或者歌手。推薦算法主要分為以下幾種:基于內容的推薦、協同過濾推薦、基于關聯規則推薦、基于效用推薦、基于知識推薦等;推薦系統常用于各個互聯網行業中,比如音樂、電商、旅游、金融等。 項目二:千萬級P2P金融系統反欺詐模型訓練 目前比較火的互聯網金融領域,實質是小額信貸,小額信貸風險管理,本質上是事前對風險的主動把控,盡可能預測和防范可能出現的風險。本項目應用GBDT、Randomforest等機器學習算法做信貸反欺詐模型,通過數據挖掘技術,機器學習模型對用戶進行模型化綜合度量,確定一個合理的風險范圍,使風險和盈利達到一個平衡的狀態。 —————-深度學習—————- 深度學習是實現機器學習的技術,同時深度學習也帶來了機器學習的許多實際應用,拓展了AI的使用領域,本階段主要從TensorFlow、BP神經網絡、深度學習概述、CNN卷積神經網絡、遞歸神經網、自動編碼機,序列到序列網絡、生成對抗網絡,孿生網絡,小樣本學習技術等方面講解深度學習相關算法以,掌握深度學習前沿技術,并根據不同項目選擇不同的技術解決方案。針對公司樣本不足,采用小樣本技術和深度學習技術結合,是項目落地的解決方案。 1)TensorFlow基本應用 —————-自然語言處理—————- 自然語言處理(NLP)是計算機科學領域與人工智能領域中的一個重要方向。它已成為人工智能的核心領域。自然語言處理解決的是“讓機器可以理解自然語言”這一到目前為止都還只是人類獨有的特權,被譽為人工智能皇冠上的明珠,被廣泛應用。本階段從NLP的字、詞和句子全方位多角度的學習NLP,作為NLP的基礎核心技術,對NLP為核心的項目,如聊天機器人,合理用藥系統,寫詩機器人和知識圖譜等提供底層技術。通過學習NLP和深度學習技術,掌握NLP具有代表性的前沿技術。 1)詞(分詞,詞性標注)代碼實戰 —————-圖像處理—————- 數字圖像處理(Digital Image Processing)是通過計算機對圖像進行去除噪聲、增強、復原、分割、提取特征等處理的方法和技術。廣泛的應用于農牧業、林業、環境、軍事、工業和醫學等方面,是人工智能和深度學習的重要研究方向。深度學習作為當前機器學習領域最熱門的技術之一,已經在圖像處理領域獲得了應用,并且展現出巨大的前景。本階段學習了數字圖像的基本數據結構和處理技術,到前沿的深度學習處理方法。掌握前沿的ResNet,SSD,Faster RCNN等深度學習模型,對圖像分類,目標檢測和模式識別等圖像處理主要領域達到先進水平。實際工作中很多項目都可以轉化為本課程的所學的知識去解決,如行人檢測,人臉識別和數字識別。 一、圖像基礎 二、圖像操作及算數運算 三、圖像顏色空間運算 四、圖像幾何變換 五、圖像形態學 六、圖像輪廓 七、圖像統計學 八、圖像濾波 —————-企業項目實戰—————- AI大數據互聯網電影智能推薦(第一季) 隨著科技的發展,現在視頻的來源和類型多樣性,互聯網視頻內容充斥著整個網絡,如果僅僅是通過翻頁的方法來尋找自己想看的視頻必然會感到疲勞,現在急需一種能智能推薦的工具,推薦系統通過分析用戶對視頻的評分分析,對用戶的興趣進行建模,從而預測用戶的興趣并給用戶進行推薦。 Python是一種面向對象的解釋型計算機程序設計語言,Python具有豐富和強大的庫。它常被昵稱為膠水語言,而大數據是指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,企業面臨海量數據的到來,大多選擇把數據從本地遷移至云端,云端將成為最大的非結構化數據存儲場所。本項目主要以客戶咨詢為載體,分析客戶的群體,分布,旨在挖掘客戶的內在需求,幫助企業實現更有價值的營銷。 一、教務管理系統業務介紹 1)教務管理系統框架講解 二、大數據需求分析 1)明確數據需求 三、構建分布式大數據框架 1)Hadoop分布式集群配置 四、基于教務管理系統大數據分析 1)業務數據分析指標設定 五、大數據可視化 1)可視化技術選型 AI法律咨詢大數據分析與服務智能推薦實戰項目(第一季) 本項目結合目前流行的大數據框架,在原有成熟業務的前提下,進行大數據分析處理,真實還原企業應用,讓學員身臨其境的感受企業大數據開發的整個流程。 項目的業務系統底層主要采用JAVA架構,大數據分析主要采用Hadoop框架,其中包括Kettle實現ETL、SQOOP、Hive、Kibana、HBASE、Spark以及人工智能算法等框架技術;采用真實大數據集群環境的搭建,讓學員切身感受企業項目的從0到1的過程。 一、系統業務介紹 1)底層業務實現框架講解 二、系統架構設計 1)總體架構分析 三、詳盡實現 1)原始數據處理 四、數據可視化 1)采用Highcharts插件展示客戶偏好曲線圖 五、項目優化 1)ZooKeeper實現HA |