課程簡介:
作為一門學(xué)科,數(shù)據(jù)挖掘?qū)τ谑廊藖碚f在很大程度上是透明的。我們在大多數(shù)時間都從未注意到它的發(fā)生。但每當(dāng)我們辦理商店購物卡、使用信用卡購物或在網(wǎng)上沖浪時,都在創(chuàng)建數(shù)據(jù)。這些數(shù)據(jù)以大數(shù)據(jù)集形式存儲在我們每天與之打交道的公司所擁有的功能強大的計算機上。存在于這些數(shù)據(jù)集之內(nèi)的便是模式 – 表明我們的興趣、習(xí)慣和行為。數(shù)據(jù)挖掘可讓人們找到并解讀這些模式,從而幫助人們做出更明智的決策,并更好地為客戶服務(wù)。
本培訓(xùn)旨在向您介紹數(shù)據(jù)挖掘方面的常見概念和做法。 主要目標(biāo)讀者除了大學(xué)生之外,還有希望通過挖掘數(shù)據(jù),使用信息系統(tǒng)和技術(shù)解決業(yè)務(wù)問題,但在計算機科學(xué)方面沒有正式相關(guān)背景或教育經(jīng)歷的業(yè)務(wù)專家。 盡管數(shù)據(jù)挖掘融合了應(yīng)用統(tǒng)計、邏輯、人工智能、機器學(xué)習(xí)和數(shù)據(jù)管理系統(tǒng),但您不需要在這些領(lǐng)域具有很強的背景即可參加本次培訓(xùn),來學(xué)會使用RapidMiner。 雖然學(xué)過統(tǒng)計學(xué)和數(shù)據(jù)庫方面的初級大學(xué)課程將會有所幫助,但本培訓(xùn)中對成功學(xué)習(xí)如何挖掘數(shù)據(jù)需要了解的概念和技術(shù)進行了解釋。
RapidMiner原名Yale,它是用于數(shù)據(jù)挖掘、機器學(xué)習(xí)、商業(yè)預(yù)測分析的開源計算環(huán)境。根據(jù)KDnuggets在2013年的一次投票顯示,從使用率來看該軟件比之R語言還要略勝一籌。因為其具備GUI特性,所以很適合于數(shù)據(jù)挖掘的初學(xué)者入門。
本課程各章節(jié)圍繞實際挖掘分析業(yè)務(wù)需求,對挖掘工作中常用的各種算法應(yīng)用方式、過程都做了闡述,各章節(jié)所需試驗數(shù)據(jù)也專門打包,可供讀者下載使用。
授課對象:
本課程適合已經(jīng)有一定的IT基礎(chǔ),但對數(shù)據(jù)挖掘領(lǐng)域尚不了解的朋友進修學(xué)習(xí)。如果您具備統(tǒng)計學(xué)和數(shù)據(jù)庫方面的初級基礎(chǔ)技能會更好。課程同樣適用于數(shù)據(jù)分析師、IT系統(tǒng)架構(gòu)設(shè)計及研發(fā)人員,通過簡單靈活的挖掘模型定制,帶領(lǐng)您探索發(fā)現(xiàn)隱藏在海量數(shù)據(jù)背后的新知識。
收獲預(yù)期:
算法有一定的了解,有一定的使用RapidMiner工具解決問題的能力,能夠熟練地使用RapidMiner提供的典型挖掘算法進行挖掘分析。
授課講師:
TEKKEN,從事IT行業(yè)十余年,有豐富的數(shù)據(jù)分析挖掘領(lǐng)域知識經(jīng)驗。對數(shù)據(jù)清洗轉(zhuǎn)換集成、數(shù)據(jù)挖掘分析、數(shù)據(jù)可視化展現(xiàn)等內(nèi)容有豐富的產(chǎn)品/項目實踐經(jīng)驗。曾獨立開發(fā)完成集成了各種儀表盤、圖表、數(shù)據(jù)挖掘組件在一起的Flex儀表盤設(shè)計器。現(xiàn)任某數(shù)據(jù)分析挖掘公司產(chǎn)品總監(jiān)。
——————-課程目錄——————-
《快速數(shù)據(jù)挖掘平臺RapidMiner》課程內(nèi)容:
第一課:數(shù)據(jù)挖掘基本知識RapidMiner工具介紹
第二課:數(shù)據(jù)準(zhǔn)備:導(dǎo)入、預(yù)處理、導(dǎo)出
第三課:數(shù)據(jù)挖掘模型和方法
第四課:K-Means 聚類與辨別分析
第五課:線性回歸與邏輯回歸
第六課:決策樹與神經(jīng)網(wǎng)絡(luò)
第七課:文本挖掘
第八課:WEB挖掘
第九課:協(xié)同過濾、推薦
第十課:時間序列分析
第十一課:離群點分析
第十二課:模型評估-交叉驗證與模型優(yōu)化化
第十三課:過程控制
第十四課:數(shù)據(jù)轉(zhuǎn)換與執(zhí)行命令