大數(shù)據(jù)在不論在研究還是工程領(lǐng)域都是熱點(diǎn)之一,算法是大數(shù)據(jù)管理與計(jì)算的核心主題。本課程試圖簡(jiǎn)要介紹大數(shù)據(jù)計(jì)算中涉及到的基本算法設(shè)計(jì)方法。適用于大數(shù)據(jù)研究與開發(fā)人員,也適用于數(shù)據(jù)科學(xué)愛好者。
大數(shù)據(jù)算法這門課程旨在通過講授一些大數(shù)據(jù)上基本算法設(shè)計(jì)思想,包括概率算法、I/O有效算法和并行算法,讓聽課的同學(xué)們接觸到和傳統(tǒng)算法課程不一樣的算法設(shè)計(jì)與分析思路,并且以最新的研究成果為導(dǎo)向,讓參與這門課程學(xué)習(xí)的同學(xué)了解大數(shù)據(jù)算法的前沿知識(shí)。通過這門課程的學(xué)習(xí),同學(xué)可以掌握大數(shù)據(jù)算法設(shè)計(jì)的基本思想,掌握大數(shù)據(jù)算法設(shè)計(jì)與分析的技術(shù)。
【課程目錄】
第1章 大數(shù)據(jù)算法概述
大數(shù)據(jù)的定義與特點(diǎn)
大數(shù)據(jù)算法
大數(shù)據(jù)算法設(shè)計(jì)與分析
第2章 亞線性算法概述
亞線性算法的定義
水庫抽樣—空間亞線性算法
平面圖直徑—時(shí)間亞線性計(jì)算算法
全0數(shù)組判定—時(shí)間亞線性判定算法
第3章 亞線性算法例析
數(shù)據(jù)流中頻繁元素
最小生成樹
序列有序的判定
第4章 外存算法概述
外存存儲(chǔ)結(jié)構(gòu)與外存算法
外存算法示例:外存排序算法
外存數(shù)據(jù)結(jié)構(gòu)示例:外存查找樹
第5章 外存查找結(jié)構(gòu)
B樹
KD樹
第6章 外存圖數(shù)據(jù)算法
表排序及其應(yīng)用
時(shí)間前向處理方法
縮圖法
第7章 基于MapReduce的并行算法設(shè)計(jì)
MapReduce概述
字?jǐn)?shù)統(tǒng)計(jì)
平均數(shù)計(jì)算
單詞共現(xiàn)矩陣的計(jì)算
第8章 MapReduce算法例析
連接(Join)算法
圖算法
第9章 非MapReduce的并行算法設(shè)計(jì)
基于迭代處理平臺(tái)的并行算法
基于圖處理平臺(tái)的并行算法
第10章 眾包算法
眾包的定義
眾包的實(shí)例
眾包的要素
眾包算法例析