企業(yè)管理培訓(xùn)分類(lèi)導(dǎo)航
企業(yè)管理培訓(xùn)公開(kāi)課計(jì)劃
企業(yè)培訓(xùn)公開(kāi)課日歷
2025年
2024年
職業(yè)技能培訓(xùn)公開(kāi)課
職業(yè)技能培訓(xùn)內(nèi)訓(xùn)課程
熱門(mén)企業(yè)管理培訓(xùn)關(guān)鍵字
您所在的位置:名課堂>>公開(kāi)課>>職業(yè)技能培訓(xùn)公開(kāi)課
Spark大數(shù)據(jù)挖掘工具M(jìn)llib實(shí)戰(zhàn)(機(jī)器學(xué)習(xí))
【課程編號(hào)】:MKT028424
Spark大數(shù)據(jù)挖掘工具M(jìn)llib實(shí)戰(zhàn)(機(jī)器學(xué)習(xí))
【課件下載】:點(diǎn)擊下載課程綱要Word版
【所屬類(lèi)別】:職業(yè)技能培訓(xùn)
【時(shí)間安排】:2025年02月18日 到 2025年02月19日5500元/人
2024年03月05日 到 2024年03月06日5500元/人
【授課城市】:北京
【課程說(shuō)明】:如有需求,我們可以提供Spark大數(shù)據(jù)挖掘工具M(jìn)llib實(shí)戰(zhàn)(機(jī)器學(xué)習(xí))相關(guān)內(nèi)訓(xùn)
【課程關(guān)鍵字】:北京大數(shù)據(jù)挖掘培訓(xùn)
我要報(bào)名
咨詢(xún)電話(huà): | |
手 機(jī): | 郵箱: |
課程介紹
隨著互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的發(fā)展,我們已經(jīng)切實(shí)地迎來(lái)了一個(gè)大數(shù)據(jù)的時(shí)代。大數(shù)據(jù)是指無(wú)法在一定時(shí)間內(nèi)用常規(guī)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合,對(duì)大數(shù)據(jù)的實(shí)時(shí)分析已經(jīng)成為一個(gè)非常重要且緊迫的需求。目前對(duì)大數(shù)據(jù)的實(shí)時(shí)分析工具,業(yè)界公認(rèn)最佳為Spark。Spark是一個(gè)開(kāi)源集群運(yùn)算框架,最初是由加州大學(xué)柏克利分校AMPLab所開(kāi)發(fā),Spark使用了內(nèi)存內(nèi)運(yùn)算技術(shù),在內(nèi)存上的運(yùn)算速度比Hadoop MapReduce的運(yùn)算速度快上100倍,即便是在磁盤(pán)上運(yùn)行也能快10倍。
為解決廣大系統(tǒng)設(shè)計(jì)人員深入研究與開(kāi)發(fā)大數(shù)據(jù)挖掘和實(shí)時(shí)分析的需要,培訓(xùn)中心特舉辦“Spark大數(shù)據(jù)挖掘工具M(jìn)Llib實(shí)戰(zhàn)”培訓(xùn)班,本課程主要講解Spark MLlib,Spark MLlib是一種高效、快速、可擴(kuò)展的分布式計(jì)算框架,實(shí)現(xiàn)了常用的機(jī)器學(xué)習(xí),如:聚類(lèi)、分類(lèi)、回歸等算法。講解各個(gè)算法的理論、詳細(xì)展示Spark源碼實(shí)現(xiàn),最后均會(huì)通過(guò)實(shí)例進(jìn)行解析實(shí)戰(zhàn),幫助大家真正從理論到實(shí)踐全面掌握Spark MLlib分布式機(jī)器學(xué)習(xí)和大數(shù)據(jù)挖掘方法
培訓(xùn)對(duì)象
1,系統(tǒng)架構(gòu)師、系統(tǒng)分析師、高級(jí)程序員、資深開(kāi)發(fā)人員。
2,牽涉到大數(shù)據(jù)實(shí)時(shí)處理的數(shù)據(jù)中心運(yùn)行、規(guī)劃、設(shè)計(jì)負(fù)責(zé)人。
3,政府機(jī)關(guān),金融保險(xiǎn)、移動(dòng)和互聯(lián)網(wǎng)等大數(shù)據(jù)來(lái)源單位的負(fù)責(zé)人。
4,高校、科研院所牽涉到大數(shù)據(jù)與分布式數(shù)據(jù)處理的項(xiàng)目負(fù)責(zé)人。
課程目標(biāo)
1, 全面了解大數(shù)據(jù)實(shí)時(shí)處理技術(shù)的相關(guān)知識(shí)。
2,學(xué)習(xí)Spark的核心技術(shù)方法以及應(yīng)用特征。
3,深入使用MLLib在大數(shù)據(jù)挖掘和實(shí)時(shí)分析中的使用。
4,掌握MLlib相關(guān)機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘工具的使用。
課程大綱
第一講 Spark大數(shù)據(jù)實(shí)時(shí)處理技術(shù)
1)大數(shù)據(jù)處理技術(shù)
2)Spark實(shí)時(shí)處理技術(shù)
3)Spark生態(tài)系統(tǒng)BDAS
4)Spark架構(gòu)分析
第二講 Spark安裝配置及監(jiān)控
1)Ubuntu環(huán)境的準(zhǔn)備
2)Hadoop2.X和Scala
3)搭建Spark開(kāi)發(fā)環(huán)境
4)Idea編譯和運(yùn)行
5)Spark監(jiān)控管理
第3講 Scala編程語(yǔ)言和分布式計(jì)算模型
1) Scala編程語(yǔ)言
2) 操作基本數(shù)據(jù)類(lèi)型
3)Spark計(jì)算模型和RDD
4)Transformation及Actions算子
5)Spark MLlib矩陣向量
第四講 Spark MLlib線性回歸和邏輯回歸算法
1)線性回歸算法
2)線性回歸代碼實(shí)例
3)邏輯回歸算法
4)邏輯回歸回歸代碼實(shí)例
5)線性回歸和邏輯回歸代碼實(shí)操
第五講 Spark MLlib貝葉斯分類(lèi)算法
1) 貝葉斯分類(lèi)算法原理
2) Spark貝葉斯分類(lèi)源碼
3) Spark貝葉斯分類(lèi)代碼示例
4) 貝葉斯分類(lèi)代碼實(shí)操
第六講 Spark MLlib決策樹(shù)算法
1) 決策樹(shù)算法原理
2) Spark決策樹(shù)算法源碼
3) Spark決策樹(shù)算法代碼示例
4) 決策樹(shù)代碼實(shí)操
第七講 Spark MLlib聚類(lèi)算法
1) K-Means聚類(lèi)算法原理
2) Spark K-Means聚類(lèi)算法源碼
3) SparkK-Means聚類(lèi)代碼示例
4) 聚類(lèi)算法代碼實(shí)操
第八講 Spark MLlib關(guān)聯(lián)規(guī)則算法
1) FPGrowth關(guān)聯(lián)規(guī)則算法原理
2) FPGrowth關(guān)聯(lián)規(guī)則算法源碼
3) FPGrowth關(guān)聯(lián)規(guī)則代碼示例
4) 關(guān)聯(lián)規(guī)則代碼實(shí)操
第九講 Spark MLlib個(gè)性化推薦算法
1) 協(xié)同過(guò)濾推薦算法原理
2) Spark協(xié)同過(guò)濾推薦源碼
3) Spark協(xié)同過(guò)濾推薦代碼示例
4) 推薦代碼實(shí)操
第十講 Spark MLlib神經(jīng)網(wǎng)絡(luò)算法
1) 神經(jīng)網(wǎng)絡(luò)算法原理
2) Spark神經(jīng)網(wǎng)絡(luò)算法源碼
3) Spark神經(jīng)網(wǎng)絡(luò)代碼示例
4) 神經(jīng)網(wǎng)絡(luò)代碼實(shí)操
楊老師
由業(yè)界知名大數(shù)據(jù)專(zhuān)家親自授課:
楊老師 主要研究網(wǎng)絡(luò)信息分析以及云計(jì)算相關(guān)技術(shù),長(zhǎng)期從事通信網(wǎng)管系統(tǒng)、網(wǎng)絡(luò)信息處理、商務(wù)智能(BI)以及電信決策支持系統(tǒng)的研究開(kāi)發(fā)工作,主持和參與了多個(gè)國(guó)家和省部級(jí)基金項(xiàng)目,具有豐富的工程實(shí)踐及軟件研發(fā)經(jīng)驗(yàn)。