北京赛车PK10全天实时计划歡迎您的到來!

課程培訓
IBM公司spark培訓

Spark及其在機器學習中的應用

 

課程目標:

 

通過該課程的學習,學員應能夠熟練掌握 Spark 并能利用 Spark 解決機器學習的相關問題; 具體的,學員將了解: 1.SparkUbuntu虛擬機上的分布式集群環境搭建; 2.基于PythonSpark編程基礎; 3.Spark MLlib的使用(.py文件)包括回歸預測、聚類、關聯規則、神經網絡預測; 4.Spark在阿里云的使用(.py文件) ; 5.SparkAWS亞馬遜云的使用。

 

課程大綱:

 

時間

主題

內容

第一天

 

上午

 

 

Spark簡介及環境搭建

 

l Spark 簡介

l Spark 環境搭建(Ubuntu , 分布式集群).使用的是 Hadoop 2.7.3 和 Spark 2.0.1 版本

 

下午

 

 

 

基于PythonSpark 編程

 

 

l 基于 Python 的 Spark 常用函數及其使用方法。map/reduce/groupByKey/reduceByKey/filter/ flatMap/saveAsTextFile/join 等

l 基于 Python 的 Spark 編程樣例。通過基本的統計分析和數據處理樣例說明該怎樣進行基于 Python 的 Spark 編程

 

 

 

第二天

 

上午

 

 

Spark 和機器學習

 

 

l MLLib 全方位介紹 。MLLib 包含的各種算法函數的介紹。個別算法根據情況可以講解源代碼

l MLLib 編程樣例 (回歸預測 , 聚類 , 關聯規則,  神經網絡預測等)

 

下午

 

云環境下的 Spark 以及預測的簡介

 

l Spark 在阿里云的使用

l Spark 在 AWS 亞馬遜云的使用

l 預測方法簡介:包括時間序列預測,機器學習方法進行預測(GBDT, 邏輯回歸等)

 

 




如果您想學習本課程,請預約報名
如果沒找到合適的課程或有特殊培訓需求,請訂制培訓
培訓特點:
針對實際需求,顧問式咨詢,互動式授課,案例教學,小班授課,實際項目演示
培訓講師:
中國科學院軟件研究所,計算研究所高級研究人員
IBM,oracle,微軟,vmware等大型公司高級工程師,項目經理,技術支持專家
中科信軟培訓中心,資深講師
大多名牌大學,碩士以上學歷,相關技術專業,理論素養豐富
多年實際項目經歷,大型項目實戰案例,熱情,樂于技術分享。
針對客戶實際需求,案例教學,互動式溝通,學有所獲
報名表下載
聯系我們 更多>>

 電話咨詢:010-62883247

                 010-62884854

 電子郵件: soft@info-soft.cn 

 

點擊這里給我發消息

點擊這里給我發消息

點擊這里給我發消息

qrcode_for_gh_98c3580f6c5a_430.jpg

訂制培訓 更多>>
北京赛车PK10全天实时计划 全天11选5计划 幸运飞艇分析 腾讯分分彩 5分11选5计划在线