400-888-5228

課程長(zhǎng)度:

48課時(shí)

 

培訓(xùn)目的:

第一部分? 數(shù)據(jù)挖掘和 SPSS Modeler

課程將介紹數(shù)據(jù)挖掘原理、SPSS Modeler數(shù)據(jù)挖掘軟件的基本操作和環(huán)境;學(xué)習(xí)如何使用SPSS Modeler讀取,處理數(shù)據(jù)

目的

培訓(xùn)人員能夠掌握數(shù)據(jù)挖掘理論和常用的建模技術(shù)、掌握機(jī)器學(xué)習(xí)的常見(jiàn)技術(shù),比如神經(jīng)網(wǎng)絡(luò)、決策樹(shù)等,并將其應(yīng)用到具體業(yè)務(wù)操作中

 

第二部分 ?SAS數(shù)據(jù)分析和數(shù)據(jù)挖掘

課程基于SAS工具進(jìn)行數(shù)據(jù)分析和挖掘

目標(biāo):

將各種類(lèi)型的數(shù)據(jù)讀入SAS數(shù)據(jù)集中

對(duì)SAS數(shù)據(jù)集進(jìn)行校驗(yàn)和清洗

創(chuàng)建SAS變量和數(shù)據(jù)子集

合并SAS數(shù)據(jù)集

創(chuàng)建增強(qiáng)列表和總結(jié)報(bào)表

 

第三部分 ?R語(yǔ)言實(shí)戰(zhàn)

R語(yǔ)言作為一種數(shù)據(jù)分析專(zhuān)業(yè)語(yǔ)言,是當(dāng)今數(shù)據(jù)科學(xué)領(lǐng)域最流行的開(kāi)源編程語(yǔ)言之一,在數(shù)據(jù)分析與機(jī)器學(xué)習(xí)領(lǐng)域已經(jīng)成為一款最重要的工具。精通R語(yǔ)言的數(shù)據(jù)分析師是企業(yè)競(jìng)相爭(zhēng)搶的高薪人才。

R語(yǔ)言實(shí)戰(zhàn)課程采用MBA式的案例教學(xué),結(jié)合統(tǒng)計(jì)理論,建模方法論、R語(yǔ)言編程和老師的豐富實(shí)際項(xiàng)目經(jīng)驗(yàn),力求讓每一個(gè)學(xué)生都能夠把學(xué)到的知識(shí)運(yùn)用到實(shí)際工作中去。我們精選的案例是目前企業(yè)真實(shí)場(chǎng)景下應(yīng)用很廣泛的場(chǎng)景,集合了互聯(lián)網(wǎng)用戶分析、精準(zhǔn)營(yíng)銷(xiāo)、風(fēng)險(xiǎn)評(píng)估、BI設(shè)計(jì)與實(shí)施等領(lǐng)域的數(shù)據(jù)挖掘?qū)嵗?,?duì)您從事真正的數(shù)據(jù)分析工作有針對(duì)性的指導(dǎo)與幫助。

 

目標(biāo):

  1. 深度學(xué)習(xí)R語(yǔ)言和數(shù)據(jù)挖掘的前沿算法
  2. 理解企業(yè)真實(shí)業(yè)務(wù)場(chǎng)景的建模流程
  3. 熟練使用R語(yǔ)言進(jìn)行建模和實(shí)操
  4. 成為有多種技能并能融會(huì)貫通的復(fù)合型數(shù)據(jù)分析人才

培訓(xùn)大綱:

第一部分? 數(shù)據(jù)挖掘和 SPSS Modeler

  • 數(shù)據(jù)挖掘簡(jiǎn)介
  • CRISP-DM方法論
  • SPSS Modeler簡(jiǎn)介
  • SPSS Modeler的C/S架構(gòu)和界面介紹
  • SPSS Modeler可視化程序的使用基礎(chǔ)
  • 讀取數(shù)據(jù)文件
  • SPSS Modeler可以讀取的數(shù)據(jù)格式
  • 讀取文本數(shù)據(jù)與查看數(shù)據(jù)、SPSS數(shù)據(jù)、數(shù)據(jù)庫(kù)數(shù)據(jù)(SDAP)
  • SPSS Modeler中的字段類(lèi)型、字段方向
  • 保存SPSS Modeler流
  • 數(shù)據(jù)理解---數(shù)據(jù)質(zhì)量評(píng)估
  • 數(shù)據(jù)理解
  • 缺失值定義
  • 數(shù)據(jù)審核節(jié)點(diǎn)介紹
  • 分布圖節(jié)點(diǎn)----初步理解字符型字段的分
  • 直方圖/統(tǒng)計(jì)節(jié)點(diǎn)----初步理解數(shù)值型字段的分布
  • 簡(jiǎn)單數(shù)據(jù)整理
  • Clem語(yǔ)言簡(jiǎn)介
  • 選擇節(jié)點(diǎn),過(guò)濾節(jié)點(diǎn)和導(dǎo)出節(jié)點(diǎn)介紹
  • 自動(dòng)生成操作節(jié)點(diǎn)
  • 尋找數(shù)據(jù)中的關(guān)系
  • 矩陣節(jié)點(diǎn)、網(wǎng)絡(luò)圖節(jié)點(diǎn)、統(tǒng)計(jì)節(jié)點(diǎn)、散點(diǎn)圖節(jié)點(diǎn)、直方圖節(jié)點(diǎn)
  • SPSS Modeler中的數(shù)據(jù)建模技術(shù)
  • 神經(jīng)網(wǎng)絡(luò)、規(guī)則歸納模型、模型比較
  • 聚類(lèi)分析、關(guān)聯(lián)規(guī)則、序列檢測(cè)

 

第二部分 ?SAS數(shù)據(jù)分析和數(shù)據(jù)挖掘

  • Base SAS基礎(chǔ)
  • SAS 系統(tǒng)簡(jiǎn)介
  • 啟動(dòng)SAS 軟件
  • SAS 窗口環(huán)境
  • SAS 文件和邏輯庫(kù)
  • 一個(gè)簡(jiǎn)單的SAS 程序
  • 讀取外部數(shù)據(jù)到SAS數(shù)據(jù)集
  • SAS 編程基本概念
  • 通過(guò)DATA 步讀取數(shù)據(jù)
  • 通過(guò)IMPORT 過(guò)程讀取外部文件數(shù)據(jù)
  • 訪問(wèn)關(guān)系型數(shù)據(jù)庫(kù)系統(tǒng)中的數(shù)據(jù)
  • SAS 程序錯(cuò)誤及處理
  • 對(duì)單個(gè)數(shù)據(jù)集的處理
  • 選取部分變量
  • 操作數(shù)據(jù)集的觀測(cè)
  • 創(chuàng)建新變量
  • 循環(huán)和數(shù)組
  • SAS常用函數(shù)
  • 將數(shù)據(jù)集寫(xiě)出到外部文件
  • 對(duì)多個(gè)數(shù)據(jù)集的處理
  • 數(shù)據(jù)集的縱向串接
  • 數(shù)據(jù)集的橫向合并
  • 數(shù)據(jù)集的更新
  • 數(shù)據(jù)匯總和展示
  • 通過(guò)PRINT過(guò)程制作報(bào)表
  • 通過(guò)TABULATE過(guò)程制作匯總報(bào)表
  • 通過(guò)GPLOT過(guò)程制作圖形
  • 通過(guò)GCHART過(guò)程制作圖形
  • ODS輸出傳送系統(tǒng)
  • 案例解析:PRINT過(guò)程操作實(shí)例
  • 案例解析:匯總報(bào)表實(shí)例
  • 案例解析:GPLOT過(guò)程制作圖形編程操作
  • 案例解析:GCHART過(guò)程繪制圖形編程操作
  • 描述性統(tǒng)計(jì)分析
  • 基本概念
  • 描述性統(tǒng)計(jì)量
  • MEANS過(guò)程的補(bǔ)充
  • 案例解析:利用MEANS過(guò)程求各種統(tǒng)計(jì)量
  • 案例解析:利用UNIVARIATE過(guò)程求各種統(tǒng)計(jì)量
  • 案例解析: 頻數(shù)表的生成實(shí)例
  • 參數(shù)估計(jì)與假設(shè)檢驗(yàn)
  • 參數(shù)估計(jì)
  • 假設(shè)檢驗(yàn)
  • 非參數(shù)假設(shè)檢驗(yàn)
  • 分別擬合假設(shè)檢驗(yàn)
  • 案例解析:TTEST過(guò)程的實(shí)例數(shù)據(jù)分析
  • 案例解析:總體均值檢驗(yàn)
  • 案例解析:實(shí)驗(yàn)數(shù)據(jù)的配對(duì)T檢驗(yàn)
  • 案例解析:數(shù)據(jù)比例的顯著性檢驗(yàn)
  • 案例解析:樣本數(shù)據(jù)的正態(tài)性檢驗(yàn)實(shí)例
  • 回歸分析
  • 變量關(guān)系探索
  • 線性回歸
  • 自變量間的共線性診斷
  • 案例解析:某大型服裝連鎖機(jī)構(gòu)門(mén)店收入相關(guān)數(shù)據(jù)分析
  • 案例解析:分析可支配收入和消費(fèi)性支出之間的關(guān)系
  • 案例解析:利用線性回歸分析學(xué)生肺活量及有關(guān)變量的關(guān)系
  • 方差分析
  • 方差分析的基本原理
  • 單因素試驗(yàn)的方差分析
  • 顯著因素下的水平間差異檢驗(yàn)
  • 雙因素試驗(yàn)的方差分析
  • 案例解析:分析四種止痛藥效果之間是否有明顯差異
  • 案例解析:分析三種飼料的營(yíng)養(yǎng)價(jià)值之間有無(wú)顯著性差別
  • 案例解析:分析不同實(shí)驗(yàn)室試制的紙張光滑度有無(wú)差異
  • 主成分分析與因子分析
  • 主成分分析概述
  • 使用SAS 實(shí)現(xiàn)主成分分析
  • 因子分析概述
  • 使用SAS 實(shí)現(xiàn)因子分析
  • 案例解析:我國(guó)某年經(jīng)濟(jì)發(fā)展情況的主成分分析
  • 案例解析:中國(guó)房地產(chǎn)經(jīng)濟(jì)區(qū)的研究分析
  • 聚類(lèi)分析和判別分析
  • 聚類(lèi)分析的概述
  • 劃分法與層次法
  • 判別分析概述
  • 判別分析在SAS中的實(shí)現(xiàn)
  • 案例解析:聚類(lèi)分析在客戶定位中的應(yīng)用研究
  • 案例解析:變量聚類(lèi)在多指標(biāo)系統(tǒng)評(píng)價(jià)中的應(yīng)用
  • 案例解析:基于判別分析法的上市公司財(cái)務(wù)分析研究
  • LOGISTIC回歸分析
  • 基本原理
  • 運(yùn)用LOGISTIC過(guò)程擬合模型
  • LOGISTIC過(guò)程的其他語(yǔ)句
  • 建立模型
  • 案例解析:LOGISTIC回歸用于上市公司ST預(yù)測(cè)

 

  • SAS數(shù)據(jù)挖掘流程
  • SAS 數(shù)據(jù)挖掘概述
  • 確定業(yè)務(wù)問(wèn)題和數(shù)據(jù)準(zhǔn)備
  • 數(shù)據(jù)抽樣、探索與加工
  • 數(shù)據(jù)建模
  • 案例解析:X公司貸款業(yè)務(wù)案例分析
  • 案例解析:關(guān)聯(lián)規(guī)則與購(gòu)物籃問(wèn)題分析
  • 案例解析對(duì)股票交易數(shù)據(jù)進(jìn)行聚類(lèi)分析
  • 案例解析:信用風(fēng)險(xiǎn)評(píng)分卡的開(kāi)發(fā)與應(yīng)用

 

第三部分 ?R語(yǔ)言實(shí)戰(zhàn)

1.1、數(shù)據(jù)結(jié)構(gòu)概述

1.2、向量

1.3、因子

1.4、矩陣

1.5、數(shù)據(jù)框

1.6、列表和函數(shù)

1.7、向量化計(jì)算和apply

2.1、線性回歸的思想

2.2、回歸結(jié)果的檢查

2.3、決定系數(shù) 預(yù)測(cè) 和多元線性回歸

2.4、一元線性回歸演示

2.5、多項(xiàng)式回歸演示

2.6、殘差分析演示

2.7、多元線性回歸演示

3.1、關(guān)聯(lián)規(guī)則介紹

3.2、關(guān)聯(lián)規(guī)則演示

4.1、決策樹(shù)介紹C4.5

4.2、幾種分類(lèi)算法介紹

4.3、評(píng)價(jià)模型準(zhǔn)確性