<track id="krzhs"><i id="krzhs"></i></track>
    
    
  1. <legend id="krzhs"><li id="krzhs"></li></legend>

  2. <strong id="krzhs"></strong>
    <cite id="krzhs"><li id="krzhs"></li></cite>
    首頁 > 選課中心 > 數據倉庫 > 【快班】深入BI之Kettle篇
    【快班】深入BI之Kettle篇
    此課程所屬 【大數據攻城獅專業】專業,報名專業套餐,可享受0元學習特惠!點擊了解詳情
    隨報隨學 共15課 ★☆☆
    開課時間 課程周期 難易度
    招生中

    立即報名
    工具 Hadoop 開源 ETL Kettle
    課程介紹
    有人統計過,在整個數據分析過程里,收集、整理數據的工作大致占全部工作量的90%,建模過程不足10%,可見ETL是數據處理流程中一個非常重要的環節。ETL工程師,在數據倉庫類職位中占有很大比例,而且薪水都不差。IT人一下子轉型數據分析師可能跳躍度比較大難度高,先轉型數據倉庫/ETL工程師再擇機往更高處走是合理選擇之一。在ETL軟件中,使用最多的是開源的Kettle,完全免費,功能和性能不弱于datastage這類商業ETL軟件,使用Kettle和其它開源數據平臺軟件,例如Mysql集群,Hadoop集群等組合在一起,是性價比極高的架構選擇。本課程系統講解Kettle及其秘密。

         ETL (Extract,Transformation,Load)工具是構建數據倉庫、進行數據整合工作所必須使用的工具。目前市面有多種商業 ETL 工具,如Informatica,Datastage等。目前市場上開源且實用的 ETL 工具比較少,Kettle 就是這不多的開源 ETL 工具之一。 本課程將主要講解開源 ETL 工具 Kettle 的基本使用和二次開發方法,并結合實際項目案例,講解 Kettle 如何在實際中應用,以及應用中可能會出現的問題。針對目前大數據的應用情況,本課程也將結合大數據,講述 Kettle 如何支持 Hadoop、HBase、MongoDB、MapReduce 等大數據技術。除了Kettle 的使用,在本課程的后幾個課時,將講述 Kettle 的二次開發: 包括 Kettle 代碼閱讀指導, Kettle API 的說明以及使用方法, Kettle 插件的開發方法。
    課程大綱
    第一課:ETL 的概念,Kettle 的概念、功能、操作
    第二課:Kettle 資源庫、日志、運行方式
    第三課:輸入步驟(表輸入、文本文件輸入、XML 文件輸入...)
    第四課:輸出步驟(表輸出、更新、刪除、文本文件輸出、XML文件輸出...)
    第五課:轉換步驟(過濾、字符串處理、拆分字段、計算器...)
    第六課:轉換步驟(字段選擇、排序、增加校驗列、去除重復記錄...)
    第七課:應用步驟、流程步驟(處理文件、執行程序、發送郵件、空操作、阻塞步驟、中止等...)
    第八課:查詢步驟、連接步驟(數據庫查詢、流查詢、合并記錄、記錄集連接、笛卡爾...)
    第九課:腳本步驟(Javascript,Java Class、正則表達式...)
    第十課:作業項(拷貝、移動、ftp、sftp…)
    第十一課:Kettle 的參數和變量、Kettle 集群
    第十二課:Kettle 代碼編譯、代碼結構、應用集成、各種配置文件
    第十三課:插件開發 - 步驟、作業項 
    第十四課:作業設計技巧、錯誤處理、調試轉換、循環和分支
    第十五課:大數據插件(Hadoop 文件輸入/輸出,HBase輸入/輸出,MapReduce輸入/輸出,MongoDB輸入/輸出)
    授課講師
        初建軍(網名:Jason),2004年畢業于天津大學計算軟件與理論專業,研究生。后進入北京人大金倉信息技術股份有限公司工作,從事國產數據庫的研發工作。現就職于北京傲飛商智軟件有限公司(Pentaho 公司的官方合作伙伴),專門從事 Pentaho/Kettle 的研究和開發工作。
        Jason 也是 Kettle 項目的代碼提交者,積極推動 Pentaho/Kettle 等開源 BI 技術在國內的應用和發展,創辦了 Pentaho 中國愛好者社區論壇((pentahochina.com)。
        Jason 作為 Pentaho 顧問為多個企業做過 Pentaho/Kettle 的咨詢、培訓、實施等服務, 服務過的企業或政府部門包括聯想集團(北京)、中國聯通系統集成公司、中國電信(某省)、國家地震局地球物理研究所、公安部第一研究所、四維圖新、上海定展航運、品眾互動網絡技術營銷有限公司。
    課程環境
    Windows 和 Linux
    授課對象
    1. ETL 工程師,Java 開發工程師,
    2. 經常要做數據處理的 DBA
    3. 有一定數據庫基礎 和 Java 基礎的學生。
    收獲預期
    1. 理解 Kettle 軟件的基本功能。
    2. 能使用 Kettle 完成基本的數據處理工作。
    3. 了解 Kettle 軟件的一些高級功能
    4. 對有Java 開發經驗的同學,對 Kettle 代碼結構有一定了解,能開發一些 Java 的基本插件。
    課程試聽
    課程學費
    學費:400元(固定學費:300元 + 逆向學費:100元)
    新穎的課程收費形式:“逆向收費”約等于免費學習,課程收取300元固定收費 + 100元逆向學費,學習圓滿則全額獎勵返還給學員!
    特別說明如下
    本門課程本來打算完全免費,某位大神曾經說過“成功就是正確的方向再加上適度的壓力”。考慮到講師本身要付出巨大的勞動,為了防止一些朋友在學習途中半途而廢,浪費了講師的付出,為此我們計劃模仿某些健身課程,使用“逆向收費”的方法。 在 報名時每位報名者收取400元,其中300元為固定 收費,另外100元是暫存學費,即如果學員能完成全部課程要求,包括完成全部的書面作業,則100元全款退回。如果學員未能堅持到完全所有的學習計劃任務,則會被扣款。期望這種方式可以轉化為大家強烈的學習愿望和驅動力!
    課程授課方式

    1、 學習方式:老師發布教學資料、教材,幻燈片和視頻,學員通過網絡下載學習。同時通過論壇互動中老師對學員進行指導及學員之間相互交流。

    2、 學習作業:每課均有布置課后作業,學員完成書面作業后則可進入下一課學習。

    3、 老師輔導:通過論壇站內信及郵件等多種方式與老師進行一對一互動。

    4、 完成課程:最后一課作業交納后,老師完成作業批改,即可完成課程并取回相應剩余的逆向學費。

    聯系我們
    咨詢Email :edu01@www.nz277.comedu02@www.nz277.com
    課程入門討論咨詢QQ群:706821899(群內有培訓公開課視頻供大家免費觀看)
    咨詢QQ: 點擊這里給我發消息 點擊這里給我發消息
    您是否對此課程還有疑問,那么請 點擊進入FAQ,您的問題將基本得到解答
    全國統一咨詢熱線: 4008-010-006
    最新技術熱點、 最新行業資訊,最新培訓課程信息,盡在煉數成金官方微信,低成本傳遞高端知識!技術成就夢想!歡迎關注!
    打開微信,使用掃一掃功能,即刻關注煉數成金官方微信賬戶,不容錯過的精彩,期待您的體驗!!!

    授課老師

    初建軍初建軍
    初建軍(網名:Jason),2004年畢業于天津大學計算軟件與理論專業,研究生。后進入北京人大金倉信息技術股份有限公司工作,從事國產數據庫的研發工作。現就職于北京傲飛商智軟件有限公司(Pentaho 公司的官方合作伙伴),專門從事 Pentaho/Kettle 的研究和開發工作。

    其他快班課程

    【快班】【免費公開課】Python 的安裝與部署
    【快班】計算機視覺算法詳解與實戰開發
    【快班】基于軟件學習數據挖掘算法與案例
    【快班】【免費公開課】《Hadoop入門手冊》——CDH集群安裝
    【快班】Datastage基礎及開發實踐
    【快班】OpenAI強化學習實戰
    【快班】JavaScript從入門到精通
    【快班】贏在大數據-人工智能的應用實踐
    【快班】【免費公開課】《數據科學入門手冊》——DSX架構與部署
    【快班】【免費公開課】數據科學無難事
    【快班】【免費公開課】《Hadoop入門手冊》之 虛擬機的安裝和使用
    【快班】【免費公開課】玩轉數據藝術-數據展示技巧應用實戰
    【快班】【免費公開課】玩轉數據科學——IBM DSX
    【快班】【免費公開課】《Hadoop入門手冊》——Apache Hadoop集群安裝
    【快班】【免費公開課】贏在大數據-數據化運營落地實戰
    【快班】大數據管理
    【快班】Streams流計算引航公開課
    【快班】抽樣調查
    【快班】LATEX公式排版系統引航
    【快班】Watson Analytics數據分析應用實戰公開課
    【快班】數據陷阱解讀
    【快班】R七種武器之文本挖掘包tm
    【快班】R七種武器之可視化JS庫HTMLWidgets包
    【快班】R七種武器之數據加工廠plyr
    【快班】R七種武器之交互化展示包shiny
    【快班】R七種武器之網絡爬蟲RCurl
    【快班】R七種武器之數據可視化包ggplot2
    【快班】R七種武器之金融數據分析quantmod
    【快班】Java經驗談
    【快班】Go語言實戰編程
    【快班】DB2 V11新特性全解析
    【快班】DB2數據庫引航公開課
    【快班】STATA統計分析入門
    【快班】初識正則表達式
    【快班】perl語言入門
    【快班】Scala語言入門
    【快班】Puppet 運維自動化
    【快班】Qt編程快速入門
    【快班】python web框架企業實戰詳解
    【快班】數據治理及數據倉庫模型設計
    【快班】Spark大數據平臺應用實戰
    【快班】DevSecOps安全交付應用實戰
    【快班】JavaScript突擊-從精通到項目實戰
    【快班】R語言魔鬼訓練營
    【快班】基于案例學習bash腳本編程
    【快班】量化投資基礎計算與模型
    【快班】老板說服術之玩轉數據展示
    【快班】數據庫系統實現技術內幕
    【快班】Goldengate從入門到精通
    【快班】Oracle 12c特性解讀-容器數據庫和災備
    【快班】Oracle 12C RAC集群原理與管理實戰
    【快班】Mycat從入門到精通
    【快班】基于案例學SQL優化
    【快班】大型電商分布式系統實踐
    【快班】深入理解Storm與大數據實戰
    【快班】Java魔鬼訓練營
    【快班】面試突擊-數據結構與算法速成
    【快班】Excel數據分析師突擊—從入門到精通到項目實戰
    【快班】自己動手實踐神經網絡
    【快班】自然語言處理軟件實驗
    【快班】Redis技術實戰
    【快班】推薦系統
    【快班】MongoDB實戰
    【快班】應用系統架構優化方法與案例實戰
    【快班】HBase從入門到精通
    【快班】Hive數據倉庫實踐
    【快班】Hadoop數據分析平臺
    【快班】數據分析與SAS
    【快班】比特幣
    【快班】機器讀心術之文本挖掘與自然語言處理
    【快班】機器讀心術之神經網絡與深度學習
    【快班】快速上手Jmeter性能測試工具
    【快班】軟件性能測試
    【快班】軟件自動化測試Selenium2
    【快班】大數據必知的java基礎
    【快班】快速數據挖掘平臺RapidMiner
    【快班】R語言編程技巧
    【快班】基于案例學Java服務器端程序設計
    【快班】Scala從基礎到開發實戰
    【快班】供應鏈物流—電商發展的“核”動力
    【快班】詳解SQL與PL/SQL
    【快班】Oracle職業直通車
    【快班】深度玩轉Excel
    【快班】Hadoop應用開發實戰案例
    【快班】大數據的Linux基礎
    【快班】機器學習
    【快班】量化投資
    【快班】SPSS數據分析入門與提高
    【快班】Python數據分析
    【快班】NoSQL與NewSQL數據庫引航
    【快班】大數據算法導論
    【快班】大數據的矩陣計算基礎
    【快班】R語言數據分析、展現與實例
    【快班】大數據的統計學基礎

    熱招課程

    ◆ Python數據可視化實戰(第四期)
    ◆ 大數據的統計學基礎(第26期)
    ◆ Oracle DB Performance Tuning(DSI系列Ⅳ)(第四期)
    ◆ 精準安防場景理解及語義分割(第四期)
    ◆ Java Web開發精講(第五期)
    ◆ Python突擊—從入門到精通到項目實戰(第17期)
    ◆ 計算機視覺:從入門到精通,極限剖析圖像識別學習算法(第四期)
    ◆ Python全棧學習——Python基礎及Web開發(第四期)
    ◆ OpenCV計算機視覺產品實戰(第十期)
    ◆ HBase從入門到精通(第11期)
    ◆ 大數據的矩陣計算基礎(第17期)
    ◆ 股票投資基礎之基本面分析(第六期)
    ◆ 黃金Quant工——量化金融分析師進階(第一期)
    ◆ 面試突擊-數據結構與算法速成(第六期)
    ◆ Oracle SQL Tuning(DSI系列Ⅲ)(第五期)
    ◆ 軟件架構必備基礎(第八期)
    ◆ 知識圖譜實戰(第八期)
    ◆ 突擊pyspark:數據挖掘的力量倍增器(第九期)
    ◆ 測試架構師核心技術(第五期)
    ◆ 人臉識別精準安防講習班(第五期)
    ◆ 系統運維之基礎服務進階實戰(第五期)
    ◆ 端到端(End TO End)--由傳統方法到深度學習(第二期)
    ◆ ROS機器人操作系統實戰(第八期)
    ◆ MySQL性能優化最佳實踐(第十期)
    ◆ 深入淺出Git(第九期)
    ◆ Python全棧學習——Python自動化測試(第四期)
    ◆ 股票投資高手武器系列之纏論系統(第六期)
    ◆ OpenAI強化學習實戰(第六期)
    ◆ 基于R的Kaggle實戰案例詳解(第八期)
    ◆ PostgreSQL初識與提高(第三期)
    ◆ Python金融業數據化運營實戰(第五期)
    ◆ 大話流式處理系統 Flink 核心原理(第二期)
    ◆ 深度學習框架Tensorflow學習與應用(第十期)
    ◆ 【百萬年薪系列】視覺的盛宴:深度玩轉人臉識別(第七期)
    ◆ zabbix企業級實踐(第七期)
    ◆ python網絡爬蟲應用實戰(第八期)
    ◆ Elastic Stack實戰(第五期)
    ◆ 機器學習(第28期)
    ◆ Python3入門到精通實戰特訓(第七期)
    ◆ 黃金Quant工——量化金融分析師入門(第三期)
    ◆ 股票投資基礎之技術分析(第八期)
    ◆ Tensorflow工程師職場實戰技(第六期)
    ◆ Oracle DBA從小白到入職實戰應用(第11期)
    ◆ 金融市場基礎(第13期)
    ◆ 左飛的機器學習十八般算法武藝詳解(第九期)
    ◆ Spark大數據平臺應用實戰(第九期)
    ◆ 深度學習框架Keras學習與應用(第十期)
    ◆ 金融的人工智能革命(第11期)
    ◆ locust性能測試實戰(第四期)
    ◆ Python金融投資分析實踐(第11期)

    GMT+8, 2019-8-22 02:33 , Processed in 0.075550 second(s), 38 queries .

    婷婷五月