什么是開源BI系統?
Framework 開源框架,這是在商業BI系統中所沒有的。我們可以使用它們來構建自己的BI工具,或者增強和擴展我們的BI解決方案。 Stand-alone Tools 獨立的BI工具,這是開源項目中數量最多的一類。很多工具只側重BI系統中的某個環節和方面,如ETL、Report、OLAP和Database等等。 BI Suit 在統一的架構下提供了多種BI系統的特性的工具集合。就目前的情況看,不管是商業軟件還是開源軟件,還沒有任何一個套件提供了完整的端到端的BI解決方案。這些開源的BI Suit是通過連接多個其他的組件和工具的方式形成套件的,由于BI系統涉及到的工具是非常多的,所以整合一套完整的BI解決方案是很困難的。 BI解決方案中的工具 一個完整的BI解決方案中有多種工具來完成BI系統中各個階段的工作。 ETL工具 數據抽取、轉換和加載工具。優秀的ETL工具應該具有以下特性: 1、 Workflow Management, Job Execution and Scheduling Manager。能方便地定義流程并自動化執行ETL任務。 2、 Centralized Metadata Repository and Management。集中存儲和管理符合業界標準的元數據。 3、 Data Profile and Validation??梢詸z驗數據的質量。 4、 High Performance。在大負荷的任務執行中仍然有良好的性能。 5、 Scalable, Platform Independent。具有良好的彈性,支持多種操作系統和數據庫系統,能操作多種異構的數據源。 6、 Open Architecture and API。具有開放的架構和易于使用的二次開發接口。 目前較為知名的開源ETL工具有: 1、 KETL,由具有IBM和KPMG背景的Kinetic Networks公司開發,現在已經有三年多的產品應用歷史,成功應用于一些產品中,在點擊流(ClickStream)分析應用中表現出色。KETL采用Plug-in的架構,使用Java開發。 2、 KETTLE,為一個元數據驅動的ETL工具。已經加入Pentaho。 3、 Clover ETL,為一個基于Java的ETL Framework,可以用來開發自己的ETL應用。 4、 Enhydra Octopus,為一個基于Java的ETL工具,使用JDBC來連接各種數據源,易于使用和部署。