|
查看: 2233|回复: 27
|
Business Intelligence
[复制链接]
|
|
|
发表于 30-4-2008 04:24 PM
|
显示全部楼层
|
|
|
|
|
|
|
|
|
|

楼主 |
发表于 30-4-2008 05:22 PM
|
显示全部楼层
商業智能,又稱商業智慧或商務智能,指用現代數據倉庫技術、線上分析處理技術、數據挖掘和數據展現技術進行數據分析以實現商業價值。
商業智能的概念經由Howard Dresner(1989年)的通俗化而被人們廣泛瞭解。當時將商業智能定義為一類由數據倉庫(或數據集市)、查詢報表、數據分析、數據挖掘、數據備份和恢復等部分組成的、以幫助企業決策為目的技術及其應用。
目前,商業智能通常被理解為將企業中現有的數據轉化為知識,幫助企業做出明智的業務經營決策的工具。這裡所談的數據包括來自企業業務系統的訂單、庫存、交易賬目、客戶和供應商資料及來自企業所處行業和競爭對手的數據,以及來自企業所處的其他外部環境中的各種數據。而商業智能能夠輔助的業務經營決策既可以是作業層的,也可以是管理層和策略層的決策。
為了將數據轉化為知識,需要利用數據倉庫、線上分析處理(OLAP)工具和數據挖掘等技術。因此,從技術層面上講,商業智能不是什麼新技術,它只是ETL、數據倉庫、OLAP、數據挖掘、數據展現等技術的綜合運用。
把商業智能看成是一種解決方案應該比較恰當。商業智能的關鍵是從許多來自不同的企業運作系統的數據中提取出有用的數據並進行清理,以保證數據的正確性,然後經過抽取(Extraction)、轉換(Transformation)和裝載(Load),即ETL過程,合併到一個企業級的數據倉庫裡,從而得到企業數據的一個全局視圖,在此基礎上利用合適的查詢和分析工具、數據挖掘工具、OLAP工具等對其進行分析和處理(這時信息變為輔助決策的知識),最後將知識呈現給管理者,為管理者的決策過程提供支持。
我想知道有没有人目前是开发这类软件的 |
|
|
|
|
|
|
|
|
|
|
发表于 30-4-2008 08:07 PM
|
显示全部楼层
|
|
|
|
|
|
|
|
|
|

楼主 |
发表于 30-4-2008 10:30 PM
|
显示全部楼层
|
|
|
|
|
|
|
|
|
|
发表于 30-4-2008 10:48 PM
|
显示全部楼层
有implement过Open Source BI的经验。
基本上,BI太广义了,我觉得可以分为几个部分 - ETL, DataWarehouse, OLAP, Reporting, 还有一个比较深入和复杂的Data Mining,而每一个都是大学问。 |
|
|
|
|
|
|
|
|
|
|
发表于 30-4-2008 11:11 PM
|
显示全部楼层
|
|
|
|
|
|
|
|
|
|

楼主 |
发表于 30-4-2008 11:40 PM
|
显示全部楼层
|
|
|
|
|
|
|
|
|
|
发表于 1-5-2008 12:17 AM
|
显示全部楼层
回复 8# siaolee2000 的帖子
http://www.pentaho.org
study系统2个月,真正implement四个月,一个人
基本上是为一个子公司的业务做的,目的是要建议给管理层implement在其他的业务,同时也在试探一下BI系统对业务上的帮助。
我本身觉得若是要implement这样的系统,ETL和Data Warehouse就是成败的关键,Data Warehouse本身就是依管理层的需要而计划的,如果Data Warehouse设计出了问题,这样接下来的东西就失败了。
我曾经询问过Pentaho的implementation pricing,Professional License Fee 10多千新币,Engineer的薪水还要算小时,而且要负责外国Engineer的机票和住宿,数目不小阿; 若是Commercial BI的话,价值就更不菲了。 |
|
|
|
|
|
|
|
|
|
|
发表于 1-5-2008 10:58 AM
|
显示全部楼层
|
|
|
|
|
|
|
|
|
|
发表于 1-5-2008 09:05 PM
|
显示全部楼层
|
|
|
|
|
|
|
|
|
|

楼主 |
发表于 1-5-2008 10:06 PM
|
显示全部楼层
回复 11# 苦瓜汤 的帖子
你是在新加坡吗?其实你们在Implement之前有比较过Microsoft SQL Server和Open Source吗?我想知道马来西亚对BI的需求,不懂有没有商机在这里。 |
|
|
|
|
|
|
|
|
|
|
发表于 2-5-2008 09:52 AM
|
显示全部楼层
回复 12# siaolee2000 的帖子
没有,哈哈。
我本身觉得产品质量固然重要,不过更重要的是研究用户的需求,还有事前的计划。这就是为什么我觉得ETL和Data Warehouse是最关键的一个环节。
没错,Open Source无论在Developer Friendly或Deployment option上都比Commercial来得差;不过,有一个很好的地方是它给你很多自由,你可以阅读或修改系统的原码,也可以把一些library以component的方式用在其他的地方,就好像Pentaho Data Integration (ETL),除了用在BI server,我还把它的library用来做一些integration的用途,这些都是Commercial Software不能够给你的自由。
市场肯定是需要这样的产品,问题是这样的一个方案执行起来太耗时,而且失败的机率很高。所以市场上的BI方案的价钱才会那么高。 |
|
|
|
|
|
|
|
|
|
|

楼主 |
发表于 2-5-2008 10:19 AM
|
显示全部楼层
回复 13# 苦瓜汤 的帖子
最主要还是我不太认识人,想要认识一些大老板,然后去了解他们需要些什么 |
|
|
|
|
|
|
|
|
|
|
发表于 2-5-2008 09:56 PM
|
显示全部楼层
|
曾在一家 semicon 的公司用 data mining 做 prediction system 不知算是 一种 BI 吗。。 |
|
|
|
|
|
|
|
|
|
|

楼主 |
发表于 2-5-2008 10:04 PM
|
显示全部楼层
回复 15# tensaix2j 的帖子
Data Mining也是BI的一部分,不过我没有真正做过。
你是用MS SQL吗?会很复杂和难开发这样的系统吗?如果有机会一定要请教各位有经验的前辈。 |
|
|
|
|
|
|
|
|
|
|
发表于 2-5-2008 10:30 PM
|
显示全部楼层
data mining在business上算是BI的一部分。你的系统是做什么prediction的?
data mining还不是我的能力所能及的,所以一直没有去study 。 |
|
|
|
|
|
|
|
|
|
|
发表于 2-5-2008 11:39 PM
|
显示全部楼层
我之前是做semicon assembly 还有 test 的 yield prediction。。
就是 用 一个 wafer 或 lot 的 各种 parameters, 来预测 有多少百分比这个wafer 或lot 会有 fail units。。。
其中的 工具有用到 mssql 。 不过我是 负责 research on techniques 的部分。。 |
|
|
|
|
|
|
|
|
|
|
发表于 3-5-2008 05:05 PM
|
显示全部楼层
回复 18# tensaix2j 的帖子
你使用哪一种model完成的?我听说这一类的model得到的结论都需要经过hypothesis testing吧? |
|
|
|
|
|
|
|
|
|
|
发表于 3-5-2008 09:58 PM
|
显示全部楼层
原帖由 苦瓜汤 于 3-5-2008 05:05 PM 发表 
你使用哪一种model完成的?我听说这一类的model得到的结论都需要经过hypothesis testing吧?
我那时是用 Gradient boosting tree,有尝试 support vector machine,还有 神经网, 但都差不多。。
基本上会把 data 分成两批,
一批做 model training
一批做 model testing |
|
|
|
|
|
|
|
|
| |
本周最热论坛帖子
|