雷峰網(wǎng)訊 用自然語言直接向BI軟件提問,查詢數(shù)據(jù),甚至指揮它進行數(shù)據(jù)分析,是BI行業(yè)的愿景,但過去十余年來未見成功者。直到大模型的出現(xiàn)降低了自然語言查詢數(shù)據(jù)的技術(shù)門檻,這一目標(biāo)終于具有可行性。以智能化的數(shù)據(jù)分析服務(wù)Chat BI為切口,BI行業(yè)找到了AI技術(shù)落地的具體場景。
作為BI+AI理念下的融合產(chǎn)品,Chat BI支持用戶在業(yè)務(wù)應(yīng)用中的任何時刻喚起一個聊天助手,用自然語言詢問各種經(jīng)營數(shù)據(jù),并即時得到回答。運營方在查看靜態(tài)報表的同時,也可以就數(shù)據(jù)變化向AI助手提問,拆解現(xiàn)象背后的原因。從BI到Chat BI,企業(yè)在數(shù)據(jù)運營方面的緊迫性需求、探索性想法將被更好地回應(yīng)。
在AI科技評論與衡石科技創(chuàng)始人兼CEO劉誠忠的訪談中,他向我們介紹了Chat BI的應(yīng)用場景與技術(shù)路徑。2022年大模型浪潮興起以來,BI行業(yè)對于Chat BI落地的技術(shù)路徑存在NL2SQL和NL2DSL兩種思路。前者在數(shù)據(jù)庫表的基礎(chǔ)上直接對接大模型進行問答,后者將用戶的問題調(diào)用BI結(jié)構(gòu)化的查詢接口,由BI下發(fā)相應(yīng)查詢。

受訪者供圖
作為新一代BI公司,衡石在產(chǎn)品構(gòu)建階段對已有的BI產(chǎn)品進行了調(diào)研,從微軟Power BI和Looker的經(jīng)驗中發(fā)現(xiàn)語義層是BI產(chǎn)品數(shù)據(jù)分析能力的基礎(chǔ),決定將工程團隊的精力集中在加強語義層能力上。而語義層通過定義業(yè)務(wù)友好的術(shù)語和概念,為DSL的構(gòu)建提供簡化的數(shù)據(jù)視圖,DSL可以基于該視圖來設(shè)計更貼近業(yè)務(wù)的語法和語義。
AI時代到來后,BI側(cè)的語義層能力和AI側(cè)的大模型完成了雙向奔赴。大模型不需要把自然語言翻譯成SQL層次的底層語言,在問數(shù)場景中,只需要與中間的語義層進行交互。衡石基于自身語義層的優(yōu)勢,降低對大模型提出的要求,走通了NL2DSL的技術(shù)路徑。
隨著模型分析能力的提升,未來Chat BI還將幫助用戶生成分析報告,針對數(shù)據(jù)的走勢、關(guān)聯(lián)關(guān)系以及數(shù)字背后隱藏的洞察,提供更清晰的解讀。劉誠忠判斷,大模型對數(shù)據(jù)趨勢進行預(yù)測和解讀的能力,可能在今年晚一些時候或明年被大幅增強。
以下是AI科技評論與劉誠忠的對話全文,為方便閱讀,進行了不改變原意的文字調(diào)整。
?
為什么選擇做BI
AI科技評論:為什么選擇做BI產(chǎn)品?這個賽道有哪些選手?
劉誠忠:BI更有成為標(biāo)準(zhǔn)化產(chǎn)品的潛力。BI 本質(zhì)上是一個用于統(tǒng)計分析的大數(shù)據(jù)產(chǎn)品,而且對分析數(shù)據(jù)的種類并不限制。企業(yè)的數(shù)據(jù)分為幾個板塊,財務(wù)、ERP、marketing、sales和HR,每個業(yè)務(wù)都可以用。在BI賽道,主流廠商包括微軟、Tableau、帆軟、永洪科技、思邁特軟件、觀遠(yuǎn)數(shù)據(jù)、衡石科技等等公司。
?
AI科技評論:衡石的BI有什么不同?
劉誠忠:我們產(chǎn)品的核心特點是開放架構(gòu),比較像一個BI引擎,可以服務(wù)直客,但更多地作為嵌入式產(chǎn)品面向應(yīng)用軟件廠商。這種以嵌入集成為主的產(chǎn)品形態(tài)和合作方向,使衡石在BI賽道具有一定的差異化定位,因此在國內(nèi)幾乎沒有競爭對手。客戶傾向于將衡石定義成BI Engine或 BI PaaS,本質(zhì)上都是在形容衡石的定位。
?
AI科技評論:除了衡石,國內(nèi)SaaS廠商在嵌入式BI產(chǎn)品方面還有什么選擇?
劉誠忠:除了衡石,國內(nèi)SaaS廠商的選擇通常是自研。軟件廠商的工程師們對于BI功能往往忍不住會自研,但數(shù)據(jù)分析和 BI 的自研成本其實非常高,因此許多客戶都在都是自研上吃了大虧后找到我們。
自研的必然結(jié)果,就是雖然可以做出來,但它會是一個非常輕量的東西。通常自研 BI 需要的團隊規(guī)模為5~10 人,周期1~2年。BI的基礎(chǔ)工程較為容易,可以在這個條件下完成,但后續(xù)建模分析、數(shù)倉對接權(quán)限控制等精細(xì)、復(fù)雜工程所需的進一步投入會給研發(fā)投入造成巨大壓力。很多公司會發(fā)現(xiàn)做到這兒的時候,開發(fā)投入已經(jīng)跟自己主業(yè)需要的水平差不太多了,那就顯得不合理。一個做 ERP 的公司,投一堆人做BI,但事實上 BI 這樣的數(shù)據(jù)類基礎(chǔ)工具軟件的投入就是未必低于 ERP。
?
AI科技評論:有企業(yè)自研 BI 成功的案例嗎?
劉誠忠:全球范圍看也是幾乎沒有的,就算軟件巨頭如谷歌、Salesforce需要這部分能力也不會自研,會直接發(fā)起并購。國內(nèi)看到阿里自研BI產(chǎn)品比較成功。他們的產(chǎn)品可以在阿里云上服務(wù)自己的電商群體,這部分群體同時也在滋養(yǎng)產(chǎn)品,所以阿里對產(chǎn)品的打磨可以得到市場反饋。產(chǎn)品是靠市場反饋推著走的,如果一家企業(yè)BI產(chǎn)品的反饋來自于自身業(yè)務(wù)部門,不能代表市場的反饋,也就無法形成市場競爭力。
?
Chat BI:BI+AI融合之旅
AI科技評論:大模型的發(fā)展會擠壓BI廠商的生存空間嗎?
劉誠忠:基本上從2022年底開始,所有的BI廠商都在第一時間關(guān)注大模型。因為如果大模型一出現(xiàn)就把toSQL的問題解決得很好,那BI廠商就很危險,大家擔(dān)心要被折疊了。差不多24年大家才發(fā)現(xiàn),基于BI去做AI在數(shù)據(jù)分析上的落地是更務(wù)實的,BI這一層應(yīng)該沒有辦法被替代,BI+AI這種合作慢慢地才多起來。25年開始,合作的線索和機會開始成數(shù)倍的增加。
對BI廠商來說,23年是觀察的一年,24年是共識形成的一年,25年應(yīng)該就是快速成長兌現(xiàn)共識的一年。
?
受訪者供圖
AI科技評論:BI產(chǎn)品怎么和AI技術(shù)結(jié)合?有哪些應(yīng)用場景?
劉誠忠:做智能化的問數(shù)助手,給企業(yè)提供智能化的數(shù)據(jù)分析服務(wù)。衡石從為SaaS軟件市場提供BI,升級為提供 Chat BI。后者支持用戶在業(yè)務(wù)應(yīng)用中的任何時候喚起一個聊天助手,用自然語言詢問各種經(jīng)營數(shù)據(jù),并即時得到回答。在數(shù)據(jù)運營方面,這種隨時可以問到某一個數(shù)據(jù)的服務(wù)是之前不存在的。用戶需要詢問分析師,分析師制作報表,再進行調(diào)整,這是一個很低效的過程?,F(xiàn)在可以用Chat BI解決一些緊迫的隨需而變的探索問題,這種ad-hoc的需求是很旺盛的。
另外用 BI 工具做出靜態(tài)報表給運營方看的時候,Chat BI會有一個AI助手。運營方可以在看報表的同時,隨時提一些探索性的想法。比如他看到報表的某個數(shù)據(jù)上升了,就會問是哪個維度上增加了什么東西導(dǎo)致的。這個現(xiàn)象分解出來,原因具體在哪里,這些探索可以馬上進行,實時的反饋。
?
AI科技評論:不同的大模型對Chat BI有區(qū)別嗎?
劉誠忠:區(qū)別很大,問數(shù)的核心就是大模型能不能準(zhǔn)確理解問題,有的大模型更準(zhǔn),有的就不準(zhǔn)。GPT-4o效果很好,DeepSeek和千問也不錯。但對接大模型的過程相對來說是標(biāo)準(zhǔn)化的,因為大模型對外暴露的接口就是prompt。不管這個模型是不是開源的,Chat BI把query給它,它以語義層的語法返回,由BI平臺再翻譯成SQL,完成對數(shù)據(jù)的查詢,把聚合的結(jié)果反饋給客戶。
?
AI科技評論:未來Chat BI的產(chǎn)品形態(tài)會是Agent嗎?
劉誠忠:衡石現(xiàn)在的Chat BI還是面向真人,比如通過報表旁邊的聊天窗口,或者向飛書里的bot提問。但未來有很多情況下會是一個Agent或者AI來和衡石對話,所以我們對外要提供for Agent的一層,使它可以被別的Agent所識別、辨認(rèn)和調(diào)用。
我們以后對外就是一個企業(yè)級的 BI Agent。衡石已經(jīng)和Dify集成,用戶可以在Dify里完成一個復(fù)雜的任務(wù),它分解后其中一步是查詢數(shù)據(jù),這一步是衡石在支撐服務(wù)。Agent查詢,Chat BI進行響應(yīng),然后Agent再回到工作流里。我們作為支持性的企業(yè)級Agent進入一個復(fù)雜的任務(wù)編排里,承擔(dān)其中智能問數(shù)的環(huán)節(jié)。
?
NL2DSL:語義層和大模型的雙向奔赴

受訪者供圖
AI科技評論:為什么采用NL2DSL的技術(shù)路線?
劉誠忠:自然語言對數(shù)據(jù)靈活提問的功能是BI行業(yè)十多年來的想法和嘗試,也是 BI 行業(yè)的技術(shù)趨勢。Tableau還專門收購過一家做NLP的公司,效果也不是很成功。原因在于,大語言模型出現(xiàn)之前這項技術(shù)非常不成熟,它出現(xiàn)之后通過自然語言查詢數(shù)據(jù)才具有可行性。
創(chuàng)業(yè)做產(chǎn)品構(gòu)建的時候,我們就決定將工程團隊的精力集中在加強語義層能力上,但當(dāng)時的考慮和AI無關(guān)。語義層是 BI 做數(shù)據(jù)分析的基礎(chǔ)能力,power BI在這方面做得很好,所以分析能力就強過別的 BI 工具。衡石是2016年創(chuàng)立的,算新一代BI公司,當(dāng)時把這些產(chǎn)品都研究過,我們發(fā)現(xiàn)了語義層在整個產(chǎn)品演進過程中至關(guān)重要的作用。2019年,衡石在語義層上就做得不錯了。
(注:衡石采用NL2DSL的方式,將自然語言的詢問翻譯為指標(biāo)描述語言,由BI層進一步翻譯為SQL進行下推查詢。)
?
AI科技評論:語義層上的技術(shù)優(yōu)勢在AI時代有什么意義?
劉誠忠:語義層在BI上的優(yōu)勢,在 AI 上也是優(yōu)勢。大模型出來之后,可以說語義層能力更有用武之地,不需要大模型把自然語言翻譯成SQL那么底層的語言,只需要翻譯成中間語義層的語言即可,這對大模型提出的要求更低了。其實也只有降低對大模型的要求,Chat BI才更有可行性。因為從技術(shù)路線的角度,大模型不擅長精準(zhǔn)的數(shù)據(jù)分析場景,這也不是大部分模型廠商要發(fā)力的領(lǐng)域。長期來看,BI行業(yè)的落地應(yīng)用門檻下降了,數(shù)據(jù)分析和數(shù)據(jù)智能應(yīng)用更加普及,AI是所有BI廠商的紅利。
?
AI科技評論:AI還給BI行業(yè)帶來了什么影響?
劉誠忠:除了直接的問數(shù),對分析報告生成也會有幫助,但這種幫助很大程度上依賴于垂直領(lǐng)域知識,這是 AI 目前跟數(shù)據(jù)結(jié)合還不太成熟的方面。AI數(shù)據(jù)分析現(xiàn)在是第一階段,用戶對很多指標(biāo)的提問可以馬上被準(zhǔn)確識別。第二階段是對于數(shù)據(jù)的走勢、關(guān)聯(lián)關(guān)系以及數(shù)據(jù)背后隱藏的洞察,可以給人更清楚的解讀。我們判斷,大模型對數(shù)據(jù)趨勢進行預(yù)測和解讀的能力,可能在今年晚一些時候或明年會被比較大幅地增強。但這個我們判斷取決于垂直領(lǐng)域模型的進展,才能真正落地。
?
AI科技評論:這是否對大模型的分析能力提出了更高的要求?
劉誠忠:這需要它有非常強的分析能力。大模型技術(shù)的基礎(chǔ)趨勢會讓它的分析能力越來越好,但目前的推理模型還不太實用,所以我們主流使用的大模型還是DeepSeek-V3。我們也在觀察DeepSeek-R1,但是在問數(shù)、解讀報告生成的場景中它并沒有特別的優(yōu)勢。同時,關(guān)鍵還在于垂直領(lǐng)域的行業(yè)性數(shù)據(jù)作為關(guān)鍵語料對垂直模型的幫助,不只是大模型單方面的瓶頸。
?
AI科技評論:你評價模型性能更關(guān)注它在具體行業(yè)場景中的實用性嗎?
劉誠忠:大家真正關(guān)注的是零售、制造、醫(yī)療這些具體行業(yè),一項技術(shù)如果很先進,最重要的是能拿來使用。比如BI,我們關(guān)注的是能不能落地到數(shù)據(jù)分析、分析報表可視化的具體場景里,因此會從一個很實用的角度來考察 AI 的能力。每個行業(yè)自己的需求都很現(xiàn)實,行不行拿過來試一下。
?
AI科技評論:To B服務(wù)中沒有用戶敢相信大模型隨機輸出的內(nèi)容,但AI的本質(zhì)就是尋求概率,所以大模型使用效果會不會不穩(wěn)定?
劉誠忠:對,所以大模型在To B落地很困難。To B就是要精準(zhǔn),現(xiàn)在模型的能力在嚴(yán)肅數(shù)據(jù)的場景中太稚嫩,我們沒有看到太多的檢驗和落地的實在效果。我們的價值也是在大模型能力不夠高的現(xiàn)狀下努力提升他的精準(zhǔn)性。企業(yè)用大模型直接問數(shù)的準(zhǔn)確率可能只有30%,我們BI能幫它提高到80%、90%以上,基本達(dá)到可落地的程度。
(雷峰網(wǎng)(公眾號:雷峰網(wǎng))文章)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。