亚洲AV无码专区在线电影APP,国产嘿嘿嘿视频在线观看,国产在线线精品宅男网址,四虎永久在线精品免费青青

發(fā)新帖

做AI硬件產(chǎn)品,技術(shù)說教那套早過時了|鯨犀百人談No.23 行業(yè)新聞

新聞機(jī)器人 4月前 8805

作者丨陳嘉欣 覃倩雯

編輯?|?林覺民

AI浪潮席卷全球,無論是B端智能制造,還是C端各類軟件應(yīng)用,AI逐漸滲透生產(chǎn)生活的方方面面,也推動人機(jī)交互模式朝更方便快捷的方向發(fā)展。

智能手機(jī)盛況在前,一批看到機(jī)會的軟硬件廠商紛紛下場押注AI硬件,希望自己能成為下一個“蘋果”。

2016年聲智剛創(chuàng)立時,恰好趕上智能音箱的浪潮,當(dāng)時聲智主要給小米、華為等友商提供麥克風(fēng)陣列模組、語音交互開發(fā)框架等技術(shù)支持。而在今年夏天,聲智依托自身聲學(xué)技術(shù)背景,在抖音上推出了首款A(yù)I耳機(jī),并取得了不錯的成績。

Tob企業(yè)向Toc轉(zhuǎn)型并不容易,生成式AI帶來交互變革的同時也給廠商提出了新的難題。比如大模型應(yīng)該如何給AI硬件賦能,什么樣的AI硬件更能被用戶接受,國內(nèi)外市場何處能挖掘到最大增量。諸如此類的問題都在困擾著硬件廠商。

本期,我們邀請到了聲智科技副總裁、AI產(chǎn)品線負(fù)責(zé)人黃赟賀做客鯨犀出海百人談,分享她對AI硬件市場的洞察以及聲智的轉(zhuǎn)型經(jīng)驗(yàn)。以下是該場直播討論的內(nèi)容,雷峰網(wǎng)(公眾號:雷峰網(wǎng))鯨犀進(jìn)行了不改變原意的編輯與整理:

鯨犀:請跟鯨犀出海百人談的朋友們做一下自我介紹

黃赟賀:大家好,我是黃赟賀,現(xiàn)任聲智科技副總裁,負(fù)責(zé)AI產(chǎn)品線。聲智聚焦關(guān)注AI大模型落地應(yīng)用,在AI硬件產(chǎn)品領(lǐng)域做了很多年。今年我們推出了一款FairyClip珍珠耳夾式AI耳機(jī),在抖音首月銷量達(dá)到10萬臺。今天希望借這個機(jī)會,能和對AI賽道感興趣的小伙伴們分享我們做產(chǎn)品以及創(chuàng)業(yè)的心路歷程。

鯨犀:說到AI耳機(jī),那么AI耳機(jī)和傳統(tǒng)耳機(jī)有什么不一樣的地方?

黃赟賀:AI耳機(jī)和傳統(tǒng)耳機(jī)的區(qū)別,大家聽名字直觀感受就是多了AI,融合了人工智能技術(shù)。聲智在做AI大模型應(yīng)用時候,當(dāng)時一個思考就是如何讓我們的用戶愿意接受AI。2016年聲智創(chuàng)立時,正好趕上了智能音箱的浪潮。智能音箱的普及讓大眾對語音喚醒、語音指令等交互模式有了初步了解,所以我和家里上一輩人解釋我們的產(chǎn)品時,常會說,聲智的耳機(jī)相當(dāng)于把智能音箱放在耳朵上了,他們也能很快理解AI耳機(jī)要怎么去用。現(xiàn)在大部分廠商提到AI耳機(jī),大多數(shù)的營銷方向還是在AI 翻譯、AI轉(zhuǎn)寫等工具屬性的AI能力上,以及其他包括AI眼鏡、AI戒指之類的,我們都管它叫手機(jī)配件,它無法脫離手機(jī)去獨(dú)立存在。我們期待這些AI硬件的下一步進(jìn)化,是真正脫離手機(jī),能夠獨(dú)立呈現(xiàn)的一個作品。類似騎行的場景,騎友們不必掏出手機(jī),直接與AI耳機(jī)交互就能導(dǎo)航路線。

鯨犀:智能音箱可以做麥克風(fēng)陣列,保證聲源定位和降噪等功能,耳機(jī)只能做一個麥克風(fēng),AI耳機(jī)怎么解決這些聲學(xué)問題呢?相比智能音箱,它還有哪些其他功能?

黃赟賀:音箱是遠(yuǎn)場交互,噪音強(qiáng)人聲弱,但耳機(jī)是近場環(huán)境,在交互這塊會比音箱的表現(xiàn)更好。AI耳機(jī)又因?yàn)橛写竽P图夹g(shù)的加持,各方面反饋會比傳統(tǒng)耳機(jī)更好。因?yàn)樗难舆t性會被降低,我們可以去做到流式的輸出,用戶先說出一個字的時候,AI就已經(jīng)開始進(jìn)行反饋,不會像過去一樣,系統(tǒng)響應(yīng)需要很長一段時間。目前大模型的語音克隆技術(shù)也非常成熟,不會再讓用戶有機(jī)器音的疏離感??谡Z場景化也會更好,因?yàn)榇竽P头g出來的語義會更加連貫。另外,透露一個小秘密,聲智接下來準(zhǔn)備出海的產(chǎn)品,我們會做到,您在這邊說中文,另一邊傳達(dá)到時已經(jīng)變成純英語的狀態(tài),只要把翻譯轉(zhuǎn)化的時間拉到毫秒級別,基本兩個不同語種的人在溝通時候可以實(shí)現(xiàn)無感交互。對于AI智能寫作、AI翻譯、轉(zhuǎn)錄之類的功能,我們也在觀察后臺用戶數(shù)據(jù),基于實(shí)際用戶反饋,我們發(fā)現(xiàn)一些AI能力用戶理解門檻比較低,或者一些功能是用戶需求比較大的,我們后續(xù)系統(tǒng)升級也會加強(qiáng)這些能力。我們目前的產(chǎn)品思路,就是希望我們的耳機(jī)變成年輕人的AI搭子。我們一直認(rèn)為,AI一定要在具體的場景里才能發(fā)揮作用,才能降低用戶理解門檻,而不能只把它作為一個工具擺在那里。

鯨犀:聲智這款A(yù)I耳機(jī)出圈的原因,還在于它的外形非常像珍珠,可以作為耳飾佩戴,可以給我們介紹一下嗎?

黃赟賀:聲智的設(shè)計思路來自前段時間美國大選哈里斯競選的時候,有人懷疑她戴的珍珠耳環(huán)其實(shí)是個藍(lán)牙耳機(jī)。這種珍珠配飾形態(tài)的耳夾式,大家容易會忽略它是一個耳機(jī),在工作中依然可以佩戴,既能保證工作可以正常輸出,也更具顏值。近期我們還出了一個黑色款,跟黑神話悟空的色調(diào)很像,上架即售罄。我們營銷策略整體偏向年輕時尚,耳機(jī)的外觀設(shè)計方面,和傳統(tǒng)耳機(jī)做出差異化,也是我們覺得比較吸睛的點(diǎn)。聲智的直播間,也和其他友商的科技風(fēng)格不太像,網(wǎng)友說我們老是展示功能展示佩戴效果,看起來像賣衣服的,的確我們直播間的小組長,原來就是做服裝直播的,這種非常規(guī)的營銷方式,可能也是聲智產(chǎn)品能做出圈的一個原因。

鯨犀:據(jù)我了解,聲智系統(tǒng)用的是自研大模型,聲智為什么要自研大模型?自研的大模型能在聲學(xué)技術(shù)上帶來什么不同之處?

黃赟賀:聲智的理念是“技術(shù)為產(chǎn)品服務(wù)”,我們是產(chǎn)品和運(yùn)營在先,技術(shù)作為堅實(shí)的后盾。AzeroGPT的中文叫壹元大模型,取自于壹元初始、萬象更新,因?yàn)槲覀兿M?到1這個過程做到極致。做自研模型的關(guān)鍵在于它能根據(jù)產(chǎn)品需求以及用戶反饋及時做調(diào)整,避免采買帶來的滯后性。比如在最卷的語言模型訓(xùn)練上,我們就關(guān)注到了一個精簡性的問題。因?yàn)槿藱C(jī)交互場景不是長文概念,類似微信場景60秒一條語音,用戶不可能對著機(jī)器長篇大論,他希望得到的答案,也是基于提問給出的很精簡的、可用性很強(qiáng)的答案,自研大模型就可以根據(jù)我們觀察到的用戶需求,調(diào)整訓(xùn)練方向。另外,大模型的運(yùn)用也讓我們耳機(jī)的硬件成本降下來,并且在回聲抑制和噪聲消除等耳機(jī)功能方面,有更好更精準(zhǔn)的效果。

鯨犀:AzeroGPT是能夠在語義上做理解,還是主要在語音上?

黃赟賀:我們現(xiàn)在模型構(gòu)成是三個板塊,聲學(xué)、語音和語言。從交互邏輯來講,聲學(xué)先對聲音進(jìn)行采集,采集聲音之后進(jìn)行解析,降噪、回聲抑制都是對聲學(xué)信號進(jìn)行處理,然后才到語音識別,音頻進(jìn)行轉(zhuǎn)譯,再通過語音合成以聲音形態(tài)轉(zhuǎn)遞給用戶。當(dāng)然我們的大模型參數(shù)肯定不會像大廠的大模型參數(shù)一樣那么大,所以我們在做這個模型的時候更關(guān)注它對人機(jī)交互流程上體驗(yàn)效果的提升。所以我們更關(guān)注大模型嵌入到硬件里面的技術(shù)鏈路如何更順暢,讓響應(yīng)速度達(dá)到極致,這也是聲智創(chuàng)立以來一直致力于解決的問題。

鯨犀:在聲學(xué)方面,這個大模型處理的結(jié)果是相當(dāng)于一個怎樣的水平?比如說能對標(biāo)豆包,還是不輸于GPT-4o?

黃赟賀:GPT4-4o我理解屬于端到端模型,我們是按照端到端語音模型去做訓(xùn)練,因?yàn)樗_實(shí)是在 AI硬件語音交互場景下最合適的技術(shù)底座。我們沒有想去對標(biāo)哪家公司,更多的是技術(shù)要服務(wù)于產(chǎn)品。當(dāng)然也會看市面上其他模型,發(fā)現(xiàn)其他模型或者AI產(chǎn)品的優(yōu)勢再取長補(bǔ)短,這也是為什么要自己做模型,可以根據(jù)產(chǎn)品迭代需求、用戶需求進(jìn)行模型優(yōu)化,采集到合理反饋就會調(diào)優(yōu)。

鯨犀:目前很多用戶更習(xí)慣于手機(jī)端上下滑動,對話式的AI交互會不會造成一定用戶門檻?

黃赟賀:移動端的上下滑,我們叫圖形界面的交互,下一個形態(tài)就是語音交互,再到視覺交互,比如AI眼鏡。視覺更復(fù)雜,要求的算力也更高,像現(xiàn)在很多AI眼鏡看東西會暈,耳機(jī)就會好很多,這也是聲智會選擇AI耳機(jī)作為我們AI硬件的首發(fā)形態(tài)。

鯨犀:AzeroGPT會對外開放嗎?

黃赟賀:會對外。我們之前提到的大模型聲學(xué)、語音和語言三個板塊,目前官網(wǎng)都有一個API可以接入。聲智很多B端客戶像做全息數(shù)字人的,之前的數(shù)字人可能還是一問一答式,意圖理解、槽位匹配的時候,會要有一個運(yùn)營團(tuán)隊在后面做標(biāo)注,必須是命中了這個問題的關(guān)鍵詞,數(shù)字人才能回答問題?,F(xiàn)在新一代的交互形態(tài)可以給很多產(chǎn)業(yè)賦能,我們也非常歡迎同樣做AI硬件的廠商,使用我們的大模型算法以及Azero交互框架。市場一定是百花齊放,大眾的認(rèn)知才會變高,用戶的理解成本才會降低,我們的產(chǎn)品才能賣得更好。

鯨犀:聊完大模型,我們再聊聊品牌打造。到目前為止,AI耳機(jī)賣得最好的時候是什么樣的狀態(tài)?

黃赟賀:我們的AI耳機(jī)對外銷售是今年8月份,現(xiàn)在最好的成績是在抖音自營直播間,這一款耳夾式耳機(jī)單店單品一個月賣了10萬臺,ROI和整體的數(shù)據(jù)反饋都是非常好的,在抖音3C榜上連續(xù)半個月都是第一名,我們沒有任何投放動作,也能到前三。我們認(rèn)為先在國內(nèi)卷出來,才能在海外有一個很好的成績。而字節(jié)不僅國內(nèi)有抖音,國外也有TikTok,能提供很順暢的平臺服務(wù),讓聲智能夠及時動作。我們預(yù)計在今年11月份左右啟動海外直播間,直擊歐美、中東等市場。我們?yōu)槭裁磿x擇抖音這個賽道,就是要在最卷的里面卷出來,才能去海外卷。國內(nèi)企業(yè)其實(shí)是非常卷的,卷AI、卷供應(yīng)鏈、卷產(chǎn)品創(chuàng)意,卷用戶數(shù)據(jù)。要在國內(nèi)先拼出來,才能在海外有一個很好的成績,我們的前輩像大疆、Insta360都是非常好的案例。

鯨犀:抖音3C賽道很卷,耳機(jī)更卷。從做品牌的角度來說,一個新品能拿到這樣的成績,您認(rèn)為是做對了哪些事情呢?

黃赟賀:我一直蠻喜歡小米雷總的一句話,他說好多公司都是熬出來的。我覺得這個“熬”字非常貼切,因?yàn)槲覀冏鲞@個產(chǎn)品,整個團(tuán)隊大概歷經(jīng)了兩年的努力?,F(xiàn)在的產(chǎn)品形態(tài),其實(shí)還有非常多種備選,今年下半年也會再出很多不同形態(tài)的產(chǎn)品。我們沒有為了搶占市場,快速推出一款產(chǎn)品直接面向市場。另外一方面,我們在做營銷的時候,不是直接以AI形態(tài)去教育用戶,而是采取了一種更“春風(fēng)化雨”的方式,用潮玩圈的思路去做AI,是潮玩品有了AI能力,這樣大家就比較容易接受。比如聲智的耳機(jī)里有16種AI能力,整個設(shè)計風(fēng)格也帶些游戲感,比如里面放吉祥物做串場,給到沉浸式體驗(yàn)等。外觀設(shè)計方面也有很多小巧思,比如用軟硅膠材質(zhì)達(dá)到輕巧目的,換音樂的按鍵也和平常的不太一樣。我們認(rèn)為,用戶得先喜歡你的產(chǎn)品,才能用你的AI功能,團(tuán)隊才能有數(shù)據(jù)去優(yōu)化產(chǎn)品功能,形成正反饋。

鯨犀:耳飾通常是女性更青睞,但玩3C的很多是男性,這種策略會不會造成用戶流失?

黃赟賀:這款單品設(shè)計的時候,沒有確定用戶消費(fèi)性別,更多是考慮到實(shí)用、美觀度的提升。后出的黑色款,男性用戶也買的比較多,七夕節(jié)的雙色套餐,也有很多情侶用戶買。另外我們其他產(chǎn)品線,也有商務(wù)款之類的偏傳統(tǒng)耳機(jī)的樣式。

鯨犀:AI耳機(jī)售價定在199非常巧妙,定價策略是怎么設(shè)計的呢?

黃赟賀:我們的低定價是考慮到用戶對AI的嘗鮮門檻要低一點(diǎn)。因?yàn)槁曋鞘菑闹悄芤粝鋬r格戰(zhàn)里走出來的,最早智能音箱都是千元級,后面慢慢小米等廠商降到了199甚至更低,用戶嘗試成本不高,才快速打開市場。AI有很多功能,哪些功能是用戶真正需要的,我們也需要快速打開市場,去了解用戶需求,反饋升級系統(tǒng)。當(dāng)然我們也有高價款去匹配不同細(xì)分人群的需求,比如今年會推出AI助聽器,相對來說高價一點(diǎn),但對比國外AI助聽器動輒幾萬塊的水平,聲智更希望成為國產(chǎn)之光。聲智的聲學(xué)技術(shù)優(yōu)勢,在降低成本和擴(kuò)展功能方面,都有很大幫助。

鯨犀:過去很多ToB公司在轉(zhuǎn)型做ToC的時候,思維邏輯轉(zhuǎn)換不過來,聲智轉(zhuǎn)型的一年多里,遇到過哪些問題?聲智怎么應(yīng)對這些問題?

黃赟賀:我將這個過程定義為從技術(shù)到產(chǎn)品、產(chǎn)品到品牌的發(fā)展過程,而且這些過程都是聲智必經(jīng)的。從2016年聲智開始做智能音箱,最開始聲智是算法支持,后面變成了做硬件跟算法的嵌套。我們也有國家專利獎的Azero的開發(fā)框架(AI算法與硬件結(jié)合的交互框架)。在做這個的時候,我們已經(jīng)在做 AI 硬件了,只不過當(dāng)時我們管它叫行業(yè)終端、智慧終端。現(xiàn)在,我們就是把產(chǎn)品形態(tài)換了一個消費(fèi)領(lǐng)域能接受的形態(tài)去呈現(xiàn),選擇了一個比較時尚的外觀,把 AI 耳機(jī)包裝成大家接受度更高的產(chǎn)品。內(nèi)核的技術(shù)架構(gòu),對我們而言是成熟且穩(wěn)定的。我們目前最關(guān)心的還是研究用戶數(shù)據(jù)、市場反饋,做營銷做品牌,技術(shù)反而是最安心的部分。當(dāng)然聲智轉(zhuǎn)型過程中也會有一些人員上的調(diào)整,但調(diào)整方向比較明確,營銷策略規(guī)劃都比較清晰,而且整個團(tuán)隊都比較年輕,大家的網(wǎng)感、對最新消費(fèi)市場的把握都會更強(qiáng)一點(diǎn)。我們將體驗(yàn)店設(shè)在中關(guān)村創(chuàng)業(yè)大街的街上,也是方便用戶隨時過來進(jìn)行產(chǎn)品體驗(yàn)反饋,讓我們的工程師直面一線。

鯨犀:聊了這么多國內(nèi)市場,聲智目前出海整體策略和規(guī)劃是怎樣的?現(xiàn)在的出海情況如何?

黃赟賀:聲智10月份剛剛參加迪拜舉辦的科技+創(chuàng)新展會,預(yù)計年底發(fā)布的新品SoundAI OWS Pro在GITEX現(xiàn)場順利完成了印地語、阿拉伯語、土耳其語等一帶一路國家小語種與中文的互譯。在商務(wù)場合中,用戶只要將充電倉遞給對方,就可以在符合商務(wù)禮儀的前提下,實(shí)現(xiàn)跨語言無縫交流。聲智目前也是響應(yīng)國家一帶一路建設(shè)倡導(dǎo),逐漸走出海外,中東在這條線上有很好的市場環(huán)境。然后今年聲智也會繼續(xù)在TikTok深耕,借助直播等渠道,進(jìn)入北美和歐洲市場。我們也提前預(yù)測了一些海外市場可能會遇到的問題,比如說品牌認(rèn)知不夠的情況下,怎么讓用戶去接受產(chǎn)品及定價,我們都做了完整規(guī)劃,期待第四季度海外會有良好表現(xiàn)。

鯨犀:怎么分析國外的3C市場?

黃赟賀:北大的路教授提出過一個觀點(diǎn):出海等于海外創(chuàng)業(yè)。2023年的時候,大模型比較火,經(jīng)常有很多論壇邀請我們?nèi)プ鲆恍﹫A桌討論。當(dāng)時有一個主持人問我, ChatGPT做那么厲害,中國的大模型基本上都是望聞卻步的狀態(tài),我們有什么能力優(yōu)勢?有多少年的差距?我說中國有自己的優(yōu)勢,供應(yīng)鏈優(yōu)勢是我們的優(yōu)勢,我們可以做很多產(chǎn)品創(chuàng)新,有很多不同的形態(tài)。早年間的智能音箱,美國所有的智能音箱加起來就是一小堆。中國的智能音箱有海量的形態(tài),這就是中國的優(yōu)勢。所以我們要把這個優(yōu)勢發(fā)揮到最大。我們的創(chuàng)新性、產(chǎn)品迭代的速度、成本優(yōu)勢、定價優(yōu)勢,這些都能在海外市場很好地獲客。且北美市場對于AI創(chuàng)新產(chǎn)品的接受度會相對高一些。

鯨犀:這個產(chǎn)品在海外會有市場嗎?未來的渠道策略是怎樣的?

黃赟賀:像AI指環(huán)、胸章、掛墜、耳機(jī)、眼鏡這些產(chǎn)品,我覺得整個市場都在探索AI形態(tài)。最開始鼠標(biāo),后面到PC,變成了觸屏,與智能音箱語音交互,到現(xiàn)在這個階段,一直在進(jìn)行交互形態(tài)的升級。下一輪交互形態(tài)可能是脫離圖形界面交互。這個交互形態(tài)的載體是什么?大家都在探索,現(xiàn)在沒有結(jié)論說到底哪一個交互形態(tài)是完美形態(tài)。我比較欣喜,創(chuàng)業(yè)公司也好,大廠也好,大家都在尋求創(chuàng)新的狀態(tài),國內(nèi)的“內(nèi)卷”反倒會助長我們在海外的表現(xiàn)。當(dāng)有一個友商出海很成功,會有更多的AI硬件產(chǎn)品出海獲得海外市場份額,那個時候全球會覺得 AI made in China 是一個很好的產(chǎn)品形態(tài)?,F(xiàn)階段,AI耳機(jī)對于聲智來講肯定是最好的一個AI硬件載體,“耳朵里的智能音箱”用戶理解成本門檻也會較低,我相信隨著市場的蓬勃發(fā)展,以及我們AI技術(shù)的不斷成熟和完善,包括市場策略的精細(xì)化,能更好地做出更符合市場需求的AI時代的新產(chǎn)品。(雷峰網(wǎng))

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。

注:本文轉(zhuǎn)載自雷鋒網(wǎng),如需轉(zhuǎn)載請至雷鋒網(wǎng)官網(wǎng)申請授權(quán),轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。如有侵權(quán)行為,請聯(lián)系我們,我們會及時刪除。

成都威爾德公司承接各種互聯(lián)網(wǎng)業(yè)務(wù)-幫助中小企業(yè)轉(zhuǎn)型互聯(lián)網(wǎng)加- 版權(quán)聲明 1、本主題所有言論和圖片純屬會員個人意見,與成都威爾德公司承接各種互聯(lián)網(wǎng)業(yè)務(wù)-幫助中小企業(yè)轉(zhuǎn)型互聯(lián)網(wǎng)加立場無關(guān)。
2、本站所有主題由該帖子作者發(fā)表,該帖子作者新聞機(jī)器人成都威爾德公司承接各種互聯(lián)網(wǎng)業(yè)務(wù)-幫助中小企業(yè)轉(zhuǎn)型互聯(lián)網(wǎng)加享有帖子相關(guān)版權(quán)。
3、成都威爾德公司承接各種互聯(lián)網(wǎng)業(yè)務(wù)-幫助中小企業(yè)轉(zhuǎn)型互聯(lián)網(wǎng)加管理員和版主有權(quán)不事先通知發(fā)貼者而刪除本文。
4、其他單位或個人使用、轉(zhuǎn)載或引用本文時必須同時征得該帖子作者新聞機(jī)器人成都威爾德公司承接各種互聯(lián)網(wǎng)業(yè)務(wù)-幫助中小企業(yè)轉(zhuǎn)型互聯(lián)網(wǎng)加的同意。

這家伙太懶了,什么也沒留下。
最新回復(fù) (0)
只看樓主
全部樓主
    • 成都威爾德公司承接各種互聯(lián)網(wǎng)業(yè)務(wù)-幫助中小企業(yè)轉(zhuǎn)型互聯(lián)網(wǎng)加
      2
        立即登錄 立即注冊 QQ登錄
返回
免責(zé)聲明:本站部分資源來源于網(wǎng)絡(luò),如有侵權(quán)請發(fā)郵件(673011635@qq.com)告知我們,我們將會在24小時內(nèi)處理。