“一塊豆腐兩塊,買三塊要花幾塊?”盡管來中國工作已有時日,面對中文里的“燒腦”提問,從事演員行當?shù)奈靼嘌廊舜笮l(wèi)還是會顯得力不從心。
一次偶然的契機,大衛(wèi)接觸到一款名為“時空壺”的人工智能(AI)同傳耳機?!艾F(xiàn)在不僅聽得懂,而且不會在感謝同事時說‘我會給你好果子吃’了?!彼f。
一聽一說間,如何跨越語言障礙?4月初,科技日報記者在深圳時空壺技術(shù)有限公司體驗到了“時空壺”的方便實用——兩個說著不同語言的人,各自佩戴一只耳機,通過連接手機端App,來言去語便可即時互譯,實現(xiàn)“無感溝通”。
靈感源自巴別魚
“意外!”深圳時空壺技術(shù)有限公司創(chuàng)始人田力如此描述創(chuàng)業(yè)靈感的閃現(xiàn)。
“十多年前,我的父母在歐洲旅游時突發(fā)疾病。面對醫(yī)生詢問,卻因手機中的翻譯軟件操作繁瑣、識別遲緩,險些延誤救治?!碧锪φf。
這次經(jīng)歷深深觸動了田力。他意識到,依靠翻譯軟件雖能解決簡單的日常溝通問題,但人與人之間的交流,仍需一種“沉浸式”體驗。
我們需要什么樣的翻譯設(shè)備?
道格拉斯·亞當斯小說《銀河系漫游指南》里巴別魚的形象浮現(xiàn)在了田力的腦海中。
巴別魚是這部小說中的一種虛構(gòu)生物,植入耳內(nèi),可實時翻譯宇宙任何語言,消除交流障礙。
田力說:“耳機,不正是一個完美的‘巴別魚’嗎?”
當使用者說話時,語音識別技術(shù)精準捕捉聲音,并將其轉(zhuǎn)化為可處理的文本信息;在傾聽者的耳中,耳機則將翻譯后的文本,轉(zhuǎn)化為自然流暢的語音輸出。
把靈感和構(gòu)想裝進商業(yè)策劃案,田力將初代“時空壺”構(gòu)想放在了海外眾籌平臺Kickstarter上,先獲取用戶的反饋,再決定項目的可行性。
在這一過程中,“耳機只能翻譯、不能聽歌,功能有點少……”這樣的反饋層出不窮。
田力陷入沉思:要不要向用戶妥協(xié)?
“產(chǎn)品本身體積就很小,如果按當時的元器件集成水平,即便做出一個‘既能、又能、還能’的產(chǎn)品,各種功能都會大打折扣?!碧锪Ψ治龅?,“就像瑞士軍刀,功能疊加只會讓每個刀刃都不鋒利?!?/p>
經(jīng)過反復(fù)斟酌,田力決定:“即便眾籌金額會受限,也要先保證翻譯功能好用?!?/p>
2018年,在獲得數(shù)百萬美元天使輪融資后,初代“時空壺”同傳耳機的商業(yè)案從文件走向代工廠,隨之量產(chǎn)。
布局亞馬遜、架設(shè)獨立站、投放廣告……成功出圈后,“時空壺”的出海之路按下了加速鍵。
反復(fù)驗證破難題
初代“時空壺”同傳耳機略有所成,讓田力和團隊下定決心乘勝追擊。
2019年,“時空壺”ZERO系列翻譯機在日本眾籌資金超過7000萬日元,在中國臺灣也取得不錯的成績,眾籌金額超過2200萬新臺幣。
然而,這款隨身翻譯機發(fā)布還不到兩個月,境遇急轉(zhuǎn)直下。
“我們當時向工廠下單了20萬臺,但隨之而來的差評讓退貨率不斷上升,直到現(xiàn)在還有幾萬臺積壓在倉庫里?!碧锪φf。
田力與團隊“閉門思過”。通過拆解用戶反饋的2000多條意見,他們發(fā)現(xiàn),核心痛點是降噪功能差導(dǎo)致翻譯效果不佳。
這一次經(jīng)歷,也讓田力與團隊認識到,要將產(chǎn)品推向市場,還需要在不同場景里反復(fù)驗證。
“過去市場上沒有這類產(chǎn)品,所以每一步都是‘從0到1’的探索。”深圳時空壺技術(shù)有限公司研發(fā)負責人石偉說。
從實驗室到工廠,再從工廠到市場,3年間三代產(chǎn)品迭代,這樣的驗證周而復(fù)始。
在這一過程中,團隊破解了“雙工通信”難題,改寫了傳統(tǒng)藍牙耳機的單向傳輸特性,創(chuàng)新算法讓兩只耳機實現(xiàn)雙向?qū)崟r互譯。產(chǎn)品也從入耳式到掛耳式,再到多語多向同傳AI翻譯終端,不斷豐富。
“我們研發(fā)了一套全球首創(chuàng)的算法,它可以在方向上和距離上對聲音進行判斷。”田力說,“這樣使得收取的聲音能被翻譯得更為精準?!?/p>
與此同時,“時空壺”獨創(chuàng)的矢量降噪算法,通過三麥克風陣列實現(xiàn)聲音定向捕捉。
“這如同為聲音世界裝上了‘顯微鏡’。”石偉說,他們追求的終極目標是利用降噪技術(shù),完全消除說話者以外的雜音、噪聲。
“無感溝通”在路上
一邊不斷升級通信、降噪技術(shù)和算法,一邊從用戶和同聲傳譯從業(yè)者的反饋中彌合語言背后的邏輯差異,田力的目標是實現(xiàn)“無感溝通”。
記者采訪時了解到,目前同聲傳譯最快的響應(yīng)速度是2秒到3秒,而且這只有世界頂尖譯員才能做到。
2023年,記者在深圳高交會現(xiàn)場與德國采購商通過“時空壺”交流時,尚有幾秒延遲;如今當記者再用新產(chǎn)品與他人測試時,幾乎感覺不到“時差”。
“我們在全球范圍內(nèi)布局200余臺服務(wù)器,以確保海內(nèi)外用戶都能有良好的體驗?!碧锪φf。
在企業(yè)文化墻上,不僅展示著每一代產(chǎn)品,也記錄著產(chǎn)品背后的用戶故事。
“現(xiàn)在我什么都可以聽懂了!”在2023年杭州亞運會期間,烏茲別克斯坦代表團使用“時空壺”了解中國文化時,副團長卡莫爾丁·埃爾加舍夫發(fā)出了由衷的贊嘆。
時下,搭載Babel OS同傳系統(tǒng)的新款耳機,支持40種語言、93種口音即時互譯,已遠銷全球170多個國家和地區(qū)。
“這是發(fā)到美國的,這是發(fā)到法國的,這是發(fā)到西班牙的……”在深圳時空壺技術(shù)有限公司的倉庫里,公司首席市場官吳衛(wèi)兵表示,“時空壺”海外銷售額占比達70%,今年的訂單已經(jīng)排到將近6個月之后了。
當前,這個平均年齡只有28歲的團隊,已集合算法、聲學(xué)、嵌入等領(lǐng)域的50多名研發(fā)人員,手握100多項全球?qū)@J證。
“技術(shù)因解決問題而生,解決問題只能一步一個腳印來,沒有任何捷徑?!碧锪φf。