
在人類與科技親密接觸的漫長旅程中,耳朵,這個曾用于聆聽風聲雨聲、低語淺笑的器官,正悄然成為人工智能(AI)進軍現實世界的“戰略要地”。
從美國拉斯維加斯國際消費電子展(CES)閃爍的聚光燈,到實驗室里無聲跳動的腦電波信號,一場關于“聽覺革命”的浪潮正由一群AI初創公司掀起。他們押注的不是智能手機、智能眼鏡,而是智能耳機。他們致力于讓耳機華麗變身為一個集翻譯、記錄、控制,乃至“讀腦”于一體的超級接口。
不再被動接收聲音
10年前,美國韋弗利實驗室和邁馬努公司率先為耳機注入了“語言魔力”——實時翻譯。戴上耳機,西班牙語瞬間化作英語,中文脫口而出變成法文。這一功能曾被視為科幻橋段,如今卻已在課堂、會議室、機場落地生根。
谷歌緊隨其后,在2020年推出語音激活的AI助手,讓耳機朝著智能化的道路繼續邁進。而蘋果與三星則以降噪技術為盾牌,構筑起高端音頻體驗的護城河。然而,真正的變革并非來自巨頭,而是一些并不擁有煊赫聲名的初創企業。
OSO公司便是其中之一。他們的耳機不再只是被動接收聲音,而是主動參與對話。它能錄制會議、識別發言者、提取關鍵決策,并以自然語言生成摘要。
中國AI硬件公司“未來智能”推出的RecDot耳機,不僅支持多語言實時轉錄,還能跨平臺運行。該公司首席執行官馬嘯透露,他們的設備兼容多款手機,能打破生態壁壘,讓AI真正“人人可及”。
而時空壺公司的耳機則在教育領域發力。該公司美國銷售主管布萊恩·謝克利夫表示,其90%的銷售額來自學校。非英語母語的學生佩戴它上課,可實時理解授課內容。
從語音交互邁向神經感知
如果說語音交互是第一代智能耳機的起點,那么神經感知,便是它的未來。
加拿大初創公司Naqi Logix正試圖讓耳機“讀懂你的臉”。其“神經耳機”看似普通耳塞,實則內嵌超靈敏生物傳感器,能捕捉面部肌肉微弱的電信號,如眨眼、挑眉、抿嘴,甚至下巴輕繃,皆可轉化為指令。
該公司產品總監扎維爾·亞歷山大表示,他們制作這款耳機的初衷是幫助一位癱瘓的朋友重新玩游戲。如今,莊閑和app這款耳機已能讓四肢癱瘓者僅憑面部動作控制電腦、瀏覽網頁,甚至操控電動輪椅。運營經理桑德普·艾莉亞則看到了這款耳機更深層次的內核——人們希望能夠以更隱秘、更微妙的方式與環境互動,而無須用智能手機呼叫Siri,用揚聲器呼叫Alexa,或用眼鏡呼叫Meta。
另一家美國公司Neurable走得更遠。其MW75 Neuro LT頭顯雖非傳統耳機,卻代表了同一方向的終極愿景——用思維交流。通過監測大腦前額葉的電活動,這一設備能識別用戶的意圖。
便利與局限并存
盡管前景誘人,但智能耳機能否取代智能手機、智能眼鏡,成為AI的主導終端?答案尚未揭曉。
支持者認為,耳機具備天然優勢:便宜、普及、便攜。美國科技研究機構Techsponential總裁艾維·格林加特表示,全球數十億人已擁有耳機,升級AI功能的成本極低。相比之下,智能眼鏡價格高、佩戴不便,且常被視為“怪異”。
更重要的是,耳機始終貼近人體,是理想的傳感器載體。它能持續采集語音、心率、體溫乃至腦電波,構建個人數字孿生體。未來,它或許能預判你的情緒波動,在焦慮時播放舒緩音樂;或在會議中察覺你未盡之言,自動予以補全。
然而,挑戰同樣嚴峻。首先,耳機的使用場景受限。人們不會24小時佩戴耳機,尤其在公共場合說話并不總是合適。其次,耳機交互方式單一,缺乏攝像頭意味著用戶無法識別手勢、環境或視覺信息,限制了AI的理解維度。
此外,對隱私與數據安全的擔憂也始終存在。若耳機能捕捉每一次眨眼、每一句低語、每一段腦電波,那么,誰在存儲這些數據?是否會被濫用?一旦黑客入侵,豈不是連“思想”都暴露無遺?
每一次人機交互的革新,似乎都伴隨著終端形態的重塑:鍵盤讓人類輸入文字,觸摸屏讓人們用指尖滑動世界,語音助手開啟了“開口即得”的時代。而今,耳機正試圖成為下一個載體——一個更私密、更安靜、更無縫的入口。