chatgpt 語音識別 ChatGPT旋風如何“卷”到汽車行業?
文/福布斯中國
人氣爆棚的,最近又把熱度帶到了汽車行業。
先是,百度即將內測的生成式對話產品“文心一言”的朋友圈不斷擴大,吉利、長城、海馬、集度、零跑、東風日產等新老車企紛紛宣布加入。
后有,長城汽車孵化的自動駕駛公司毫末智行宣稱推出首個自動駕駛認知大模型,也就是自動駕駛領域的“”。
今天,百度發布了2022年年度財報。百度CEO李彥宏在內部信中指出,中國AI市場即將迎來爆發性的需求增長,其商業價值的釋放將是前所未有的、指數級的。百度計劃將多項主流業務與文心一言整合。文心一言大模型將搭載到智艙系列產品。
容易理解的是,如果整合實現,百度的智能汽車將具備領先一代的人車交互體驗。那么,毫末智行的又會如何撬動極為復雜的自動駕駛呢?它們又將如何影響汽車行業?
1. 智能語音:讓人機交互更自然、更順暢
在多家車企與百度文心一言宣布合作的新聞中chatgpt 語音識別,均提到了未來的應用場景和目標,就是提升AI交流對話、交互的體驗。
2月14日,集度CEO夏一平宣布,集度汽車將融合百度文心一言的全面能力,打造針對智能汽車場景的大模型人工智能交互體驗,支持汽車機器人實現自然交流的再進階。他表示,可能帶來的還是車內的交互效率的提升,能夠讓交互場景更加全面化。
對于合作的方式,百度和集度汽車方面均表示,目前還不清楚具體的方式,因為產品還沒上線。
智能語音一直是人工智能重要的賽道,由自動語音識別 (ASR) 、自然語言處理 (NLP) 、語音合成 (TTS) 三大技術構成。而就是應用于NLP的大規模預訓練語言模型,目的就是模仿人類的真實交流場景,以提升人機交互體驗。
在汽車場景中,智能語音已成為智能座艙的重要交互方式。目前,百度、科大訊飛、云知聲、思必馳、等智能語音賽道的AI企業早已切入智能汽車、智能座艙領域,以打造智能語音助理,提升語音交互能力。
雖然現在車載語音交互技術的識別率已經達到90%以上,但功能相對簡單,例如語音導航、語音控制歌曲播放等,智能化或者“理解能力”仍是“軟肋”。
根本原因在于,車內或公共空間容易被環境噪音及人聲干擾chatgpt 語音識別,且每次交互前都需要喚醒,給AI識別帶來了麻煩。站在AI的角度來說,每一次交互都面臨“誰在對我說”“說的什么內容”和“所處的環境”等難題,因此難以實現近似人與人之間的自然交流。
為此,目前科大訊飛、思必馳等廠商都采用了語音、視覺等相結合的多模態交互技術,以解決復雜場景下的人機交互難題。
思必馳汽車事業部產品總監葛付江表示,從對話能力輸出來看,具備情感化、高度擬人化的對話交互存在潛力,實現更接近真人邏輯性和情感化的表達效果。
而一旦融入車載語音識別場景,可以通過數據的人工標注和反饋,并結合大規模預訓練語言模型進行深度學習,以便讓AI具備更出色的語言理解和生成能力,從而避免干擾,也無需喚醒詞,實現更順暢、更自然的語言交互。
2. 自動駕駛:噱頭大于實際
2月17日,毫末智行宣布,將其自動駕駛認知大模型(人駕自監督認知大模型)正式升級為“”,并稱將于2023年4月公布重要進展。
毫末智行方面表示,采用的是大模型以及人類反饋強化學習 (RLHF) 技術。而在自動駕駛領域,該公司稱,在國內最早將大模型引入到數據智能體系MANA當中。
眾所周知,自動駕駛是一套復雜的解決方案,涉及計算、通信、網絡、控制等多個層面,猶如一臺會自動“奔跑”的計算機或機器人。
從技術層面來說,自動駕駛分為感知、決策和執行。毫末智行提出的所謂“認知”的概念,又將其智能化水平提升至一個新高度:擬人。
福布斯中國咨詢了多家自動駕駛企業,得到的回復都是“不予置評”,而多位自動駕駛領域的專家則看法高度一致。
他們向福布斯中國表示,自動駕駛系統非常復雜,對于實時性要求相當高,而且牽涉到多種傳感器等硬件,更有車規級限制。更重要的是,算力也是一個大問題。一位業內人士表示:“很難影響自動駕駛,主要還是應用在語音交互、智能推薦等方面。目前,智能駕駛行業內已經提出了‘千人千面’的定制化推薦產品,其基于大規模數據的訓練和積累,以便建立不同類型駕駛員的模型,同時結合地圖,為用戶提供個性化的推薦。但量產的話,還有很長的路要走。”
歸納各方觀點可見,其實與自動駕駛的技術路線并不一樣,前者主要針對NLP技術和用戶體驗的提升,后者更多依靠的是傳感器,對數據的收集和積累。所以,對汽車行業的影響,更多的還是語音交互、人機交互等層面。號稱將用于自動駕駛,大概率是宣傳的噱頭。
毋庸置疑的是,相對于來說,自動駕駛背后的大模型更復雜,需要更多的數據積累和算力支撐。
3. 蹭熱度還是炒冷飯?
自2022年底上線以來,火遍整個科技界,更向各個領域蔓延。
綜上文所述,可以說,汽車行業就是一個典型例子,也是一個縮影。但歸根到底,只是一個大規模預訓練語言模型,應用方向是NLP。截至目前,它的應用就是借助數據的訓練和學習,提升AI人機語言交互的體驗chatgpt 語音識別,并非萬能的AI“良藥”。
無論如何,的火爆的背后,令人們對AI重拾信心,更加強了對大模型的重視程度。從中引出的是對數據、算力等底層核心要素的關注。
英偉達CEO黃仁勛認為:是人工智能領域的時刻,也是計算領域有史以來最偉大的技術之一。言下之意是,芯片廠商將成為火爆的最大贏家。
不過,一邊倒叫好聲的背后,難免有質疑聲。目前仍然有各種問題,即便是微軟、谷歌這樣的巨頭,相關產品也屢屢翻車。國產版究竟如何,還需靜待上線后才能見分曉。
在此之前,就先別永無休止地“調戲”了,這只會讓它“壞點子”更多!
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表本站的觀點和立場和對其真實性負責。如需轉載,請聯系原作者。如果來源標注有誤或侵犯了您的合法權益或者其他問題不想在本站發布,來信即刪。
聲明:本站所有文章資源內容,如無特殊說明或標注,均為采集網絡資源。如若本站內容侵犯了原著者的合法權益,可聯系本站刪除。