GitHub
號稱其英文語音辨識能力已達到人類水準的Whisper神經網路,且它亦支援其它98種語言的自動語音辨識。
Whisper系統所提供的自動語音辨識(Automatic Speech Recognition,ASR)模型是被訓練來執行語音辨識與翻譯任務的,它們能將各種語言的語音變成文字,也能將這些文字翻譯成英文。
Whisper系統目前提供了9種模型,它們的參數數量與功能不一,這些模型總計經過68萬小時的語音訓練,以及比對了從網路上蒐集而來的文字轉寫內容,當中有68%的資料為英文語音與英文文字,另有18%的非英文語音及英文文字,以及17%的非英文語音及相對應的文字。而這些非英文的資料涉及98種不同的語言。
塑膠射出成型不良品原因及改善對策 !
隨著技術的不斷提升新觀念、新技術、新設備的不斷加入。
如何利用一般常見的「L型資料夾」達到廣告宣傳效果?
滑鼠墊是滑鼠的好夥伴,可使滑鼠游標穩定滑順,多樣的材質尺寸與專屬設計的圖案, 成為您電腦桌上的亮點!
什麼是POGOPIN?
POGOPIN是一種應用於手機等電子產品中的精密連接器,廣泛應用於半導體設備中,起連接作用。
包裝設計實際上涵蓋了多種設計範疇,需要高度設計專業,以酒為例,酒瓶上的標籤設計是包裝設計的一種,需考量美觀與形塑產品特色提供充足資訊等,至於酒的外盒,提袋等,同樣是包裝設計的範疇,但更必須思考運送、保護、送禮、便利性與價值感等不同層面之問題。
由此可知,Whisper模型主要的任務是語音辨識並將它們轉成英文,雖然支援98種語言,但僅於不到10種的語言中可達到強大的ASR能力。
Open AI表示,他們最初設想這些模型應該最適合AI研究人員,協助他們研究現有模型的穩健性、泛化性、能力、偏見或限制,但隨後發現,Whisper應該也適用於打造ASR解決方案的開發者,特別是用在英文語音辨識上。
Open AI也期望Whisper模型的轉錄能力可用來協助改善無障礙工具,儘管Whisper模型無法直接進行即時轉錄,但開發者也許可利用這些模型開始接近即時的語音辨識及轉錄應用,或是帶來實際的經濟影響。
https://www.ithome.com.tw/news/153196
高價位跟低價位的示波器又有何差異?
示波器是一種能夠顯示電壓訊號動態波形的電子測量儀器。它能夠將時變的電壓訊號,轉換為時間域上的曲線,原來不可見的電氣訊號
專業客製化禮物、贈品設計,辦公用品常見【L夾】搖身一變大受好評!
採用PVC0.2白色軟皮料印製,4色印刷加上表層防刮油墨,另也可選表層上亮膜。
如何將貨櫃屋變身活動展場空間?
金誠貨櫃屋設計,結合生活理念、發揮無限的創意及時尚的設計,顛覆以往「貨櫃」給人骯髒、簡陋、四方無聊的印象、打造出獨一無二的展示空間。
飲水機設備有哪些?
步步經營服務始終如一於雲嘉南地區,建立優質的飲水機之品牌