查看: 103|回复: 0
|
阿里推出新人工智慧模型 可在手機上處理視頻及音訊
[复制链接]
|
|
阿里巴巴集團控股有限公司發佈了其「通義千問」(Qwen) 系列中的一款新型人工智慧模型。據該公司介紹,這款模型能夠處理文本、圖片、音訊和視頻信息,而且運行效率頗高,可直接在手機和筆記型電腦上使用。
據《網易新聞》報導,目前這款新模型已在 Hugging Face 和 GitHub 上公開發佈,預計將被用於構建所謂的AI智能體。比如,它可以通過即時音訊描述,幫助視障人士在周圍環境中辨別方向。
報導指出,自今年大力投入人工智慧技術領域以來,阿里巴巴一直以驚人的速度推出人工智慧產品。在DeepSeek於1月份引發廣泛關注後的幾天內,這家中國電子商務和雲計算領域的龍頭企業就推出了不同版本的Qwen(通義千問Tongyi Qianwen)模型。本月初,該公司又發佈了其人工智慧助手夸克應用程式的新版本。
當然,阿里巴巴並非唯一一家開發多模態模型的人工智慧研發企業。OpenAI 和字母公司(Alphabet)旗下的谷歌,都推出了能夠處理文本、音訊等不同類型輸入信息的生成式人工智慧工具。週二,OpenAI進一步拓展其功能,為 ChatGPT增添了更高級的圖像生成能力。
阿里巴巴在聲明中稱,其新款 Qwen2.5-Omni-7B 系統在語音理解和生成方面展現出了極高的性能。
這家由馬雲聯合創辦的網路公司計畫在人工智慧和雲計算網路方面投入比過去10年更多的資金。隨著模型的不斷演進,對計算能力的需求也在持續增長,阿里巴巴希望成為那些致力於開發人工智慧,並將其應用於實體企業的重要合作夥伴。
DeepSeek聲稱僅花費數百萬美元就構建出的強大模型,對OpenAI形成挑戰,自此中國科技領軍企業迅速向市場推出了一系列低成本的人工智慧服務,對 OpenAI和谷歌等公司的高端產品造成了衝擊。
儘管目前尚不清楚這些人工智慧產品是否能夠與西方人工智慧研發商的前沿系統相媲美甚至超越它們,但這些新的選擇無疑給美國領先企業的商業模式帶來了更大的壓力。 |
|
|
|
|
|
|
| |
本周最热论坛帖子
|