2016年12月7日 星期一
【美新社訊】美國科技巨頭 Amazon(AMZN)與人工智慧晶片新創公司 Cerebras Systems 周五宣布達成合作協議,雙方將整合各自的AI晶片技術,在 Amazon Web Services(AWS)推出新的AI算力服務,旨在加速聊天機器人、程式開發工具以及各類AI應用。
AI推理算力成新戰場
此次合作的核心,是共同打造面向AI推理(Inference)的算力架構。
在新方案中,AI計算流程被拆分為兩個關鍵階段:
預填充(Prefill):將用戶輸入的自然語言轉換為AI計算所需的Token
解碼(Decode):AI生成最終答案並輸出結果
亞馬遜表示,其自研的 Trainium3 AI晶片將負責預填充階段,而Cerebras晶片則專注於解碼階段,兩者將部署在AWS數據中心並透過亞馬遜定制網絡互聯。
Cerebras挑戰AI晶片霸主
估值約 231億美元的Cerebras,正試圖以不同於GPU架構的AI晶片設計挑戰 NVIDIA 在AI算力領域的主導地位。
今年稍早,Cerebras還與 OpenAI 簽署 100億美元晶片供應協議,為其熱門聊天機器人提供算力支持。
Cerebras執行長Andrew Feldman表示,透過AWS平台整合後,「從個人開發者到全球大型銀行,只需點擊一下即可使用Cerebras算力。」
AI產業正從「訓練」轉向「推理」
業界普遍認為,AI市場正在出現一個重大轉折:
過去AI算力需求主要集中在模型訓練,GPU表現突出;
但隨著AI工具用戶規模迅速增長,推理算力需求正快速爆發。
許多企業開始意識到,GPU雖然適合訓練大型模型,但在需要低延遲、高響應速度的推理場景中並非最佳方案,因此正積極尋找多元化晶片供應來源。
AWS強調性價比優勢
亞馬遜表示,該AI服務預計將在今年下半年正式上線。
公司認為,Trainium系列晶片在成本效益方面具有優勢,未來的 Trainium3 與 Trainium4有望在性價比上持續領先市場GPU方案。
目前雙方尚未披露合作的具體交易規模。
Copyright@since2016 chinesenewsusa.com All Rights Reserved