科大訊飛表示,其LLM完全在華為平臺上進行訓練
科大訊飛表示,其擁有唯一完全在自主研發的計算平臺上訓練的大型語言模型(LLM),該平臺與華為共同開發,這標志著人工智能行業在面臨美國限制的情況下在追求自給自足方面又邁出了一步。
科大訊飛董事長劉慶峰表示,盡管中國大部分LLM都以包含美國組件的計算平臺為基礎,例如英偉達的圖形處理單元(GPU),但在美國政府已基本切斷中國獲取最先進芯片和人工智能技術的渠道之際,科大訊飛決心在“自主開發、可控”的基礎設施上訓練LLM。
劉慶峰在科大訊飛發布其升級版星火模型的儀式上表示:“我們能走多遠,取決于我們是否擁有自主開發的、可控的基礎能力來支撐(人工智能發展)。”
劉慶峰在主題演講中指出,美國對LLM開發技術的限制,凸顯了中國開發自主人工智能訓練計算基礎設施的必要性。美國的制裁限制了某些技術向中國的出口,最明顯的是近年來推動人工智能熱潮的英偉達GPU。
劉慶峰表示,該公司星火模型是在“飛星一號”計算平臺上進行訓練的,該平臺基于華為Ascend計算解決方案。
如今華為Ascend AI芯片在中國市場迅速流行,江蘇鯤鵬升騰生態創新中心首席運營官王濤本月在南京世界半導體大會期間表示,在一些測試中,Ascend 910B芯片的性能在訓練LLM時可達到NVIDIA A100的80%至120%。
分析人士表示,昇騰解決方案是中國迄今為止在開發本土人工智能基礎設施方面取得的最佳成果。隨著國有企業訂購昇騰支持的項目,這些企業也獲得了越來越多的支持。
然而,華為硬件仍然缺乏NVIDIA Cuda平臺那樣活躍的開發者社區,“如果不能解決這個問題,華為趕上英偉達的機會就很小。”
在星火4發布會上,劉慶峰表示,新模型的功能可以與GPT-4 Turbo相媲美,GPT-4 Turbo是Open AI八個多月前推出的最先進模型之一。
據介紹,星火4已經在醫療等多個業務場景中得到實際應用,幫助醫生和患者進行診斷和治療。
原文來自https://www.93913.com/101811.html