現行的生成式人工智慧機器人多是以大型語言模組訓練而成,但日本人工智慧新創公司 Sakana AI 昨(21)日宣稱,發明了一種新的自然選擇(天擇)訓練法,靈感來自於演化,訓練起來更快、更省成本,可望再掀新一波 AI 爭霸戰。
日經亞洲報導,Sakana 公布了三款生成式 AI 模型,分別是大型語言模型、圖像轉文字模型、圖像生成模型。其採用的演算法是將三種開放原始碼 AI 模型作為「父母」,透過不同方式「養育」逾百名「子女」。接著,選出表現最優的子女,再生成下一代。藉由不斷重複此過程,創造出數百代後輩,最後再選出佼佼者。
這種 AI 模型「結合」(merging)技術早就存在,但需要開發者手動處理。Sakara 的創新之處在於,研發了「進化式」演算法,可自行擇選最佳模型,達成最優化成果。
根據 Sakana,三款模組一天內就「養成」,成本「微不足道」。若以傳統方式訓練如此規模的語言模組,恐得耗去數百萬美元。Sakana 驕傲指出,其大型語言模型解決日本數學問題的能力,可是比 OpenAI 的 GPT 3.5 強大的多。
目前的流行趨勢是將 AI 訓練成通才,可處理如文字與影音等各式各樣的任務。Sakana 則是主打「專才」,將模型訓練成具有特殊專業,再彼此協作解決複雜問題。
過往的訓練方式太昂貴、需要晶片大廠如輝達(Nvidia)的精密 GPU 處理器。新創公司往往必須籌資數十億美元,才能與 Google、Meta、OpenAI、Microsoft 等巨擘一爭高下。這新穎的物競天擇法,可望激起新一波生成式 AI 競爭。
2023 年在東京創立的 Sakana,日文意思是「魚」。創辦人包括 Google 前研究員 David Ha 與 Llion Jones,以及曾投資 AI 新創公司、任職 Mercari Europe 執行長的 Ren Ito。
As a AI lab, we wanted to apply our method to produce foundation models for Japan. We were able to quickly evolve 3 best-in-class models with language, vision and image generation capabilities, tailored for Japan and its culture.
Read more in our paper https://t.co/YtH7wEQHf1 pic.twitter.com/yGR6CTUeuR
— Sakana AI (@SakanaAILabs) March 21, 2024