數位關鍵字171.從臺大到矽谷：他如何打造讓AI訓練效率翻倍的開源神器？

Update: 2025-01-25

Description

近年來ChatGPT等大型語言模型蓬勃發展，但訓練這些AI模型需要耗費大量運算資源與開發成本。本集數位時代創新長黃亮崢James邀請到Liger Kernel專案創辦人徐秉倫Byron，分享如何透過開源方案讓AI訓練更有效率。

他提到：

1.AI模型訓練的硬體需求：以目前最受歡迎的開源模型LLaMA為例，需要數十台甚至上百台AI Server的頂級顯示卡，同時運算的GPU可能破千甚至上萬片。

2.Liger Kernel的優化成果：透過底層最佳化，讓訓練速度提升20%、記憶體使用減少60%。以OpenAI訓練GPT-4的一億美金成本來計算，這樣的優化可為企業節省約兩千萬美金。

3.開源專案的三大優勢：
・建立社群讓全球專家免費協助開發
・獲得不同專業領域的技術支援
・有助於人才招募並建立企業形象

4.GPU軟硬整合的發展方向：Byron建議臺灣可以投入HPC（High Performance Computing）領域，特別是在GPU kernel層級的最佳化，以及終端推理、小型模型等特殊晶片的應用開發。

Byron分享了他從在臺大電機系到Berkeley深造，最後在LinkedIn工作的經歷。他強調，開源專案不僅能幫助工程師展現實力，更可能成為前往國際企業工作的跳板。透過開源貢獻，臺灣工程師有機會被國際企業看見，獲得更好的工作機會。

對於未來發展，Byron指出AI正從預訓練階段進入後訓練時代，如何讓模型在特定領域達到更好的效能將成為關鍵。他建議臺灣可以善用在硬體領域的優勢，投入GPU運算優化與推理引擎的開發，在全球AI產業鏈中扮演重要角色。

Comments

Top Podcasts

The Best New Comedy Podcast Right Now – June 2024 The Best News Podcast Right Now – June 2024 The Best New Business Podcast Right Now – June 2024 The Best New Sports Podcast Right Now – June 2024 The Best New True Crime Podcast Right Now – June 2024 The Best New Joe Rogan Experience Podcast Right Now – June 20 The Best New Dan Bongino Show Podcast Right Now – June 20 The Best New Mark Levin Podcast – June 2024

In Channel

EP230. 加碼美國1000億美元只是第一回合，台積電再來還有哪些難關要過？ ft.台積電前研發處長楊光磊

2025-03-0601:14:04

Web3大西進59. 清邁出差沒現金靠加密貨幣拯救！專訪《天下》記者林麗珊【記者這樣看幣圈】系列特輯

2025-03-0441:21

記者茶水間156.OPPO如何打造最薄摺疊機？一支手機要價6.1萬，值得嗎？

2025-03-0322:17

東京在線EP04_ 在日本開餐飲店鋪前必聽的實戰經驗談，走入東京澀谷享用台式小火鍋 ft.沸点株式会社 Alex Chen

2025-03-0329:33

數位關鍵字177.別讓AI搶走你的飯碗！設計師擁抱AI的關鍵思維大公開

2025-02-2831:47

EP229. 先進封裝為何台灣獨大？晶圓級(CoWoS)和扇出型(FOPLP)封裝差別與機會各是什麼？ ft. Counterpoint研究副總監劉景民

2025-02-2637:32

塊轉WEB3_108. 享受更自由的交易！去中心化交易所為何深受幣圈大佬喜愛？Feat. NuDEX

2025-02-2524:46

記者茶水間155.「比上帝更有錢」量化交易到底是什麼？只用腦迴路特別的聰明人、報酬超高卻不怕資金短缺，你不知道的量化交易秘密大公開！

2025-02-2425:40

矽谷在線34. 給下一輪台灣創業者的備忘錄六: 和創投第一次見面，要談什麼？ ft. Acorn Pacific Ventures 普通合夥人謝忠高博士

2025-02-2437:28

數位關鍵字176.AI 讓顧客愛上你！全通路行銷與精準互動的智慧革命

2025-02-2149:46

EP228. 先進製程是台積電原罪，還是原力？如何走出白宮烏雲帶動Chip Taiwan供應鏈新軍？ ft.數位時代記者孫嘉君

2025-02-1934:01

Web3大西進58. 咦！你怎麼這樣交易？專業交易員和散戶有何差別？擺脫交易迷思不踩坑

2025-02-1835:54

記者茶水間154.福利熊長紅十年、還登上跨年舞台？「福利熊之父」拆解企業IP心法

2025-02-1722:47

東京在線Ep3_ 讓日本吹起漢方旋風，征服日本百貨通路的漢方新創 ft.Daylily 王怡婷 Eri Wang

2025-02-1747:53

數位關鍵字175.揭開開源 AI 的迷思：開放原始碼與開放權重的認知拉鋸戰

2025-02-1401:12:48

EP227. AI能解哪些台灣痛點？台灣能貢獻什麼AI價值？ ft.工研院副總經理暨產業科技國際策略發展所所長林昭憲、Appier共同創辦人暨執行長游直翰

2025-02-1240:35

塊轉WEB3_107. 《WEB3+》首場Live Podcast！聊聊2025有哪些 #區塊鏈應用大趨勢？feat. XREX

2025-02-1117:25

記者茶水間153.電子書大戰開打！博客來、momo發布閱讀器，誠品推平台，如何拓展閱讀經濟新版圖？

2025-02-1023:35

矽谷在線33. 科學方法協助新創在美國行銷和商務拓展 ft. Taiwan Next基金會執行長謝凱婷新創負責人陳麗心

2025-02-1035:10

數位關鍵字174.從 DeepSeek 開源看半導體市場震盪！NPU 將如何重塑 AI 運算格局？

2025-02-0730:30

00:00

1.0x

數位關鍵字171.從臺大到矽谷：他如何打造讓AI訓練效率翻倍的開源神器？

數位時代 Business Next

We and our partners use cookies to personalize your experience, to show you ads based on your interests, and for measurement and analytics purposes. By using our website and our services, you agree to our use of cookies as described in our Cookie Policy.

#box-pro-ellipsis-174137868684575{-webkit-line-clamp:2;}數位關鍵字171.從臺大到矽谷：他如何打造讓AI訓練效率翻倍的開源神器？

數位關鍵字171.從臺大到矽谷：他如何打造讓AI訓練效率翻倍的開源神器？

數位時代 Business Next

數位關鍵字171.從臺大到矽谷：他如何打造讓AI訓練效率翻倍的開源神器？