發(fā)布公測后的 60 天,ChatGPT吸引了 10 億用戶。
2022 年,全球醫(yī)療行業(yè)市場達 5000 億美元。
乍看之下,這兩個數(shù)字的關系有點遠。然而正如最近A16Z發(fā)布的文章里指出的:醫(yī)療是目前僅存的,還未被技術(shù)大規(guī)模改變的重要領域。而更易落地、有著超過 10 倍效率提升的AI技術(shù),就是這個突破口。
可以說,對ChatGPT背后的生成式模型來說,積累了海量優(yōu)質(zhì)數(shù)據(jù)、迫切需要降本增效的醫(yī)療行業(yè)很可能成為其最集中、來得也最快的爆發(fā)點。
硅星聞對話了硅谷投資人張璐,聊了聊生成式模型在醫(yī)療領域的巨大可能性及挑戰(zhàn)。
關于張璐:
張璐是硅谷新一代領軍基金的代表人物, 2022 年被福布斯評選為全球華人精英Top 100 行業(yè)翹楚, 2023 年入選Business Insider美國最 佳 25 名女性早期投資人及100 Women in Finance榜單,也是達沃斯世界經(jīng)濟論壇“全球青年領 袖”。
2015 年,張璐創(chuàng)立 Fusion Fund,現(xiàn)管理近 4 億美元資本,專注醫(yī)療和深科技領域投資。張璐帶領的投資團隊以斯坦福背景為主,匯聚了硅谷杰出企業(yè)家、投資人以及美國工程院院士等,已投資公司有多家上市和收購退出。
醫(yī)療也許是生成式AI最合適的應用窗口
對于大模型來說,優(yōu)質(zhì)、龐大的數(shù)據(jù)量是它能夠得以存在、不斷進化的最重要基礎之一。
而在這一點上,醫(yī)療領域一騎絕塵。
“在醫(yī)療行業(yè)中,數(shù)據(jù)基礎、數(shù)據(jù)質(zhì)量、數(shù)據(jù)專業(yè)度都非常高。而生成式人工智能的出現(xiàn),也會幫助我們更快更好地將人工智能應用在醫(yī)療領域推廣?!睆堣幢硎?。醫(yī)療領域是她創(chuàng)立的Fusion Fund的一個重要投資方向。
另一方面,醫(yī)療是關乎全人類健康、生存的重要行業(yè),從其龐大的市場規(guī)模、以及全球為醫(yī)療進步投入的大量人力、物力,不難看出,未來這個行業(yè)也會不斷有著精進技術(shù)、降本增效的需求。僅看美國市場,醫(yī)療行業(yè)的規(guī)模就達到了 4000 億美元。
兩相結(jié)合,醫(yī)療行業(yè)很可能成為生成式模型最重要的落地窗口。
從去年底開始吸引了全球關注的ChatGPT,將率先改變醫(yī)療領域中“非臨床”的部分:在《紐約時報》六月發(fā)布的報道中,詳細介紹了一位田納西的全科醫(yī)生如何在類似ChatGPT的AI助手的幫助下,將每天兩小時以上的醫(yī)療資料整理工作,縮減到 20 分鐘。
在張璐看來,目前生成式模型在醫(yī)療領域的各個垂直方向都有重大影響,包括數(shù)字化診斷、數(shù)字化治療、數(shù)字化生物學,將帶來巨大產(chǎn)業(yè)創(chuàng)新及效能提升的機會,最終幫助解決醫(yī)療領域的“三A問題”,也就是accessibility(可得性)、affordable(低成本)、accuracy(高精度、個性化)。在此之外,值得關注的領域還包括藥物創(chuàng)新、臨床試驗等。
硅谷投資人、Fusion Fund創(chuàng)始人張璐
對張璐而言,這些領域中最令她興奮的是生成式人工智能在數(shù)字生物學的應用,尤其是它與AlphaFold結(jié)合后,未來對于數(shù)字生物學及它包含的合成生物學的推動。合成生物學不僅在制藥領域有巨大的創(chuàng)新價值,同時在化工領域、食品領域也有非常廣泛的應用。“通過生成人工智能和數(shù)字生物學的結(jié)合,可以幫助我們更快發(fā)掘定義新型蛋白質(zhì)的設計,提高準確率和效率,從而對于藥物創(chuàng)新研發(fā)產(chǎn)生巨大的貢獻。”張璐表示。
今年早些時候,生物技術(shù)公司Insilico Medicine(Insilico)宣布已完成INS018_ 055 階段II臨床試驗首 次劑量投放,這是世界上首 個使用生成式人工智能發(fā)現(xiàn)和設計的抗纖維化小分子抑制劑,現(xiàn)已開始第二階段臨床試驗。
其次,臨床實驗(clinical trial design)也有機會,包括如何設計不同的臨床實驗——也就是通過生成合成的數(shù)據(jù),去幫助挑選最合適的、最 低成本的臨床實驗、挑選患者等;在這個過程中,生成式模型也可以用于進行模型模擬、測試用戶數(shù)據(jù)、合成多樣化臨床數(shù)據(jù)等。
過去人工智能已經(jīng)開始應用于藥物發(fā)掘,然而一直沒有爆發(fā)。這是因為發(fā)掘?qū)用嫫鋵嵅⒎浅杀咀?高的地方,最 高的地方是臨床。
“畢竟臨床需要大量樣本,價格又非常高昂,導致很多藥廠在研發(fā)藥物上受到限制——如果疾病的病人數(shù)量不夠,可能就很難覆蓋臨床成本,藥廠也沒有動力進行開發(fā)。
“當這兩個階段可以應用生成式人工智能后,就會對藥物發(fā)掘帶來重要的改變:真正從根本上大規(guī)模降低藥物研發(fā)成本,推動新藥研發(fā)?!?/p>
除了這些新型的方向,生成式人工智能在人工智能驅(qū)動的個性化診斷、醫(yī)療影像層面等領域也有非常廣泛的應用。比如張璐于數(shù)年前投資的Subtle Medical正是一個生成式AI應用于醫(yī)療影像的典型范例,最近剛被CB Insights選入頭個生成式AI全球 50 強榜單。通過深度學習技術(shù),深透醫(yī)療能夠完成包括MRI、PET等醫(yī)學圖像的增強,是醫(yī)療影像領域的頭家生成式人工智能平臺,也開發(fā)了最早獲FDA、CE、NMPA等同時批準的AI醫(yī)學影像產(chǎn)品。
醫(yī)療垂直行業(yè)的數(shù)據(jù)壁壘保護創(chuàng)新
不難看出,生成式人工智能正成為未來醫(yī)療領域的主要推動技術(shù)之一。在這樣的背景下,什么樣的競爭壁壘能夠讓企業(yè)高筑護城河?
“對大模型來說,數(shù)據(jù)是重中之重。而數(shù)據(jù)與數(shù)據(jù)之間,也有著不少差距,很可能對大模型的訓練與應用造成重大影響?!?張璐介紹道,“在目前階段,想要進一步優(yōu)化模型,數(shù)據(jù)的質(zhì)量比數(shù)據(jù)量更重要?!?/p>
比如Chat GPT的飛速進化,離不開全球用戶的大量數(shù)據(jù)訓練;而對于醫(yī)療等垂直領域來說用專業(yè)的、行業(yè)專注的、特定的數(shù)據(jù)重新訓練模型,才能讓模型更加準確、有效、可靠。
正因此,對于在大模型領域的初創(chuàng)的公司或者說所有參與者來說,數(shù)據(jù)的質(zhì)量很可能會成為一個重要壁壘。
“尤其是人工智能在醫(yī)療領域應用的公司,有沒有能力接觸最 高質(zhì)量的數(shù)據(jù)、高質(zhì)量的數(shù)據(jù)庫,這非常關鍵?!?張璐表示。
“在醫(yī)療領域,創(chuàng)業(yè)團隊有自己獨特的data library,也就是各大行業(yè)數(shù)據(jù)、獨特的行業(yè)知識,才能修改和重新訓練這個模型,進行優(yōu)化和調(diào)整,同時通過這個行業(yè)的特定的專業(yè)數(shù)據(jù)去保證模型的準確性。在這個基礎之上,也就形成了一個比較強的技術(shù)和數(shù)據(jù)的壁壘?!?/p>
不難看出,在Fusion Fund的投資策略中,垂直領域應用及獨特的海量高質(zhì)量數(shù)據(jù)都是重要的標準。
以她投資的Subtle Medical為例,他們具有很強的技術(shù)領先性,將技術(shù)應用到整個加州的醫(yī)療系統(tǒng)里面,優(yōu)質(zhì)的數(shù)據(jù)進行初始模型的訓練。后續(xù)在大規(guī)模應用過程中,找到了多個醫(yī)學影像模態(tài)的應用場景、體現(xiàn)了AI技術(shù)的優(yōu)越性,并在美國、歐洲、亞洲大規(guī)模應用,不斷提升模型質(zhì)量。
比如她早在五年前投資的Proscia, 這家公司專注于“AI讀片”,也就是通過AI來提升病理診斷的比較準確度,業(yè)務主要覆蓋治療疾病切片的影像學分析、數(shù)據(jù)整合和云共享。從 2015 年起, Proscia就創(chuàng)建了一個數(shù)字病理云平臺,使用計算機視覺來分析治療疾病的活檢切片和醫(yī)學影像,并為醫(yī)學專家提供每張切片中的病理數(shù)據(jù)。并在 2017 年將這項云技術(shù)跨界應用于治療疾病病理分析,建立了治療疾病病理切片云數(shù)據(jù)庫。
再比如她此前投資的Huma.ai,有著眾多藥廠合作,給藥廠數(shù)據(jù)化人工智能工具,所以擁有大量藥廠內(nèi)部數(shù)據(jù)。如今,它不僅是生命科學和制藥行業(yè)第 一個生成式人工智能平臺,兩年前就開始和Open AI合作,還與行業(yè)頂 尖的數(shù)家藥廠建立合作關系,直接幫助藥廠挖掘內(nèi)部價值。通過Huma.ai的工具,藥廠的科學家可以直接通過人工智能設計臨床實驗的方案去挖掘新藥特性。
近期,Huma.ai發(fā)布了生命科學及制藥行業(yè)的第 一個生成式人工智能平臺??梢钥吹?,這個生成式人工智能平臺已經(jīng)有著優(yōu) 秀服務質(zhì)量:可以直接詢問藥物臨床實驗的設計方案,它有能力給出非常準確的答案。
數(shù)據(jù)隱私成挑戰(zhàn),然而仍舊蘊藏機遇
在機遇、壁壘之外,生成式人工智能在醫(yī)療領域面臨著隱私挑戰(zhàn),或者說所有的領域都是如此,只是醫(yī)療領域?qū)Υ烁用舾小?/p>
“很多醫(yī)療機構(gòu)非常擔心有l(wèi)iability(連帶責任),可能不太愿意分享數(shù)據(jù),這也會限制生成式人工智能在行業(yè)的應用,這個時候就需要另外一個工具——Federated learning,聯(lián)邦學習?!睆堣唇忉尩?。
Federated learning(聯(lián)邦學習)是一種算法,已經(jīng)開發(fā)出來很多年,特點是無需移動數(shù)據(jù),對方可以直接把模型放到這一數(shù)據(jù)上進行訓練。訓練完畢后再拿走模型,所以不需要犧牲數(shù)據(jù)的私,又能獲取數(shù)據(jù)價值,進行商業(yè)變現(xiàn)和數(shù)據(jù)分享。
“目前,聯(lián)邦學習正在快速應用到醫(yī)療領域。比如醫(yī)院想把數(shù)據(jù)提供給第三方的公司,培訓人工智能模型,但是傳輸數(shù)據(jù)可能會承擔風險或者是隱私泄露的責任,如果使用了聯(lián)邦學習,就意味著并未分享數(shù)據(jù),但實際上這些模型可以使用這些數(shù)據(jù)?!?張璐說道。
今年早些時候,NVIDIA發(fā)布了FLARE平臺,為企業(yè)提供了聯(lián)邦學習解決方案:一個強大、可擴展的聯(lián)邦學習基礎設施,使企業(yè)能夠更輕松地管理復雜的AI工作流程,往往包括大規(guī)模的機器學習(ML)模型的訓練和部署。
“未來我們可以看到一個很好的前景,聯(lián)邦學習加生成式人工智能,幫助醫(yī)療領域的很多的大規(guī)模應用快速推進?!睆堣幢硎尽!捌渲兄攸c是解決醫(yī)療系統(tǒng)的數(shù)據(jù)孤島問題——醫(yī)療系統(tǒng)有很多高質(zhì)量的數(shù)據(jù),但是卻都是相對孤立、獨立的。通過聯(lián)邦學習,數(shù)據(jù)孤島問題得以解決,也能讓這些數(shù)據(jù)可以更好的被人工智能以及大語言模型所應用?!?/p>
除此之外,她還指出,生成式人工智能目前面臨著高昂的算力及數(shù)據(jù)成本,未來很可能會出現(xiàn)很多新的技術(shù)在infrastructure(基礎設施)層面上來降低算力成本、數(shù)據(jù)成本。
“包括各大研究機構(gòu)也出了一些新的模式,這些用海量數(shù)據(jù)算培訓出來的模型,再用少量的核心數(shù)據(jù)去優(yōu)化它。”比如Meta-AI template,希望這些不能夠自己建立針對影像的大型語言模型的這些公司,可以用他們的技術(shù)直接去做應用。
不難看出,生成式模型作為工作提升的效率工具,仍舊有巨大的潛力。
“目前的生成式模型帶來的是非常有效好用的工具,然而它也必須要被人去使用。未來醫(yī)療領域,醫(yī)生護士都應該要使用這種新型的工具——因為這是人類的本質(zhì),和其他生物比,人類最 大的優(yōu)勢就在于會使用工具,可以說替代不是說技術(shù)替代人,而是說會使用新技術(shù)、會使用新工具的人,會替代那些不會使用人工智能工具的人。”張璐如此評論“AI代替人”的觀點。
她認為,AI將不斷幫助整個醫(yī)療系統(tǒng)完成效能提升,這一點也在她所投資的該領域企業(yè)中得到驗證。
比如說Fusion Fund旗下被投公司Synaptec,通過人工智能進行醫(yī)療代碼的自動化,節(jié)約醫(yī)生大量時間。
再比如說由成功連續(xù)創(chuàng)業(yè)者創(chuàng)立的Vectara,專注于通過大語言模型去做企業(yè)級的搜索,可以幫助大的公司直接在公司內(nèi)部的數(shù)據(jù)上運行大語言模型進行智能搜索。以及上文提到的Proscia,能通過AI讀片幫助醫(yī)生大大提升讀片分析效率,而非取代醫(yī)生。
“如今人工智能的發(fā)展真真正正驗證了它作為一個非常強大的工具去幫助醫(yī)療工作者提升效率效能的能力,未來持續(xù)幫助他們把時間花在最關鍵的步驟上。”
而這影響力還將繼續(xù)擴展,各個產(chǎn)業(yè)都可以通過它來進行工作效能提升。
“未來生成式人工智能會是一個基礎設施一樣的技術(shù)、一個非常有效的工具,可以預測到在這個基礎上會出現(xiàn)各類應用,并探索各類模型優(yōu)化。在這個過程中,它的準確性、應用的效率性、成本的降低,都是創(chuàng)新關注的方向。”
隨著生成式人工智能帶來的一個非常大的突破和飛躍,這類“零代碼”的AI平臺會廣泛出現(xiàn)在人們的工作生活中。未來,許多擁有優(yōu) 秀數(shù)據(jù)基礎的行業(yè)可能都會面臨人工智能的全面轉(zhuǎn)型:包括保險、物流、金融行業(yè)。
“生成式模型帶來了一個非常巨大的生態(tài),讓我們能夠看到全產(chǎn)業(yè)的人工智能的如何數(shù)字化轉(zhuǎn)型。而且我也相信,未來每個公司都多少要植入人工智能,它就像電力一樣,用電多與少取決于你需要多少,但是所有公司都會使用這樣的‘超 級電力’,加速生產(chǎn)效率和生產(chǎn)力?!睆堣幢硎尽?/p>
(推廣)