科學(xué)家打造“變分偏好學(xué)習(xí)”技術(shù)助力保護少數(shù)群體用戶利益

打開文本圖片集
娜塔莎·雅克是美國華盛頓大學(xué)的助理教授。此前在美國麻省理工學(xué)院讀博期間,她曾開發(fā)一種語言模型微調(diào)技術(shù),后被用于OpenAI使用到基于人類反饋強化學(xué)習(xí)訓(xùn)練的產(chǎn)品中。
同時,她還曾在谷歌DeepMind和谷歌大腦等公司有過實習(xí)經(jīng)歷,也曾擔(dān)任過OpenAI學(xué)者導(dǎo)師。在博士后期間,娜塔莎師從目前論文有著16萬多次引用量、谷歌學(xué)術(shù)指數(shù)為175、被人稱為“頂會狂魔”的美國加利福尼亞大學(xué)伯克利分校謝爾蓋·列文教授。(剩余2351字)