近期,机器之心从与OpenAI有联系的个人那里获取了重要信息:Slack平台上已无Jason Wei的活动记录。至于他是否已经加入了Meta公司,目前这一情况还需要进一步的核实。这一消息在人工智能界迅速引起了广泛的关注。
知名科学家背景
Jason Wei,作为OpenAI的著名科学家,在AI大型模型的技术思维链(CoT)领域扮演了核心角色,并做出了卓越的贡献。他在麻省理工学院完成了博士学位的学业,并在谷歌公司进行了为期三年的研究工作。在此期间,他参与了包括PaLM、BLOOM、Flan - T5在内的多个重要项目的研发任务。在 Google Scholar 的官方网页上,他的研究成果得到了广泛的引用,引用量总计已超过七万七千次。
入职 OpenAI
2023年2月,Jason Wei加入了OpenAI,担任了推理模型o1和深度研究模型相关的工作。在其任期内,他积极倡导思维链提示理念,并参与了指令调优初步研究项目的协同领导。此外,他亦与Yi Tay、Jeff Dean等知名学者合作,共同撰写并发表了多篇文章,这些文章深入探讨了大型模型在涌现能力方面的研究进展。
爆料后的回应
消息一经发布,Jason Wei 并未立即作出回应。相反,他选择在推特上发布了一篇内容详尽的博客文章。在这篇文章中,他详细描述了非对称性的验证步骤,并且对“验证者”这一原则进行了深入的剖析。他着重指出,在强化学习(RL)领域内,“同策略(on-policy)”的状态至关重要。为实现对前辈研究成果的超越,必须探索全新的研究途径。同时,他强调,研究者应勇于承担风险,这样才能从环境中获取相应的回报。
同策略 RL 启示
Jason Wei指出,在进行强化学习时,他主张应积极寻求探索,而非简单效仿他人的成功路径,并直接从环境奖励中汲取经验。他还补充说,相较于其他研究者,他更倾向于对海量数据进行细致分析,并实施消融实验,以全面掌握系统各组件的功能。
Hyung Won Chung 贡献
Hyung Won Chung 是该项目的核心成员之一,在OpenAI任职期间,他深入参与了多项关键研究项目。在2024年9月的o1预览版发布、2024年12月的o1正式版推出以及2025年2月的深度研究中,他发挥了至关重要的作用。除此之外,他还负责了对Codex mini模型的训练工作。
分享洞见受好评
Hyung Won Chung的科研成果显著,他多次在关键论坛上发表见解,例如在斯坦福大学的CS25讲座中,他的演讲受到了广泛的认可。他的观点与经验对行业的发展产生了极为重要的引领作用。
若Jason Wei确实从OpenAI离职,转而加入Meta,这一关键的人事调整将如何作用于两家公司在人工智能战略布局上的决策?我们期待着广大读者对此发表见解和讨论,并衷心邀请各位为本文点赞及转发分享。