Pokee AI 公开测试版现已正式上线!
你好,您能听见我的声音吗?在北京时间上午10点钟,来自大洋彼岸的Pokee.ai公司创始人朱哲清通过电话与我们取得了联系。此时,他身处美国西海岸,而当地的时刻是前一晚的7点钟。
他的表述是,最近他非常忙碌,忙于推出 Agent 产品 Pokee AI 的公开测试版,忙于处理第一轮融资的相关后续事务,忙于将核心的4人团队扩展至7人,即便如此,他还抽空在小红书上庆祝了自己的29岁生日,并在评论区耐心地回答了网友们的提问。
或许“忙碌”并非近期才显现,回溯至200多天前,那时的我同样处于繁忙之中。那时我正忙于创立Pokee.ai,忙于与超过100位投资人探讨如何运用强化学习模型来打造AI智能体,同时也在为产品的内部测试做着充分准备。
回溯至2017年,依旧处于忙碌之中。那时,我正忙于在斯坦福大学攻读强化学习领域的博士学位。同时,我也在Meta公司工作,负责领导团队,将强化学习技术应用于广告竞价、自动内容生成等多个业务领域,为公司的收入增长做出了显著贡献。
朱哲清似乎对“忙碌”习以为常。然而,他坦言,尽管创业生活充满忙碌,但这却为他带来了更多思考的空间,这无疑是一种全新的感受……
自去年10月起,创业活动便拉开了序幕,我所创立的公司名为Pokee.ai,这个名字来源于“小口袋”的寓意,意在打造一个便捷、决策力出众、能够即时响应并解决问题的模型。公司的整体发展方向是致力于打造一款交互性强、个性化定制、效率高的AI智能代理。
相较于以 LLM 为核心的主流 AI Agent 构建模式,Pokee.ai 则以 RL 作为核心,正如朱哲清所言,在 Pokee 的系统架构中,LLM 主要扮演着人机交互界面的角色,类似于「UI 层」,主要负责理解用户的意图,而实际的决策和任务执行则完全依赖于 RL 结构来完成。
然而,那是在去年的十月,OpenAI 尚未推出 o1,未能将强化学习推广至更广泛的公众,而 DeepSeek 也尚未引发全球范围内的热烈追捧。
在与众多投资者交流的过程中,他们普遍认为Pokee.ai这一领域过于遥远不切实际……然而,时至今日,它已逐渐从“非共识”转变为“共识”,Pokee.ai亦步入了新的发展阶段。
最新资讯显示,Pokee.ai 成功获得了1200万美元的种子投资,该轮融资由Point72 Ventures主导。同时,Pokee AI的公开测试版本已经正式对外发布。
本周,Pokee 正式公测前夕,《机器之心》杂志对朱哲清进行了访谈,以下是双方交流的精彩片段:
Pokee.ai在去年十月正式诞生,目前其产品已进入公测阶段,并且成功完成了种子轮融资。这样的发展速度,是否在您的预期之中呢?
朱哲清表示,整体进展迅速,自去年10月Pokee.AI成立以来,仅用了不到8个月时间,便完成了从概念验证到通用Agent框架的搭建,再到现在的产品公测及融资消息的公布。之前设定的目标是在今年上半年完成产品的首轮公测并成功获得种子轮融资,如今这些目标均已实现,整体上达到了预期目标。
与Meta相比,我的生活和工作节奏大约提升了4至5倍,然而,对于我来说,生活与工作的步调并没有发生显著变化,反而我拥有了更多的时间用于思考。过去,我在工作之余还要攻读博士学位,那时生活节奏极快,一周的工作时长可能超过100小时。如今,尽管每周的工作时长依旧超过100小时,但用于思考的时间却有所增加。
机器之心:你所从事的工作颇为独特,在您的记忆中,投资者最常提出的问题有哪些?
朱哲清表示,起初与投资者交流时,总体感觉是他们未能理解为何选择一条与众不同的路径来打造 Agent。那时,强化学习(RL)尚未走红,DeepSeek 也尚未问世。首次向投资者阐述我们的目标——将一个强化学习系统打造得如同通用操作系统一般——他们普遍认为这纯属异想天开。
机器之心:谈及开发AI代理的初衷,您曾表示Pokee.AI追求的并非模仿人类完成任务,而是力求在特定任务中超越人类在策略选择与规划方面的能力。这与当前热门的ASI(人工超级智能)理念是否有所相似?
朱哲清认为,关于 ASI 和 AGI 的定义边界相当不清晰。从某种角度来看,我们或许已经达到了 ASI 的水平。例如,如果提供一篇包含一百万个 Token 的文章,人类需要花费较长时间才能阅读完毕,但模型仅需几秒或几十秒即可完成,从这个角度看,它已经超越了人类智能。
我们距离 Agent「GPT 时刻」还有多远?
机器之心:您认为一个通用的智能体应当有哪些显著特征?
朱哲清指出,一个通用的智能代理,其核心优势在于无论身处何种情境,面对何种挑战,只需提供相应的指令,便能高效地完成任务,无需预先设定所需的具体工具。
我们的构想是,一旦客户提出一个提示,明确表示其所需完成的任务,该公司或开发者无需亲自介入,只需将此提示信息直接交付给Pokee,Pokee便会依据提示启动相应的工具,解决问题,并将处理结果直接反馈给公司或开发者。随后,后者可以将这些内容以更佳的展示方式转达给客户。
机器之心:这或许可被视为 AI Agent 的“GPT 时刻”吧?目前,我们正处在哪个发展阶段呢?
朱哲清表示,这确实是一个完全无需人工设置的AI智能体,正是我们追求的目标。目前,AI智能体在运行时所需的配置工具量相当庞大,必须与MCP服务器相匹配,寻找相应的工具,而可供在提示下添加的工具种类有限,且不能随意增加,否则整体训练量将显著上升。
机器之心:因此,当初选择创业是基于对那些不足之处的洞察,那么Pokee.ai又是如何应对的呢?
朱哲清表示,我们的目标在于探索一种方法,使得第三方开发者能够在几乎无需进行大量开发工作的前提下,成功构建 AI Agent,无论是采用无代码(No Code)还是低代码(Low Code)技术。No Code 指的是Pokee直接执行一个prompt,获取工作流后,可以直接复制粘贴应用于众多不同场景;而Low Code则是指他人通过我们的接口,将他们希望解决的问题以prompt的形式提交,进而解决问题,无需告知我们所需使用的工具。
机器之心:那么,以强化学习为核心的AI智能体与以大型语言模型为核心的AI智能体之间,它们各自的特点和区别又表现在哪些方面呢?
朱哲清指出,目前众多大型语言模型(LLM)都采用了强化学习技术。然而,我们开发的强化学习模型在工具调用方面与常规LLM模型存在显著差异。具体而言,这种差异体现在动作空间(Action Space)上。常规LLM模型的动作空间仅限于Token,而我们的强化学习模型则可能采用工具作为动作空间,这些工具凭借自身的泛化能力,直接参与AI Agent的构建过程。
机器之心:在您对通用智能体进行阐述时,您对其提示信息的精准度提出了较高要求。然而,似乎并非所有人在交流时都会提出问题。对此现象,您有何见解?
朱哲清表示,当前用户在使用Pokee时确实会遇到这样的困扰,尽管已经提供了相应的提示,但输出的内容却与用户期望不符。究其原因,在于用户提供的提示可能与他们的真实意图有所出入,往往所想与所说并非同一回事。
理解意图被称为对齐,这实属不易,原因在于缺乏明确的基准,且人们表达方式各异。若要确切把握用户意图所指,必须与个体的长期记忆建立联系,方能探寻到所谓的基准。
若我需对这条路径的行进方式作出评价,首要任务是解决实际问题,接着需对用户的非训练数据进行定制化处理,随后还需深入理解和实现同步。整个过程大致可分为三个阶段——决策能力的提升、对Memory的个性化定制以及同步对齐。
机器之心:能否举例说一下?
朱哲清提到,以往在投资者试用我们的产品时,曾提出一个请求——能否帮我草拟一篇LinkedIn帖子?那么这里的“草拟”究竟是指“仅帮我完成撰写但不需发布”还是“完成撰写后立即发布”?
要真正理解他的本意,必须观察他在过去对员工或同事说出这句话时的具体表述,以及对方的回应。通过分析他们之间的对话,我们可以确定“draft”一词的确切含义。这无疑是一项相当繁琐的任务,它要求具备高度个性化的记忆能力才能得以实现。
机器之心:那当前处于哪一步?
朱哲清:整个行业第一步都还没做完,更别说二、三步了(笑)。
机器之心:基于此,该怎么做?
朱哲清认为,这个问题既富有意义又具有远见,然而从商业化的视角来看,它并非首要考虑的事项。我们应当首先关注的是解决问题的可行性。待问题得到妥善解决之后,我们再进一步探讨如何更深入地理解这些问题。
据我所知,Pokee的设计理念是将小型语言模型作为人机交互的界面,这相当于一个“用户界面层”,主要负责解读用户的意图。而实际的决策和任务执行,则完全依赖于强化学习框架来完成。基于这样的架构,大家对于prompt的期望值是否相当高呢?
朱哲清表示,这个问题确实相当复杂。因此,他经常强调,LLM的表现越出色,我们的工作也会越高效。尽管我们的AI Agent的核心是RL而非LLM,但我们与LLM并不构成竞争。如果仅仅在纯语言领域无法实现更大的进步,我们也会遇到发展的瓶颈,届时将难以全面准确地理解用户的真实意图。
创业,一个孤独的漫长旅程
机器之心:自你从Meta离职投身创业至今已过半载,你认为从事职业与创业之间有何差异,其中最深刻的体会又是什么呢?
朱哲清表示,两者间的差异显著,期间他亦曾经历挣扎,但这并非源于时间安排或体力消耗,创业之路本身就是一条模糊不清的道路,甚至可以说原本就并无明确路径。创业者心中所想成为何种道路,它便会呈现出何种形态。尽管作为公司CEO,表面上似乎拥有相当的话语权,可以决定公司的走向,但实际上可做出的决策数量并不多,必须对公司及团队成员负责。
在大型企业中,员工拥有多次做出选择的自由,甚至有机会调换团队,若某项工作进展不顺,便可转向其他领域。
据我所知,该团队自组建以来直至今年四五月间,始终维持着四人组成的核心阵容。目前团队规模如何?是否已有计划进行人员扩充?
朱哲清表示,目前团队由7名成员组成,未来计划再吸纳两三名新成员。不过,在收入规模实现显著增长之前,团队规模预计不会突破10人。
机器之心:所以也可以说 AI 时代的创业更为「轻量级」?
朱哲清表示,在AI时代,对于模型和产品的精雕细琢,实际上并不需要大量的人力。实际上,人员一旦增多,反而可能导致工作进展缓慢,行事显得犹豫不决。
机器之心:你们办公室位于哪里?日常工作状态是怎样的?
朱哲清:我们没有办公室。
机器之心:那平时开会也是线上?
朱哲清提到,团队成员分布广泛,有的在西雅图,有的在湾区,还有的在新加坡,他们并不身处同一地点。此外,我们都是Meta的成员,对远程工作模式已经习以为常,即便没有实体办公室,工作效率依然很高,同时也能更好地平衡工作与生活。目前,我们每天都会通过线上会议的方式,共同商讨并决定需要完成的事项。