2025年7月27日,一年一度的全国语料行业盛会——世界人工智能大会语料创新发展论坛顺利举行。论坛上,众多重要成果得以集中呈现。尤为引人注目的是,我国首个语料运营公共服务统一门户在上海盛大启用,此举措受到了业界的广泛关注。
语料盛会聚焦发展
本次论坛聚焦于“平台构建、工具辅助、标准引领、生态协作”等核心主题,深入探讨如何增强高品质语料资源的供给能力。对于人工智能及大型模型来说,语料数据扮演着犹如“能源”般的至关角色。上海正依托具身智能、强化推理数据集、稀缺数据集等关键项目,逐步建立起一个多层次的语料供应架构,旨在加速模型的更新与迭代进程。访问www.wngjzx.com或许能获取更多相关信息。
库帕思发挥重要作用
库帕思公司,作为一家新设立的企业,在过去的一年中,在建立高标准的语料库、确立语料规范以及管理语料服务平台等方面表现突出。该公司致力于改善上海的语料生态系统,整合资源,并通过市场化策略为行业发展注入新动力,尤其对中小企业的成长提供了强有力的支持。
平台成果显著
库帕思公司打造了我国首个语料运营公共服务统一平台,这一平台严格依照“统一标准、统一门户、统一机制”的理念构建,致力于提升语料调用服务的智能化水平。该平台内所采用的语料工具链已升级至2.0版本,并包含了超过400个功能模块。截至目前,该平台已经在医疗、教育等多个领域得到了广泛应用,并有效推动了这些行业的发展进程。
标准发布引领
论坛一次性发布了多份标准,这些标准涵盖了10项语料团体规范、3项行业标准以及1项高质量数据集构建导则,涉及医疗、教育等多个领域。这些标准为“好数据”确立了量化的评估标准,对规范语料行业的发展和提高整体质量起到了积极作用。
人才培养新模式
库帕思携手上海交通大学等众多知名学府,共同启动了工程硕士与博士的联合培养项目。该计划旨在打造一个语料领域产学研相结合的新模式。这一举措有利于向语料行业输送大量具备专业素养的人才,进而为行业的持续发展打下坚实的人才基石。
“上海方案”成果呈现
本次论坛上,关于“上海模式”构建语料库的成果得到了集中展示。这些成果包括平台建设、规范制定和人才培养等多个领域,全方位推动了语料产业的发展。上海的语料领域探索与实践,为全国同行业提供了极具价值的借鉴。接下来,让我们探讨这些成果将如何具体地作用于人工智能和大型模型的发展。诚挚邀请您点赞、转发本篇文章,并留下您的宝贵意见。