6月27日这场盛会，千余企业家探讨啥？AI元年有何新预判！？

6月27日，在合肥举办的“正和岛2025案例共学年会暨AI+先行者创新大集”活动持续进行中，以“向新力”作为核心议题，众多企业家齐聚一堂，共同深入交流AI时代背景下的企业组织转型以及商业结构的演变。

在此次会议中，科大讯飞公司董事长刘庆峰发表了主题为《推动生产力解放，激发想象潜能——探讨通用人工智能技术的最新发展及其代表性应用》的杰出演讲。

在交流过程中，刘庆峰预测，今年将成为全民AI以及全行业AI的崭新起点。鉴于美国对高端算力芯片的限制措施，中美两国在大模型竞赛中的差距已缩小至3至6个月，未来将难以出现明显的代际差异。他强调，相较于以往，实现国产自主可控的需求更为紧迫，我们务必在国产化平台上坚定不移地推进通用人工智能的发展。

以下是刘庆峰在正和岛案例共学年会上的演讲全文，特此呈现给读者，其中部分内容已进行删节处理。

口述：刘庆峰科大讯飞董事长

编辑：明瑞

来源：正和岛（ID：zhenghedao）

大模型在高考中的表现

我想与各位探讨一下人工智能的进展，特别是以大型模型为核心的通用人工智能技术的最新动态及其应用领域。

当前，人工智能技术的广泛应用正极大地释放了各行各业的生产潜能，从而使得人们能够拥有更多的时间去从事那些充满创意与趣味的活动。

今日，众人皆忙碌、辛劳，各行各业应如何运用人工智能的力量，从这极度紧张、饱和的工作状态中解脱出来，投身于更有价值的事务，憧憬更美好的未来，这正是我们在2023年5月6日推出的科大讯飞星火1.0版本时所坚守的核心宗旨。

现今，众人借助人工智能各施其能，从事各自最擅长的领域，而科大讯飞的理念始终未变，即致力于通过人工智能技术的进步，切实提升生产力，激发创造力。

这项技术发展得如何？人们对于人工智能大模型在高考中的表现非常关心。最近几天，高考成绩已经揭晓，这是广大学生经过十年不懈努力学习，首次迎来了人生中最为重要的时刻。语文考试落幕之后，在作文解析环节，上海报业集团旗下的界面新闻报道迅速邀请了两位在高考教学领域拥有丰富经验的资深特级教师，他们针对国内六家主流的大规模语言模型进行了高考作文的评估，这些模型包括DeepSeek、豆包、文心一言、通义千问以及腾讯元宝。

讯飞星火在比赛中脱颖而出，荣获了冠军，其作文得分高达60分满分，而我们团队也取得了53分的好成绩。针对高考英语科目，6月9日作文题目一经公布，新京报便迅速展开了评测。在20分的满分标准下，讯飞星火以19.5分的高分脱颖而出。

在首届供应链博览会上，李强总理与我相见后，他首先说道，我们中华民族在创作诗歌、绘画等传统文化方面表现不俗，但在自然科学领域，我们究竟取得了怎样的成就？这才是国家真正迫切需要的。

讯飞星火在数学领域的表现究竟如何？6月8日，高考数学卷一成绩公布之际，IT之家便对包括6家主流大模型以及美国最新发布的OpenAI-O3在内的多个模型进行了测试。

OpenAI-O3在数学、科学和编程领域实现了显著进展。在今年高考数学一卷的满分150分测试中，有7家模型参与了比拼，其中讯飞星火和DeepSeek两款模型的表现尤为出色，分数均超过了140分。

讯飞星火是4月20日推出的版本，而DeepSeek则是在5月28日发布的。值得一提的是，DeepSeek并不支持多模态功能，相比之下，讯飞星火却具备了这一优势，它能够通过OCR技术直接处理数学题目，这一点相当出色。

在本次评测中，我们得以观察到现今大型模型在处理理科问题方面的能力状况。值得一提的是，高考数学试题的命题是严格保密的，考生无法提前进行针对性训练。因此，这一评测充分展现了大型模型在数理逻辑推理方面的实际表现。不仅是在高考数学领域，在国内大型模型在诸如国际奥数、美国各类竞赛以及英语、数学、物理等学科的表现同样出色。

今日，我们对于大型模型的期待远不止于高考成绩的优异，讯飞致力于教育事业，期望借助大模型技术实现试卷批改的精确度提升，并向孩子们推荐更加精准的学习资源，从而使他们学习更加愉悦，心理更加健康。其目标在于助力我们共同打造一个更加美好的未来。

在同期，该领域的数学成绩未曾超过110分，但短短一年间便显著提升，预计来年有望逼近满分。依现有进展来看，不出两年，该大模型的能力有望超越诺贝尔奖级别。事实上，去年诺贝尔物理学奖与化学奖均颁发给了专注于人工智能与科学交叉研究的AI4S团队科学家。

今年是全民AI元年

今天，AI到底发展到了什么阶段？

去年，人工智能行业吸引了超过千亿美元的创业投资，此数额尚不包括英伟达、微软、谷歌等科技巨头的巨额投资计划。相较前一年，投资额增长了80%，这一增速在当前全球经济充满不确定性的环境中显得尤为突出。

我国算力规模已突破72.53万匹，同比增长74%。大模型的招投标活动更是增长了数倍。至去年春节前夕，我国生成式人工智能的规模已达到2.49亿，相当于全国人口的17.7%。

从技术进步的视角分析，大型模型的应用已经步入了一个至关重要的节点。每次重温杰弗里·摩尔的《跨越鸿沟》一书，都能获得深刻的启发，至今它仍被硅谷视为创业领域的经典读物。每当一项新技术问世，起初的先驱者仅占人群的2.5%，而那些具有远见卓识的长期投资者和热衷于技术的极客则占据了13.5%。只有当这两类人群成功过渡，我们才能进入实用主义用户的阶段。

为何这种跨域现象的统计数据必然是16%？这个比例意味着在大众中，相互间的技术影响已达到一定密度。举例来说，在每桌8至10人的聚餐中，总会有至少一位在使用新技术，进而影响周围的人。无论是语音识别还是手写识别等新技术的进步历程，都曾经历过这一阶段。而现在，大规模模型的应用也大致达到了这一水平。

2025年标志着全民AI和全行业AI时代的开端，很多人多少都尝试过下载过这些大模型的应用，对这些应用的功能有所了解，并对它们在生活与生产领域引发的变革有了认识。

大规模模型代表了人工智能在迈向通用人工智能领域中的一个显著里程碑，其特点可以从以下几个角度进行划分：

一是运算智能。机器能存会算，这是支撑认知智能发展的基础；

二是感知智能领域。机器具备听音能言、观物能识的能力。语音识别技术已超越专业速记员的水平；语音合成技术可为中央电视台提供配音服务；机器翻译的准确率已超过99%的大学六级考生，且已通过国家翻译师资格考试。人类无法直接感知的红外线、紫外线，以及听不到的超声波、次声波，机器都能感知到。

第三点，我们关注认知智能领域。自2017年国家发布新一代人工智能发展规划以来，科大讯飞承担了建设我国唯一认知智能国家重点实验室的重任。伴随着认知智能在多模态交互、具身智能等方面的不断突破，运动智能与之相辅相成，共同促进了机器人行业的迅猛发展。展望未来，具备知识储备、自我进化、陪伴互动以及学习能力的人工智能机器人将走进亿万家庭，从而进一步加速认知智能的飞速进步。

从技术层面来看，大模型的发展历程可分为数个阶段：2017年，推出了生成式预训练技术；紧接着在2018年，GPT1.0问世，该预训练技术借助强化学习，使机器在数学考试中的成绩从约100分提升至140分；随后，技术领域从强化学习和慢思考模式拓展至世界模型领域，以更贴近真实的方式去理解客观世界，因此技术得到了持续且迅速的发展。

在成长历程中，讯飞语音合成技术不仅为中央电视台提供配音服务，同时还能支持超过80种语言的翻译功能，其应用范围广泛，涵盖了200多个国家和地区。这些系统的参数设置在几百万到两千万人次之间。

大模型指的是一种什么样的存在？当初GPT发布时，它拥有1750亿的浮点参数，这种规模庞大的深度神经网络，通常拥有千亿以上的参数量。通过使用海量多元多模态的文本、视频、语音等数据对其进行训练，机器在一定程度上能够展现出跨领域的智慧。其核心功能涵盖文本创作、语言辨识、知识查询、逻辑分析、数学运算、编程技能以及跨模态交互等多个方面。

2023年，长三角人工智能产业链联盟携手中科院人工智能产学研联盟，共同研发了一套针对通用人工智能的评估体系及技术标准。该体系涵盖了七大评估维度，并提出了400多个具体的细分任务类型。截至目前，这一评估体系已扩充至超过1000项细分任务。

这些能力将孕育出专家级别的虚拟助手，彻底变革了传统的编程模式，充当科研的加速器角色，对科研的整体范式进行了颠覆，并且对信息的分发、获取、内容的制作以及人机交互的方式产生了根本性的改变。

中美AI大模型差距，缩短至3到6个月

高考在中国被视为观察人工智能技术进步的一个视角。与此同时，在全球范围内，诸如国外数学竞赛等活动同样广泛运用了人工智能技术。然而，就整体技术发展趋势而言，在以GPT框架预训练和强化学习为标志的大规模模型竞赛中，中美两国之间的差距正在逐渐缩小。

美国各大领先企业，如OpenAI和Anthropic等，正逐渐将目光转向数学、物理等领域的杰出人才，致力于将其培养成为人工智能领域的专家。正因如此，在科学模型的构建方面，美国展现出独特的风格。

中国市场竞争激烈，“百模大战”使得头部企业数量锐减，仅剩5至10家。去年9月13日，OpenAI发布了深度思考模型，该模型在数学和深度推理方面实现了显著进步。今年1月，我们推出了一个规模仅为13B的深度推理模型，鉴于算力限制，我们不得不研发体积更小的模型，以确保国产算力能够承受。

自那时起，DeepSeek、豆包、阿里等公司展开了激烈的角逐，它们在通用大模型的竞赛中相互追逐，中美双方的实力已经十分接近，二者间的差距仅限于3至6个月，未来绝对不会再出现明显的代际差异。

科大讯飞刘庆峰全家福_科大讯飞刘庆峰最新演讲_

在此情境下，美国对我们实施了哪些限制？随着DeepSeek的问世，美国感到极为震惊。此前，他们普遍对中国的大规模模型及科技创新实力存在误解，然而如今目睹中国的发展步伐与美国的差距如此之小，因此美国随之加强了对于算力的管控。

自2022年10月7日起，美国对我国的大型模型及人工智能芯片实施严格限制，具体措施包括限制单芯片的计算能力不得超出312T，以及限制大模型间的数据交换带宽不得超过400G。随后，美国政府进一步扩大了限制范围，宣布全面禁止销售，即便是经过裁剪的芯片版本也一概不提供。

今年的美国新规意味着，对三星、台积电等芯片代工厂生产的十几纳米级别芯片实施了出口限制，而此前我们依赖的堆叠工艺已无法将芯片尺寸降至7纳米，导致所有相关途径均被封堵。

在这种条件下，我国在大型模型及人工智能基础设施领域与美国之间的差距仅限于3至6个月，然而，我们算力的实际支撑能力究竟如何？我想向各位传达的是，在提及的高考语文、英语及数学的主流模型中，仅有科大讯飞一家的模型是依托国产算力进行训练的。而DeepSeek以及豆包等企业则完全依赖英伟达芯片进行训练，这使得国产算力训练的大模型面临着巨大的压力。

2022年11月30日，GPT正式发布之际，美国针对中国的芯片实施了一系列严格的限制措施。在这一背景下，华为的910B芯片的算力达到了113T，与美国同类产品相当。然而，关于带宽的规定却限定在400G以内，而中国的实际带宽仅为392G。

从理论上看，我国有望实现A100或A800芯片性能的80%至90%。然而，即便在相同的硬件技术条件下，我们在对大型模型进行训练时的效率却仅有30%。

华为公司由任正非领导，成立了史上最高级别的特种部队。截至2023年10月，我们共同将训练成效提升至95%。基于此，2024年1月30日，我们成功发布了首个依托国产算力进行训练的千亿级大模型——讯飞星火3.5，为国家提供了坚实的保障。

去年9月13日，DeepSeek R1的深度思考模型技术引起了广泛关注，得益于我们丰富的经验和扎实的基础，短短一个月内，我们便成功实现了所有技术的复现。

在使用国内算力进行训练的过程中，我们原本算法的效率从95%骤降至25%，为此我们投入了超过三个月的时间，最终将效率提升至73%。这一成果在高考中得到了验证。如今，中国在大型模型训练领域，必定是在全国产算力支撑下，以更低的算力消耗和更小的模型参数，打造出可与全球同类技术相媲美的成果，这才有了我们持续发展的信心。

如何实现这一目标？首先，我们的模型规模达到70B，若某机构需全面运用R1的强大功能，则需配备两张高性能显卡。然而，R1在深度训练方面存在局限，此时需自行采用开源模型进行训练，这或许需要多达512张显卡。相较之下，我们采用星火X1，仅需32张显卡即可。OpenAI的O1模型规模更为庞大，可能需要上万的显卡。我们之所以能够实现这一突破，关键在于中国本土的算法创新。

迅速作出反应的是快速思考，而深入分析则是通过不断验证，最终得出最优方案。然而，V3与R1是独立进行训练的，这意味着企业需要部署两个系统。我们在此领域内首次引入了一种新框架，企业只需安装一套系统，即可灵活地在快速思考与深度思考之间进行切换，需要快速决策时就选用快速模式，需要细致分析则转为慢速模式。

正因这些技术革新，我们得以在自主掌控的通用平台上迅速培育出符合行业需求的模型，进而深入企业应用领域。一般来说，一项新技术要实现大规模应用，其技术门槛需达到89%至90%的准确度标准。

当摩托罗拉的手写识别技术达到了89%的识别率，人们便纷纷开始使用这项功能；随着手机上语音识别准确率提升至90%，用户数量也从几十万激增至数亿，而现在，语音识别的准确率已经攀升至98%。

大模型的典型应用场景

今日，通用大模型在使用初期常显现出幻想现象，并带有诸多“迎合型”性格特点，其平均准确度大约在78%上下。相较之下，行业特定模型在经过精确训练后，准确度能够提升至80%以上，且场景界定明确，准确度更是可以高达95%。

在这个基础框架中，我们需要明确的是，是否能在完全自主可控的平台上培养出我们的基础模型。以教育领域为例，由于我们拥有这样的模型，便能够将机器的思维流程转变为教师的教学思维流程，以问题为核心导向，打造出中小学教师助手，这些性能指标相较于GPT4.5有着明显的优势。

在医疗行业，我们研发的大规模模型成功通过了国家执业医师资格考试，其表现超越了99%的考生。此外，我们与著名的心脏病学专家葛均波院士共同研发的心内科应用，以及与安徽医科大学校长翁建平教授携手的糖尿病专业应用，均取得了显著成效，已达到或超过了主治医师的专业水平。深度推理技术的问世，使得今年发布的大模型在众多专业领域取得了卓越的进展，这主要得益于一套高效的行业训练工具链。

今年两会结束之后，最高人民检察院采纳了人工智能技术，借助大型模型来促进司法公正，实现了类案推荐、法条匹配、量刑辅助以及文书自动生成等十项功能。我们运用了专业的模型，其准确率已提升至83%，在众多领域甚至超过了90%。就在前几天，工业和信息化部在能源碳排放评估的测试中，大型模型在48位参赛者中排名第五，成功进入了前20%的行列。

这些技术进步推动了大模型在多个领域的广泛应用。

在教育界，大型模型能够扮演口语、科学、编程讲师和心理辅导者的角色。在医疗行业，它们已经协助完成了近4亿份电子病历和10亿次的辅助诊断，纠正了170万起不恰当的诊断和超过9000万次的不合理处方，同时也在积极研发个人健康助手。在翻译界，大型模型的表现已超越绝大多数六级考生，其应用范围已从旅游拓展至商务谈判及合同签署等领域，特别是在应对噪音干扰、远距离交流、离线翻译以及专业翻译方面，展现出卓越的能力。

除此之外，我们亦研发了图像文字创作及视频剪辑软件，这些工具能够适应多种语言环境，有效帮助农副产品和工业制品拓展国际市场。

与岛屿相关联的领域，例如在翻译方面，大型模型在大学英语六级考试中的表现已超越99%的考生。如今，翻译机的功能已不再局限于出国旅游、日常对话、点餐等，它还能支持商务洽谈和合同签署。即便在没有网络的情况下，它也能支持英语、俄语、法语、德语等多种语言。

场景之一，中国企业在海外设立工厂，这些工厂即便在嘈杂的环境中也能有效降噪，并且实现远程交流，这无疑是一项重大突破。另外，我们研发了一系列工具，无论是农产品还是工业产品出口，只需提供几张图片和具体要求，便能迅速生成文案或视频，并且能够支持所需国家的语言。

我们推出了行业内首个同声传译的大型模型，通过录制一段中文内容，便能自动转换为多种语言，并且能够与视频中的文字和手势实现同步。在本年度的东盟博览会上，我们正式推出了专门针对东盟地区电商市场的自动翻译服务支持平台。

在办公环境中，致力于成为每位员工的得力助手。在今天的会议中，若携带讯飞办公本，便能实现全程录音，并能自动将录音内容转换为文字，进而自动生成会议纪要及待办事项。此软件的功能究竟有多强大？据统计，今年其总用户量已突破9000万大关。即便是在仅有三五个人的小型会议中，通过手机录制后台，也能迅速归纳出每位与会者的观点，并形成全面性的总结。

另外，我们携手中国移动共同推进，不少人在驾驶或行走途中，时常会接到上级的工作来电，启用此功能后，通话一旦结束，会议记录便会自动生成，这些实用功能受到了大家的热烈欢迎。

在工业界，当前的大规模模型已广泛应用于研产供销服管等各个环节。我们借助前端配备的麦克风阵列和语音、视频芯片，使设备具备了“听、说、看、认”的能力。同时，通过整合后端的大模型，设备还能实现“理解”与“思考”的功能。

海尔在家电行业率先推出了大型模型招标，我们成功赢得了这一项目，随后还与TCL、美的等众多家电品牌展开了紧密的合作。2022年，我们在家电芯片的出货量上实现了超过1300万片的业绩，到了2024年，这一数字增长至4000多万片，并且预计今年出货量将超过6000万片。

人机物万物智能互联的时代即将降临。基于这一时代背景，无论是推动产业数字化进程，还是实现数字产业的转型，实际上都离不开代码作为桥梁，将现实世界与虚拟世界紧密相连。如今，借助软件的力量，显著提升效率的做法，已逐渐成为行业内的普遍共识。

今年，计算机与软件领域的就业率和薪资水平首次呈现下降趋势；同时，OpenAI宣布GPT成功通过了谷歌的二级程序员考核；该职位年薪高达18万美元；这标志着编程技术的显著提升。

再来看几个案例，讯飞公司内部的智能黑板以及智能课堂等系列产品，原本从Windows操作系统过渡到Linux系统需要耗时三个月进行开发，而现在这一过程仅需一个月即可完成。

这种效率的增强，不仅促进了软件开发的进度，还降低了技术难度，让那些不擅长编程、缺乏技术知识的员工，仅需了解岗位需求，便可下达指令，借助模型自动完成相关工作，进而不断孕育出新的智能体，极大地拓宽了创新与创造的潜力，不再受限于技术障碍，其核心在于我们是否拥有丰富的想象力。

在招投标领域，借助人工智能的力量，我们不再仅仅撰写文章，体验乐趣，更能够深入细致地分析那些庄重严肃的标书。我们能够准确把握标书的核心要求以及评审的标准，随后对标书进行自动审查，以识别是否存在造假或雷同的情况。此外，系统还能提供自动替换的建议、搜索预警信息，甚至生成降价谈判的策略。近期，我国国家发改委作出决策，计划在全国范围内推广该模式。在合肥市的招投标中心实际应用中，这一大模型显著提高了专家评审的一致性，将其从原先的75%提升至高达95%。

今日，大模型的应用领域广泛多样，但其中最核心的任务是将通用型的大模型有效转化为特定行业的模型，并确保其实际应用，这过程中必须克服众多关键挑战。

必须掌握构建算力的方法，无论是依托国内平台还是采用国产与英伟达混合的算力调度系统。同时，还需了解如何高效整理数据，借助自动化工具将效率提高至24倍。至于模型训练，企业需根据具体需求选择是使用参数量仅为几千万的小型模型，还是采用参数量高达千亿的大模型，这需根据实际情况进行针对性调整，确保应用场景中的安全性。最终，通过直观可见的现场演示和详实的数据统计，有力地展示了大型模型在实际应用中的显著成效。

只要向智能体提供一段文字或一个语句，它便会将此事拆解为若干个子任务，识别出所需调用的工具，搜寻必要的信息，再将每个任务的结果串联起来，从而达成整个目标，这样的机制即称为智能体。

以中国石油天然气集团公司为例，超过五千名员工投身于岗位技能提升竞赛，逾千支队伍成功研发了两千余个智能系统，其中一百多个项目荣获奖项。目前，这些智能系统已在中石油的百余家办公场所及三百余项生产和销售环节中显现出显著的实际效益。

在当前的大模型时代，并非仅仅是单一企业的角逐，而是整个生态系统的发展与兴盛。我们需确保我们的技术能够服务于更多企业，同时鼓励更多创新者投身其中进行开发。

讯飞人工智能平台在去年一年迎来了170万新增的开发者团队，并推出了近100万款新应用。值得关注的是，这些新应用中，以往以社交、娱乐为主的应用占据了多数，但如今，54%的应用已经转向与工业领域相关。

在这一轮红利期，我国的大规模模型与美国之间的差距已大幅缩短，仅为3至6个月。在行业应用的领域，我国有望率先享受到这一红利。

作为产业的推动者和革新者，我们必须重视源头技术的创新。相较于美国，我们的差距正在逐渐缩小。然而，从理性的角度来看，这实际上是原创技术与追赶技术之间的差距。我们在学习并借鉴它，而它本身是原创的。若我们无法在人工智能的源头基础上进行长远规划，那么在未来竞争中获胜的可能性将大大降低。

前天我们展开了对合肥这座城市的特性探讨，该城市正着手构建基于GPT框架的人工智能计算技术，探讨其与量子计算的深度融合，以期从根本上消除算力方面的忧虑。同时，我们还讨论了如何运用人工智能技术来推动可控核聚变的发展，有望将原本耗时10天的模拟实验缩短至仅需1天，并且准确率从93%提高到了97%。一旦可控核聚变技术能够将1度电能转化为超过1度电的能量输出，实现能量的正向增益，那么能源问题将得到根本性的解决。

我们热切期望与各位一同，于正和岛年度盛会中展开深入探讨，携手展望未来，激发生产潜能，拓展创意思维。感谢各位！

排版 | 小元