上海交通大学干部培训人工智能前沿技术和高质量发展解析（上）-上海交通大学干部培训-红星干部教育培训网

本文介绍了人工智能的定义和分类，包括通用人工智能和专用人工智能，以及它们的具体含义。同时，讨论了人工智能的发展历程，指出虽然大规模预训练模型已经实现了通用性的人工智能，但尚未达到真正的人工通用智能。

以下是干部培训网整编《人工智能前沿技术和高质量发展解析（上）》详情——

一、世界人工智能发展历程和方向——大势所趋

人工智能（Artificial Intelligence，简称AI）是指在机器上实现相当乃至超越人类的感知、认知、行动等智能。按照智能能力的不同，人工智能通常可分为通用人工智能和专用人工智能，或被称为强人工智能和弱人工智能。目前对通用人工智能有两种理解：一种是通用性的人工智能（GeneralArtificial Intelligence，简称GAI）是媒体和社会公众的一般理解，指的是能够处理很多任务的智能 ; 另一种则是人工智能专业领域的准确名称，即人工通用智能（Artificial General Intelligence，简称 AGI），是指在人工智能所有方面都达到人类水平，能够自适应地应对外界环境挑战，完成人类能完成的所有任务的人工智能。

长期以来，人工智能系统都是为了实现特定或专用目标任务的智能，属于弱人工智能或专用人工智能范畴。2018年以来，大规模预训练模型（简称大模型）通过在海量无标注数据上依托强大算力资源训练能适应一系列下游任务，实现了通用性的人工智能（GAI），拉开了通用人工智能的序幕，但当前仍没有达到真正的人工通用智能（AGI）。

（一）人工智能发展历程

人工智能的概念最早于1956年在美国达特茅斯学院召开的夏季研讨会上被正式提出。纵观人工智能近七十年的发展历程，大体上可分为三个阶段。

第一阶段以符号主义逻辑推理证明为中心。该阶段主要研究在形式化表示方法基础上，通过逻辑推理或启发式程序来模拟人类推理能力，解决代数应用题求解、几何定理证明和机器翻译等问题。第二阶段是以人工规则的专家系统为核心。该阶段的研究焦点就是将领域专家的知识归纳成人工规则，进而进行辅助决策，专家系统技术在这一时期得到快速发展。第三阶段是以大数据驱动的深度学习为核心。该阶段有效整合算法、算力和数据，推动人工智能的研究重心从如何“制造”智能转移到如何“习得”智能。2006年，杰弗里·辛顿教授提出“深度学习算法”，为新一轮人工智能的发展奠定了理论和方法基础。2012年，加拿大多伦多大学杰弗里·辛顿教授与学生提出的深度学习神经网络模型 AlexNet 在ImageNet 图像识别挑战赛上以巨大的优势击败了其他非神经网络模型，成为深度学习兴起的标志。2016—2021年，谷歌开发的系列围棋机器人AlphaGo 和 AlphaZero，不仅在比赛中先后战胜了世界冠军李世石和柯洁，后来还取得了擂台赛不败的战绩。同时，该公司研发的 AlphaFold2在蛋白质结构预测问题上达到接近人类实验解析的水平，解决了困扰生物学界50年的“蛋白质折叠”难题。近十年来，基于大数据的深度学习模型和算法得到大规模应用，在机器翻译、智能问答、博弈对抗等领域取得了巨大成功，人工智能进入加速发展期。

以上三个阶段中，前两个阶段的主要思路是设计新的理论和算法，用机器模拟人的智能，尽管在理论方法上取得了进展，但由于目标过高，与应用结合不够，使得人工智能发展几经起伏。第三阶段基于大数据的深度学习技术已成为当前人工智能的主流发展路径，在计算机视觉、自然语言处理、智能语音等技术领域实现了规模应用。其中，计算机视觉是人工智能技术中应用最为广泛的领域。计算机视觉是指通过计算机对图像或视频进行处理，使其能够自动识别、分析和理解图像或视频中的信息。2015年，由微软亚洲研究院何恺明、孙剑、任少卿、张祥雨提出的深度残差学习网络 ResNet 成为计算机视觉领域具有里程碑意义的代表性技术。ResNet 的出现，使得超过上百层的更深层网络可以更有效地进行训练，推动了深度学习技术不断探索能力极限。目前，ResNet 已经成为计算机视觉任务的首选架构，例如图像分类、物体检测和图像分割等。2023年，基于为人工智能作出的基础性贡献，ResNet 的四位作者获得了未来科学大奖。

（二）当前人工智能发展新趋势

2018年以来，大模型首先在自然语言处理领域取得突破，以 ChatGPT为代表的现象级产品拉开了通用人工智能的序幕，引发了新一轮人工智能发展浪潮。当前人工智能发展已由小模型时代迈向大模型时代。

大模型是“大数据 + 大算力 + 强算法”结合的产物，至少具有三个特点：一是规模大，神经网络参数规模要达到百亿以上；二是涌现性，要产生预料之外的新能力，这是人工智能发展近70年来，最具里程碑意义的新特性；三是通用性，能够解决各类问题。

美国 OpenAI 公司的 GPT（生成型预训练 Transformer 模型）系列大模型是当前国际大模型领域的领先代表。2022年11月，OpenAI 发布的人工智能对话大模型 ChatGPT 表现出了惊人的智能水平，能够长时间进行自然流畅的对话，同时还能够高质量撰写几乎任何类型的书面材料，可以完成很多需要创造性思考的任务，一经发布就受到全球用户广泛关注，成为历史上增长最快的消费应用，引发了人工智能的“iPhone 时刻”。

ChatGPT之所以能表现出色，主要归因于几个关键方面的技术和策略。第一，其采用了大规模的训练数据，特别是互联网文本数据，以捕获丰富的知识和语言模式。第二，模型基于高效的 Transformer 架构，该架构通过自注意力机制，能够有效处理输入序列中各位置信息间关联依赖关系，极为适合自然语言处理任务。第三，ChatGPT通过多任务学习，提高了其在多样化问题上的泛化能力和生成能力。第四，模型还针对特定任务进行了微调，以更好地适应和解决特定领域或场景下的问题。第五，通过利用强化学习等技术进行模型调优，ChatGPT 在特定任务上的输出更加接近人类的习惯，进而表现得以进一步提升。这些技术的融合和应用，使ChatGPT成为了文本问答任务中的佼佼者，激发了公众对强人工智能未来发展的无限遐想。

除语言能力以外，大模型也在迅速扩展视觉、听觉、具身（有身体的智能，能与环境进行交互）、行动等其他通用智能能力，在向多模态方向发展的同时，也将逐渐进入现实世界，发展实体智能，引发下一波人工智能发展浪潮。

但是，也应看到，大模型等通用人工智能技术在给世界经济社会发展带来巨大机遇的同时，也带来了难以预知的各种风险和复杂挑战。大模型是高度复杂的人工智能系统，特点是难以预测，当前取得的进展基本上是通过经验模式取得，大模型背后的智能发生和涌现机理尚不清晰，国际社会对如何构建一个安全的人工智能系统仍知之甚少。当前以大模型为代表的通用性的人工智能（GAI）已显现出伦理道德、数据安全等一系列风险，需要加强安全监管。未来，面对伴随着人工通用智能（AGI）的到来可能会引发的人类生存性风险，更需要严加防范。加强通用人工智能治理已成为世界各国面临的共同问题。

随着人类探索通用智能发展路径的越发清晰，全球正处于“AGI”(准强人工智能) 的前夜，处在一个不确定性的状态，未来需要对大模型基础原理、安全与价值观对齐、人工通用智能（AGI）风险控制策略等方面开展深入研究，促进人工智能技术造福于人类。

（三）世界大国加快人工智能战略与政策部署

当前，人工智能已成为国际竞争的新焦点和经济发展的新引擎，世界主要发达国家把发展人工智能视为提升国家竞争力、维护国家安全的重大战略，纷纷出台人工智能规划和相关政策，力图在新一轮国际科技竞争中掌握主导权。

各国从国家战略层面强化人工智能布局。美国围绕人工智能研发和国家安全，陆续出台《国家人工智能研发战略规划》等相关战略和政策，力求巩固其世界领先优势；法国发布《国家人工智能战略》，着力推动健康、交通、环境、国防安全等领域的智能化；欧盟自2010年以来就把实现智能增长作为其三大增长目标之一。2018年4月发布了《欧洲人工智能》，系统地提出了欧盟的人工智能发展战略规划。同月，发布了《人工智能合作宣言》，标志着欧洲人工智能进入合作发展的新阶段；德国通过《联邦政府人工智能战略要点》，提出成为全球领先的人工智能科研场，实现人工智能德国造；英国发布《国家人工智能战略》，从数据获取、人才培养、科技研发和产业应用等方面打造人工智能强国；俄罗斯发布《2030年前人工智能国家发展战略》；日本提出建设“超智能社会5.0”，不仅要提升产业竞争力，还要实现国民生活智能化。

各国竞相加大人工智能研发投入。美国政府2017财年向人工智能非保密项目投入研发经费超过20亿美元，在2022年累计投入达249亿美元，预计2028年投入将破千亿美元；2021财年美国国防预算提案在人工智能研发领域的投资总额为8.41亿美元 , 较2020财年的7.8亿美元增长约8%。法国在2022年前在人工智能项目中投资15亿欧元。韩国提出要从“IT强国”发展为“人工智能强国”，计划在2030年将韩国在人工智能领域的竞争力提升至世界前列。根据预算，相关措施若得以实施，到2030年，韩国将在人工智能领域创造455万亿韩元 ( 约合2.7万亿元人民币 ) 的经济效益。

各国组建新型人工智能研发机构。美国国家科学基金会协同联邦机构，包括国土安全部、国防部、教育部、农业部等，联合成立了25家国家人工智能研究院；欧洲计划建立一所世界级人工智能研究所，在英国等多个欧洲国家设立科研中心；法国提出新建人工智能中心，并组建人工智能研究网络；英国扩建阿兰·图灵研究所，启动数据伦理与创新中心建设，成立新的人工智能技术学院。全球各大人工智能跨国公司和领军企业也在加快布局人工智能研发中心。

各国加紧推动人工智能治理体系建设。联合国自2018年起专门成立了人工智能与机器人中心，研究人工智能的管控问题；美国国会建议成立人工智能安全委员会，负责对人工智能、机器学习的发展和相关技术开展审查；欧盟签署《人工智能合作宣言》，发布《欧盟机器人民事法律规则》，共同应对人工智能在伦理、法律等方面的挑战；2019年起，欧盟持续加强对人工智能应用和治理的关注，于当年4月出台了《可信赖的人工智能伦理准则》，为实现可信赖的人工智能设定了一个伦理框架。

目前，全球人工智能发展正处于由弱人工智能向强人工智能过渡的阶段，人工智能已然成为主导国家战略竞争力的重要支撑和推动科技革命的重要力量。未来，“人工智能+ 高速移动互联”将成为人类社会生活的基本场景。着眼更长远的未来，强人工智能将会带来颠覆性、全局性影响，谁率先实现突破，谁就会掌握未来发展的主导权。如果我国在新一轮人工智能发展中落后，将会在全球竞争中处于不利地位。

二、中国人工智能发展现状和前景——大有可为

“把新一代人工智能作为推动科技跨越发展、产业优化升级、生产力整体跃升的驱动力量，努力实现高质量发展”。2017年，国务院发布《新一代人工智能发展规划》，确立了人工智能三步走目标，将人工智能上升为国家战略。此后，相关部委和各地方政府推动《新一代人工智能发展规划》加快实施，同时，科技界、产业界、投资界协同发力，推动我国人工智能发展进入跨越赶超的关键时期。

（一）我国人工智能基础理论和部分关键技术实现突破，人工智能与经济社会融合不断深入

经过多年的持续研发布局，我国人工智能科技创新体系逐渐完善，智能经济和智能社会发展不断深入，取得显着成效。

一是人工智能基础理论快速积淀。近年来，国内学者在问题求解、演化计算、模式识别、专家系统、智能控制等经典人工智能领域多有建树。特别是在新兴的深度学习理论和推理算法方面开展了大量研究，例如，北京大学提出深度跨媒体学习方法，显着提高了跨媒体检索的准确率；南京大学提出的“深度森林”模型是国际上第一个非神经网络和 BP（反向传播）算法的深度学习方法。在类脑计算方面加强布局，类脑芯片、类脑计算系统、类脑应用等取得积极进展；中国科学院在脑机接口领域取得突破，研发了目前运行最快的头皮脑电（EEG）脑机接口系统；华为公司上线了气象大模型，在一系列气象学家关心的精度指标和极端天气预报中都展现出优势，具有强大竞争力和巨大潜力。

二是人工智能部分关键技术跻身世界先进水平。本轮人工智能技术爆发初期，我国在中文信息处理、生物特征识别、机器翻译、智能处理器、自动驾驶和智能机器人等技术方向上紧跟世界前沿，实现了部分人工智能关键技术突破。麻省理工学院第十七任校长拉斐尔·莱夫评价认为，中国在人脸识别和语音识别等人工智能领域居世界领先地位。主要包含了以下阶段性成果：中国科学院研发推出全球首款商用深度学习专用处理器“寒武纪”芯片，在运行主流智能算法时性能功耗效率大幅超越中央处理器（CPU）和图形处理器（GPU）；商汤科技的图像识别技术、科大讯飞的语音识别与合成技术和语言翻译技术的产业化水平目前处于世界前列，受到国际认可。

在计算机视觉方面也取得重大原始创新。北京大学改写了持续近两个世纪的曝光成像原理，发明了脉冲摄影原理，用比特序列逼近高速光电子流，研制出超高速视觉芯片和相机，实现了超高速、高动态、无模糊连续清晰成像。它建立了脉冲视觉算法体系并研制出超高速系统，采用常规光电器件和芯片工艺实现高超声速过程连续清晰成像和实时跟踪识别。其专利获中美欧日韩授权，有望从源头重塑计算机视觉技术和产业体系。

在人工智能基础软硬件方面，华为发布了基于达芬奇架构的昇腾910和昇腾310两款人工智能芯片，力争打造以芯片为载体、从底层算法到应用开发的完整生态，为全球开发者和企业提供新的选择，也为我国企业提供了安全保障。在此基础上，鹏城实验室推出了“鹏城云脑Ⅱ”和正在研制“鹏城云脑” 下一代设施。“鹏城云脑Ⅱ”是基于华为国产人工智能芯片打造的，作为国内首个全面自主可控的E级智能算力平台，具有国际领先的人工智能算力水平，已经在多个国际榜单上取得冠军。该平台约70%的机时对外开放共享，已支撑近千个国产人工智能模型训练任务与人工智能算法发布，成为我国最重要的开放共享、自主可控的人工智能大模型训练平台之一。而“鹏城云脑”下一代设施将是一款面向6G超宽带通信的智能化工具平台，采用了超大规模、高性能计算的体系架构，在芯片和系统全链条上均按照低功耗来设计，预计在2025年完成。“鹏城云脑”大科学装置将进一步推动我国人工智能国产自主产业生态的发展，必将成为支撑新一代智能网络通信创新研究的重大科学基础设施。

三是人工智能加速与千行百业融合发展。智能制造方面，正在大力推进智能制造工厂建设，已实现产品个性化定制；智能医疗方面，已研发人工智能医学影像产品，可用于筛查早期食管癌，其检出率高于医生借助内窥镜平均检出率；智慧城市方面，“城市大脑”已应用于杭州城市交通管理，可有效减少区域通行时间；智能物流方面，人工智能技术被应用于改进物流系统，分拣效率超过人工分拣的10倍多；智能交通方面，首都机场采用人工智能技术实现在50秒内完成1700架次航班的停机位安排，降低了飞机延误率，停机位利用率提高10％；智能安防方面，广州利用人脸识别技术帮助发现及抓获犯罪嫌疑人。

四是人工智能发展的创新生态初步构建。科技部在自动驾驶、城市大脑、智能医疗、智能语音、智能视觉等领域已构建起国家级开放创新平台，助力中小企业科技创新，推动行业技术进步和产业升级。某智能语音平台开发者团队数量超过80万家，已形成了覆盖技术研发、基础平台、物联网、智能硬件等完整人工智能产业链；某自动驾驶开放平台合作伙伴超过120余家，形成了全球规模最大的自动驾驶生态，覆盖了包括整车厂、零部件厂商、出行服务商、初创企业、通信企业、高校和地方政府等产业链各个环节。同时，人工智能领域的众创空间、孵化器、加速器快速发展，创业孵化体系逐步完善。

（二）中美引领大模型发展，我国语言大模型与美国差距正在逐步缩小，视觉、多模态、具身等新一代大模型有望实现齐头并进

目前，国际大模型领域已形成美国引领，中国紧跟的格局。根据中国科学技术信息研究所2023年5月发布的《中国人工智能大模型地图研究报告》，从全球已发布的大模型分布来看，中国和美国大幅领先，超过全球总数的80%，中国在大模型数量方面位居全球第二。

中国大模型研发呈现蓬勃发展态势。截至2023年5月已发布79个大模型，大部分为语言大模型。

国际上的基础大模型主要分为语言、视觉、多模态等主要类别。其中，在语言大模型方面，OpenAI 的 GPT 系列和谷歌 PaLM 2等已形成领先优势，我国已研发出智源“悟道·天鹰”、百度“文心”、华为“盘古”、“鹏城·脑海”、阿里通义等语言大模型，但与海外顶尖水平仍有一定差距。随着人工智能模型开源生态的繁荣，中美大模型的差距将逐步缩小。

在视觉和多模态大模型方面，我国有望扭转跟随局面，实现中美齐头并进。视觉大模型上，智源研究院创新研发路径，首创“上下文图像学习”“以视觉为中心”作为核心建模思想，用图像理解、解释、输出图像，研发出视觉通用多任务模型 Painter，对 Painter 模型针对物体分割任务作出优化后，研发出国际首个利用视觉提示完成任意分割任务的通用视觉模型 SegGPT，已成为与 Meta 发布的基础图像分割模型 SAM 齐名的国际视觉大模型关键里程碑成果。多模态大模型上，智源研究院研发出首个打通多模态输入到多模态输出的统一多模态预训练模型 Emu，超越了此前 DeepMind 的多模态大模型Flamingo，刷新八项性能指标，并且模型能力覆盖图像与文本的生成及视频理解，能完成任意图生文和文生图的多模态任务。中国科学院自动化所研发出的三模态（图文音）大模型“紫东太初”目前已具有全模态能力，达到国际先进水平。

（三）我国人工智能整体发展已进入全球第一梯队

美国智库信息技术与创新基金会（ITIF）2019年发布《谁在人工智能竞赛中获胜：中国、欧盟还是美国？》报告，从人才、研究、企业发展、应用、数据、硬件六个维度，系统性对比中美欧人工智能技术创新与生态构建能力。2021年1月，ITIF 发布该报告的2021年更新版本，指出美国仍然保持着巨大的总体领先优势，但中国得分相比于2019年有明显增长，总排名反超欧盟上升至第二位，仅次于美国。我国的应用场景丰富，相比国外有一定优势。但是，报告也显示，中国在人工智能研究、人才、企业发展等方面与美国相比差距明显。

根据英国媒体机构Tortoise Media发布的2023年全球人工智能指数排名，目前人工智能领域综合情况全球排名前三的国家分别是美国、中国和新加坡。其中，中国在运营环境和政府战略方面领先于美国，在基础设施、科研、发展、商业紧随其后，但在人才方面与美国差距较大。

另据中国科学技术信息研究所2023年7月发布的《2022全球人工智能创新指数报告》，按照2022年人工智能创新指数得分排名，将46个参评国家分为四大梯队，其中，第一梯队国家得分为50分以上，只有美国和中国进入，中国人工智能创新指数已连续三年保持全球第二的水平。

（四）我国人工智能发展的优势条件

目前，我国在人工智能技术上持续深耕、快速积累，在政策、数据和市场应用上具有一定优势。

一是强有力的战略引领和政策支持。2017年《新一代人工智能发展规划》发布后，开启了我国人工智能发展的系统部署。《规划》发布后，各部门和地方积极推动落实，国家发改委、教育部、科技部、工信部等部门相继出台多项举措，北京、上海、天津、重庆、广东等近20个省市出台了人工智能规划和行动计划，纷纷加大研发投入，设立研发机构，制定人才引进、财税优惠等配套政策，带动企业加快智能化步伐，产学研协同推进人工智能发展的格局初步形成。

二是海量的数据资源提供支撑。我国互联网数据资源快速增长，截至2022年底 , 网民规模超10.6亿，我国移动电话用户规模为16.83亿户，其中5G 移动电话用户达5.61亿户。网民使用网络购物的比例超过55％，手机支付用户规模达到5.27亿人。特定应用领域数据规模庞大，医疗门诊总量每年达到81.8亿人次，每年有3亿人次做计算机断层扫描（CT），10亿人次做数字化成像（DR）；公共和私人领域装有1.76亿个监控摄像头；年度快递业务量超过400亿件；每年国内旅游人数超过50亿人次。

三是丰富的应用需求孵化应用场景。我国具有全球规模最大、较为成熟的互联网市场，人工智能在互联网领域的应用空间广阔。我国作为全球制造业大国，各细分领域都面临转型升级，对人工智能应用具有巨大需求。我国新型城镇化加速推进，城镇规模不断扩大，利用人工智能改进城市基础设施、提升城市治理水平潜力巨大。同时，我国老龄化问题日益突出，居民收入水平不断提升，消费结构加快升级，对医疗、教育、养老等智能化产品和服务需求迫切。

四是具有潜力的青年人才快速成长聚集。我国加大对人工智能人才培育。2018年，国家自然科学基金委新设人工智能一级学科代码 F06，加大对人工智能基础研究的支持；国务院学位办2022年底新设智能科学与技术一级学科，全国各大高校加快布局人工智能学院，扩大本科和研究生培养规模。我国人工智能学者数量大幅增加。根据清华大学AMiner数据库分析，截至2023年6月，全球人工智能学者数量共计16.4万人（这里“人工智能学者”指在国际人工智能领域顶级会议或顶级期刊上发表过至少一篇论文的科研人员），其中，我国人工智能学者约3.6万人，占比21.9%，与美国人工智能学者数量（3.7万人）相当。在学者成果产出方面，2022年，我国人工智能论文总量和高被引论文数量已居世界第一，并且我国人工智能专利数量略微领先于美国和日本。

以上是《人工智能前沿技术和高质量发展解析（上）》的内容，后半部分见下篇。更多干部培训时政讯息请关注【新闻中心】-【时政要闻】。

文章内容

人工智能前沿技术和高质量发展解析（上）