网站首页 | 网站地图

人民论坛网·国家治理网> 前沿理论> 正文

我国人工智能技术优势与产业化发展态势

摘 要:人工智能技术的发展和产业化应用正推动着各行各业的变革。基础技术如机器学习、深度学习、自然语言处理、计算机视觉,以及云计算等,是人工智能产业化的核心,我国在图像识别、语音识别等技术领域达到了国际领先水平。随着人工智能技术的不断发展,政府、企业和研究机构正在共同努力,将人工智能与其他领域结合起来,以实现更大的整体效益。中国已准备好释放“人工智能+”领域的巨大潜力。人工智能在制造业、医疗保健、金融和教育等行业发挥的作用越来越深入广泛,正在形成新质生产力,并改变未来的商业模式和创造新的产业链。

关键词:人工智能 计算机视觉 自然语言处理 大模型

【中图分类号】TP-9 【文献标识码】A

近年来,人工智能(AI)技术的发展速度令人瞩目。从自主驾驶汽车到医疗诊断、从虚拟助手到金融预测,人工智能已经渗透到了生产生活的各个方面。这种快速增长和迅猛发展不仅改变了我们与技术互动的方式,还为各行各业带来了新的机遇和挑战。在推动技术创新和产业变革方面,人工智能都发挥着至关重要的作用。例如,在医疗保健领域,人工智能被用于分析大数据、识别模式并作出预测,从而提高疾病诊断和治疗的准确性。在金融领域,人工智能被用于风险评估、投资决策和欺诈检测等任务,甚至直接参与量化投资获益。

我国高度重视人工智能技术发展和应用,近年来出台《新一代人工智能发展规划》(2017年7月)、《关于促进人工智能和实体经济深度融合的指导意见》(2019年3月)、《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》(2022年8月)、《生成式人工智能服务管理暂行办法》(2023年7月)等文件,推动人工智能技术的发展和产业化应用。2024年《政府工作报告》提出开展“人工智能+”行动计划,该计划旨在将人工智能与其他技术,例如物联网、大数据和云计算相结合,赋能千行百业,创造出更具创新力的新应用和新领域。

人工智能关键技术及其价值

在全球范围内,人工智能技术的发展正推动着各行各业的变革。基础技术如机器学习、深度学习、自然语言处理、计算机视觉,以及云计算等,是支持人工智能产业化的核心。这些技术不仅提高了自动化水平,还为数据分析、决策支持和用户交互提供了更加精确和高效的方法。具体来说,深度学习技术通过模仿人脑处理和分析大量数据的方式,已成为提高图像和语音识别准确性的关键技术。自然语言处理使计算机能够理解和生成人类语言,广泛应用于聊天机器人、翻译系统和情感分析中。计算机视觉技术则在自动驾驶汽车、医疗影像分析及监控系统中展示了其强大的应用潜力。同时,云计算已经成为支撑人工智能技术发展的基础设施和重要平台。

我国在图像识别、语音识别等人工智能技术领域达到了国际领先水平。这部分得益于深度学习技术的广泛应用。例如,百度的深度学习平台PaddlePaddle,为开发者提供了强大的工具,以推动机器学习算法的创新和实际应用。各级政府对人工智能的大力支持和资金投入,使得相关基础技术得到了快速发展,并在智能制造、智慧城市建设和健康医疗等多个领域得到了实际应用。例如,在智能制造领域,通过机器学习和数据分析技术,工厂能够实现更高效的生产线管理和质量控制;在健康医疗领域,计算机视觉技术被用于辅助诊断,提高诊断的准确率和效率,等等。

接下来简要介绍当前大家关心的关键人工智能技术及其价值。

变换器(Transformer)。变换器是一种深度学习模型,由谷歌(Google)在2017年提出,用于处理序列到序列(sequence-to-sequence)的任务,如机器翻译。Transformer 架构及其变体已经成为大型语言模型的基石,它们在自然语言处理(NLP)领域的应用非常广泛,从机器翻译到文本摘要,再到问答系统等。这些模型的成功展示了Transformer 架构在处理复杂语言任务方面的强大能力。

微调(Fine-tune)。微调是机器学习中的一种训练技巧,特别是在自然语言处理(NLP)中,它涉及将一个在大型数据集上预训练的模型应用到一个更小的、针对特定任务的数据集上进行再训练。微调是大型语言模型应用到实际问题中的关键步骤,它使得这些模型能够在各种特定的自然语言处理任务中发挥作用。当下已有许多开源的大模型,通过微调,研究者和开发者能够利用预训练模型的强大能力,为特定的应用场景定制模型。因此,微调技术对于产业界的应用具有非常重大的意义。

模型压缩(Model Compression)。量化是深度学习模型部署时实现模型压缩的一种技术,它通过减少模型权重和激活值的表示精度来减小模型的大小和计算需求。量化是大型语言模型部署到资源受限设备上的关键技术之一。通过量化,这些模型可以在不牺牲太多性能的情况下,以更小、更快、更节能的形式运行。这对于推动大型语言模型在实际应用中的广泛使用具有重要意义。

检索-生成(RAG)。检索-生成(RAG)是一种结合了信息检索(Retrieval)和文本生成(Generation)的深度学习模型,用于处理需要大量背景知识的任务,如开放域问答(Open-Domain Question Answering)。RAG是一种创新的方法,它将检索系统的广度和生成模型的灵活性结合起来,以解决复杂的自然语言处理任务。通过检索相关信息并利用这些信息生成答案,RAG能够提供更准确和详细的输出,尤其是在需要广泛背景知识的场景中。

我国的人工智能产业化发展趋势

近年来,我国的人工智能产业取得了长足的进步,形成了独特的产业格局。在这一格局中,不仅有众多科技巨头如百度、阿里巴巴、腾讯等积极布局人工智能领域,更有许多初创企业、高校和科研机构参与其中,共同推动人工智能技术的创新与发展。

首先,科技巨头在人工智能领域的影响力不容忽视。百度凭借其深厚的搜索技术积累,在人工智能领域取得了显著的成果,其语音识别、自然语言处理、图像识别等技术在业界处于领先地位。阿里巴巴在云计算、大数据等领域发力,为人工智能技术的应用提供了强大的基础设施支持。腾讯则利用其在社交、游戏等领域的优势,将人工智能技术应用于智能客服、智能推荐等领域,取得了良好的市场效果。

其次,初创企业、高校和科研机构在我国人工智能产业中也发挥着重要作用。这些机构通常具有灵活的创新机制和高度的研究热情,能够迅速捕捉人工智能领域的前沿技术动态,并将其转化为实际产品或服务。例如,一些初创企业专注于人工智能芯片的研发,试图打破国外厂商在高端芯片市场的垄断;一些高校和科研机构致力于人工智能基础理论的研究,为人工智能技术的长远发展提供理论支撑。

在创新成果和成就方面,我国人工智能产业也取得了显著的成绩。例如,在具身智能领域,我国新能源汽车的自动驾驶水平已经实现了与国际先进水平的并跑甚至领跑;在自然语言处理领域,我国的研究团队在大语言模型、机器翻译、文本生成等方面也取得了重要突破;在生成式人工智能领域,我国的研究人员在图像生成、视频生成等方面也取得了显著成果。

具身智能产业化趋势

随着人工智能技术的飞速发展,具身智能(Embodied Intelligence)作为人工智能与物理世界交互的重要领域,正在成为科技创新和产业变革的重要力量。具身智能强调智能体与环境之间的实时互动和感知,通过人工智能技术实现智能体在复杂环境中的自主决策和行动。

人工智能在具身智能中的应用主要体现在环境感知与理解、自主决策与行动、交互与沟通等方面。具体而言,在环境感知与理解方面,人工智能技术通过传感器、摄像头等设备收集环境信息,利用深度学习、计算机视觉等技术对环境进行感知和理解。智能体可以根据这些信息实时调整自身的行为和决策,以适应复杂多变的环境。在自主决策与行动方面,人工智能技术使智能体具备自主决策和行动的能力。通过机器学习、强化学习等技术,智能体可以学习并优化自身的行为策略,实现自主导航、避障、执行任务等。在交互与沟通方面,人工智能技术为智能体提供了与人类或其他智能体进行交互和沟通的能力。智能体可以通过自然语言处理、语音识别等技术理解人类指令和需求,并通过语音、文字、动作等方式进行反馈和回应。

当前随着消费者对于智能化、个性化产品和服务的需求日益增长,具身智能行业得到了快速发展。同时,随着技术的不断成熟和应用场景的拓展,具身智能产品正在逐步渗透到人们的日常生活中,改变着人们的生活方式和工作模式。常见的具身智能应用包括:

智能机器人。智能机器人是具身智能的重要应用之一,通过集成人工智能技术,智能机器人可以实现自主导航、语音交互、人脸识别等功能,为家庭、医疗、工业等领域提供智能化服务。

自动驾驶汽车。自动驾驶汽车是人工智能在交通领域的创新应用,通过感知周围环境、规划行驶路径、控制车辆运动等功能,自动驾驶汽车可以实现安全、高效的自动驾驶,提高交通效率和安全性。

智能家居设备。智能家居设备通过集成人工智能技术,可以实现智能控制、语音交互、场景定制等功能,为用户提供更加便捷、舒适的家居生活体验。

智能医疗设备。智能医疗通过人工智能技术实现疾病的预防、诊断和治疗。例如,人工智能技术可以通过分析医疗影像数据,辅助医生进行疾病诊断;通过智能穿戴设备监测患者的健康状况,提供个性化的健康管理方案。

从产品层面来看,上述具身智能创新产品的出现,不仅丰富了人们的生活体验,也为行业带来了新的增长点。从服务层面来看,智能客服、智能医疗、智能教育等创新服务的推出,为人们提供了更加便捷、高效的服务体验,同时也为企业带来了更多的商业机会。而随着市场需求不断增长,消费者对于智能化、个性化产品和服务的需求日益旺盛。这为具身智能行业提供了广阔的市场空间,同时人工智能产业化将进一步推动具身智能领域的技术创新和应用拓展。通过深度学习、计算机视觉、自然语言处理等技术,智能体可以更加准确地感知和理解环境,实现更加智能化、自主化的决策和行动。随着5G、物联网等技术的发展,具身智能产品将实现更加高效的信息传输和互联互通,为人们提供更加便捷、高效的服务。

人工智能产业化将促进具身智能产业链的整合和协同发展。具身智能产品涉及多个领域和产业链环节,包括硬件制造、软件开发、数据处理、云计算等。随着人工智能技术的深入应用,这些领域将实现更加紧密的协作和整合,形成完整的产业链生态。这将有助于降低生产成本、提高生产效率,推动整个行业的健康发展。

计算机视觉产业化趋势

计算机视觉作为人工智能技术关键领域之一,市场规模正在不断扩大。深度学习的兴起为计算机视觉的发展提供了强大的支持。通过深度学习技术,计算机视觉系统能够更准确地理解和分析图像和视频数据,实现更精准、高效的图像识别和分析。此外硬件设备的不断提升也为计算机视觉技术的应用提供了更强的感知能力、计算能力和存储能力。这使得计算机视觉系统能够处理更大规模的数据和更复杂的任务,提高了系统的性能和可靠性。

当前计算机视觉的应用已经从传统的安防监控、人脸识别等领域扩展到自动驾驶、医疗影像分析、智能制造等多个新兴领域。这些新兴领域对计算机视觉技术的需求不断增加,推动了计算机视觉技术的不断创新和应用。目前,我国计算机视觉市场已经形成了互联网巨头厂商、传统安防转型厂商、AI领先创业厂商、AI垂直领域厂商等多元化的竞争格局。各类厂商在技术研发、产品创新、市场推广等方面展开差异化竞争,推动了整个产业的发展。计算机视觉技术的产业化应用主要有:

工业自动化。计算机视觉在工业自动化领域的应用广泛,包括质量检测、产品分类、机器人导航等。通过视觉系统对生产线上的产品进行实时监测和识别,可以大幅提高生产效率和产品质量,降低生产成本。

智能制造。在智能制造领域,计算机视觉技术可以实现设备之间的互联互通和智能协同,提高生产线的自动化和智能化水平。例如,通过视觉系统对生产过程中的关键数据进行采集和分析,可以实现生产过程的优化和预测性维护。

智慧城市。计算机视觉在智慧城市建设中发挥着重要作用,包括交通监控、公共安全、城市管理等领域。通过视觉系统对城市的交通流量、人员流动、环境状况等进行实时监测和分析,可以为城市管理提供有力支持,提高城市的运行效率和安全性。

智慧安防。在安防领域,计算机视觉技术可以实现人脸识别、行为分析、智能监控等功能,提高安防系统的智能化水平。通过视觉系统对监控视频进行实时分析和处理,可以及时发现异常情况并报警,为公共安全提供有力保障。

智慧零售。在零售领域,计算机视觉技术可以实现商品识别、货架管理、客流量统计等功能。通过视觉系统对零售场景进行实时监测和分析,可以帮助商家更好地了解消费者需求和市场趋势,优化商品陈列和库存管理。

自动驾驶。自动驾驶是计算机视觉技术的重要应用领域之一。通过视觉系统对车辆周围环境进行实时监测和识别,可以实现车辆的自主导航和避障功能,提高交通安全性和效率。

随着上述计算机视觉应用的普及,相关法规政策环境也在不断完善。政府加强了对计算机视觉工具的监管,要求企业在使用这些数据时必须遵守隐私保护和数据安全的规定。这将有助于保护用户隐私和数据安全,促进计算机视觉产业的健康发展。展望未来,我国计算机视觉产业将继续保持快速发展态势。随着人工智能技术的不断进步和应用场景的不断拓展,计算机视觉将在更多领域发挥重要作用,为经济社会发展注入新的动力。

大模型产业化趋势

大语言模型(Large Language Models,LLMs)是人工智能领域的一项革命性技术,它们通过深度学习、算法训练,能够理解和生成自然语言文本。这些模型在自然语言处理领域具有广泛的应用,包括文本翻译、问答系统、文本摘要、情感分析等。当前国内大语言模型的发展非常迅速,如百度的文心一言、华为的盘古大模型、科大讯飞的星火大模型等,诸多国产大模型如雨后春笋般出现。随着技术的进步,大语言模型正逐渐成为推动产业化发展的关键因素。

大语言模型在产业化中的作用主要体现在以下几个方面:一是提高生产效率。通过自动化处理大量文本数据,大语言模型可以显著提高企业的数据处理效率,降低人力成本。二是创新产品和服务。利用大语言模型,企业可以开发出更加智能和个性化的产品和服务,满足消费者的需求。三是优化决策过程。大语言模型可以帮助企业分析市场趋势、消费者行为等信息,为决策提供数据支持。最后,大语言模型的翻译能力还有助于打破语言障碍,促进国际贸易和文化交流。

教育领域的大模型应用。大语言模型在教育领域的产业化,主要涉及将这些技术应用于教育产品和服务中,以提高教育效率、个性化学习体验和教学质量。从运作方法来讲,首先需要对大语言模型的技术基础进行深入研究,包括自然语言处理(NLP)、深度学习、变换器(Transformer)架构等。在预训练与微调阶段,通过在大规模文本数据集上进行预训练,然后针对特定教育任务进行微调,以适应不同的教育应用场景。在应用场景开发阶段,开发适用于教育的各种应用场景,如个性化学习、智能备课、教学评价、智能代理等。在开发出基础大语言模型后,可以将大语言模型集成到教育平台和工具中,如在线学习管理系统、教育游戏、虚拟助教等,之后需要进行市场调研,收集用户反馈,不断优化产品和服务,同时在开发和应用过程中,重视数据隐私、可解释性与透明度等伦理问题,并确保合规。

当前,教育领域的大语言模型产业化应用包括:(1)个性化学习平台:利用大语言模型为学生提供个性化的学习资源和路径,如根据学生的学习进度和兴趣推荐定制化课程。(2)智能备课工具:帮助教师自动生成教学内容,如教学案例、作业指导等,减轻教师的工作负担。(3)教学评价系统:自动评分系统,能够对学生的学习成果进行评价和反馈,提高评价效率和准确性。(4)虚拟助教:提供对话式的学习支持,如答疑解惑、学习进度跟踪等,增强学生的学习体验。

国内已有多个人工智能大模型产品,如百度的“文心一言”,在通过相关管理办法备案后,开始面向公众提供服务,推动了教育等领域的智能化发展;网易有道的“子曰”大模型,在口语训练、作文批改、习题答疑等多个教育场景中得到应用,展示了大模型在教育领域的广泛潜力。已经有不少高校学生使用国产大模型进行协助学习和写作,表现出对人工智能技术的高度接受度和实际应用需求。

当前大语言模型在教育产业化中的应用正变得越来越广泛和深入,它们为教育行业带来了一系列创新的解决方案和商业模式。同时,随着技术的不断进步和产业化的深入,大语言模型有望在教育领域发挥更大的作用,推动教育的数字化转型。

随着教育领域大语言模型的介入,教师的角色可能需要从知识传授者转变为学习引导者和情感支持者,并且确保所有学生无论背景如何都能公平地受益于这些技术。

医疗领域的大模型应用。大语言模型在医疗领域的产业化主要涉及医疗技术的集成与相关服务的建设。首先需要将大语言模型集成到医疗保健平台中,以提供智能辅助,如通过自然语言处理技术改善患者与系统的交互。接下来在数据驱动的决策支持方面,利用大语言模型分析医疗数据,为临床决策提供支持,包括诊断辅助、治疗方案推荐等。在个性化医疗服务方面,通过理解患者的医疗历史和偏好,提供个性化的医疗服务和健康管理建议。在医学教育与培训方面,可以使用大语言模型生成教学内容、模拟病例和考试题目,辅助医学生学习和评估。

此外大语言模型在药物研发、医疗影像分析、智能问答系统等方面都有较强的应用潜力,如在新药开发中,大语言模型可以设计或优化蛋白质结构,加速药物探索速度;在医疗影像分析中应用大语言模型提升医疗影像数据的标注效率,辅助疾病诊断;此外,一些企业还开发出能够回答医疗相关问题的聊天机器人,提供实时医疗咨询服务。

当前我国医疗领域大模型产业化的例子正在不断涌现,诸多相关的大模型正在不断发展与提升。例如:(1)灵医大模型:该模型服务能力涵盖了医疗行业的整个产业链,涵盖了不同角色的不同使用场景,既包括“医患药”不同的使用者角色,也包括对数据和算力有不同需求的机构。(2)数字中医大模型:北京中医药大学东方医院面向中医领域名医经验挖掘整理需求,构建数字中医服务平台,探索高危肺结节人工智能临床诊疗和临床评价研究等解决方案,实现中医临床经验的智慧化复制新模式。(3)盘古药物分子大模型:盘古大模型已经深入医疗等行业,其中盘古药物分子大模型可以实现针对小分子药物全流程的人工智能辅助药物设计,有助于加速药物研发的过程,提高研发效率。

当前大模型的发展十分迅速,但其产业化也面临诸多挑战。例如数据隐私和安全方面。此外,虽然大语言模型在某些方面表现出色,但在理解复杂语境和提供深入反馈方面仍有局限。

“人工智能+”:机遇和挑战

随着人工智能技术的不断发展,政府、企业和研究机构正在共同努力,将人工智能与其他领域结合起来,以实现更大的整体效益。我国政府通过制定《新一代人工智能发展规划》等文件,加强了顶层设计,明确了发展方向。“人工智能+”提供了许多新的产业化应用场景,既可以改善人们的生活又可以促进经济增长。例如将人工智能与医疗保健相结合,提高诊断准确性和治疗效果;将人工智能与交通系统结合起来,减少拥堵,提高安全性,并优化资源分配。

近年来,我国政府推出了一系列促进“人工智能+”的举措,主要包括:加大对智能技术的研发投入和财政支持,推动智能技术的创新和发展;建设智能产业园区和孵化器,以吸引和培育智能领域的企业和人才,并促进智能产业链上下游的协同合作;加强高校、科研机构和企业之间的合作,共同推动智能技术的研发和应用,为智能技术研究和开发提供了重要保障;建设智能技术研发中心和实验室,以集聚创新资源,并为智能技术的研发和应用提供有力支持;培育智能产业生态,通过政策扶持和资金支持等方式,推动智能技术在各个领域的应用,以实现人工智能技术与实体经济的深度融合,并促进智能产业的健康发展。

与此同时,在这一系列的机遇背后,“人工智能+”的推动也面临着一些挑战。主要包括:

算法的公平性和透明性。人工智能算法可能受到数据样本的偏见,导致对于不同群体的不公平对待。一些算法可能在不经意间对某些群体产生歧视性影响,加剧社会不公平。不平衡、低质量的数据集可能导致模型在某些群体中表现不佳。如果人工智能系统不够透明,用户可能无法理解其决策过程,从而降低信任度。

数据隐私和安全。将人工智能与医疗保健结合起来,需要保护患者敏感信息的机制,以防止未经授权的访问;将人工智能与金融系统结合起来,需要确保算法不会被利用进行欺诈或其他恶意活动;智能体在决策和行动中的道德和法律责任需要更有力的监管,保护用户隐私和数据安全需要有法可依。

技术成熟度和扩展性的挑战。许多人工智能技术仍处于早期发展阶段,因此不足以支持商业需求;将人工智能与现有系统结合起来可能需要大量资源和时间;智能体的环境感知和理解能力有限,智能体的决策和行动策略较为初级。

人才供需关系。人工智能技术和智能领域的快速发展需要大量具备跨学科知识和创新能力的高端人才。然而,目前这一领域的人才储备相对不足,难以满足产业快速发展的需求。

总之,“人工智能+”提供了许多机遇,可以帮助改善人们的生活并促进经济增长。然而,这一行动计划也面临着一些挑战,需要妥善解决。解决了这些难题,我们才可以更充分利用人工智能技术,赋能千行百业高质量发展,并创造一个更好的未来智能社会。

结语

随着人工智能技术的迅速发展,中国已准备好释放“人工智能+”领域的巨大潜力。人工智能在制造业、医疗保健、金融和教育等行业发挥的作用越来越深入广泛,正在形成新质生产力,并改变未来的商业模式和创造新的产业链。尽管我国“人工智能+”产业发展可能与国外存在差距,中国仍将持续大规模推广人工智能并将其融入各个行业,并有望进一步提高生产效率、推动创新,从而弥补这些差距,甚至使部分产业走在国际前列。需要注意的是,“人工智能+”行动也在人才培养、基础设施建设和监管框架方面面临着新的挑战。然而伴随政府支持、私人投资以及各行各业对智能技术日益增长的需求的推动,中国的人工智能产业将继续保持上升趋势,使我们进入一个崭新的智能新时代。

【本文作者为北京大学信息科学技术学院教授】

参考文献略

责编:周素丽/美编:石 玉

责任编辑:张宏莉