近日,在全球文明对话部长级会议召开期间,由中国科协主办的“文明交流互鉴与科技创新发展”平行论坛在京举办,与会国内外知名专家学者、国际科技组织负责人等,聚焦人工智能技术发展及其对文化的影响、价值伦理构建、文明多样性保护等时代命题,充分表达观点。
围绕对人工智能的发展、人工智能大模型的能力与缺陷、人工智能大模型对产业发展的影响等话题,记者专访了中国科学院院士张钹。
张钹院士指出,人工智能产业由于缺乏统一的理论体系,目前的发展仍然依赖于特定领域的模型和算法,这无疑限制了其市场规模和产业的快速发展。
一、人工智能发展史经历3个阶段
张钹院士对人工智能的发展历程进行了深刻的回顾与总结。他将人工智能的发展分为三个阶段:第一代人工智能提出以知识与经验为基础的推理模型,通过这一模型来模拟人类的思考。这一模型具有可解释性与可理解性的优点,但由于知识表示与获取的困难,该模型在应用和产业化上受到很大限制。第二代人工智能提出数据驱动的模型,通过基于大数据的机器学习,实现对人类感性和情感行为的模拟。由于模型的图像、语音等输入数据来自客观世界,因此具有很大的应用潜力,但由于模型本身存在不安全、不可靠、不可信(不可解释)、不可控和不易推广等缺陷,因此应用范围也受限制。虽然科学家在这期间也进行过模拟人类动作,比如手的操作与脚的步行等研究,但没有将这些研究与思考、感知等其他方面深入联系起来。总之,这两代人工智能都有很大的局限性,而且只针对特定领域、利用特定模型去解决特定任务。
2020年大语言模型的出现,把人工智能推向新的发展阶段——第三代人工智能。大语言模型具有强大的语言生成能力,使机器能够在开放领域下实现与人类的自由交互,这表明机器已经掌握了人类的语言。通用人工智能是未来人工智能的发展方向,大语言模型(LLM)向通用人工智能迈出了一步,但它在许多其他任务上还不能实现领域的通用性。
二、基础模型的三大能力与一大缺陷
张钹院士认为,我们考虑基础模型的时候需要考虑其3大能力与1大缺陷,这点是非常重要,是我们考虑今后产业发展的出发点。
基础模型的首要能力是其卓越的语言生成能力。这种能力在三个方面尤为突出:第一,基础模型能够处理开放领域的语言问题,与以往针对特定领域的模型形成鲜明对比;第二,它们能够生成多样化的结果,这种灵活性和创造性是以往模型不具备的;第三,这些模型生成的语言在语义上连贯,类似于人类的自然语言,使得人类能够轻松理解其输出并把握意图。
基础模型展现出强大的人机自然交互能力。这一点在生成式人工智能时代尤为重要,因为它使人类能够在开放领域内与机器进行自然语言对话。这种交互能力曾被视为人工智能的终极目标,而如今,随着基础模型的发展,这一目标已经初步实现。
基础模型具有显著的迁移学习能力。它们能够在面对新任务时,通过少量样本或学习迅速适应并表现出色。这种能力使得基础模型能够在不同领域和任务之间灵活转换,极大地扩展了人工智能的应用范围。
基础模型存在“幻觉”缺陷,即在追求输出多样性的同时,模型可能会生成错误或不准确的信息。这种错误是模型内在的、不可控的,且必然会发生。这种“幻觉”问题要求使用者在应用基础模型时必须谨慎,特别是在那些对错误容忍度较低的领域。
三、大模型对产业发展影响
谈及大模型对人工智能产业发展的深远影响,张钹院士认为除百模大战外,将来做通用大模型的肯定是少数企业,但是大部分大模型企业往以下三个方向转移。
一是开发垂直领域的大模型。随着大模型技术的发展,未来将出现更多针对特定垂直领域的定制化模型。这些模型将深入金融、医疗、石油等专业领域,利用其强大的数据处理和分析能力,为这些行业提供更加精准和高效的解决方案。这种趋势不仅能够推动产业升级,也将为人工智能技术的商业应用开辟新的道路。
二是提供通用或开源模型。大模型的另一个发展方向是成为通用或开源的基础设施。通过提供这样的平台,可以让更多的开发者和企业在这些模型的基础上进行创新和应用开发,从而加速人工智能技术的普及和应用。这种开放的模式有助于构建一个更加活跃和多元的技术生态系统,促进知识的共享和技术的迭代。
三是与其他技术和工具结合开发新应用。通过与物联网、大数据、云计算,以及其他人工智能技术的融合,大模型能够开发出更多创新的应用,解决更加复杂的问题。这种跨领域的技术整合将推动人工智能技术向更深层次和更广领域的发展,为社会带来更加丰富的应用场景和价值。
四、大模型的发展方向
张钹院士提出了大模型未来发展的四个关键方向,这些方向预示着人工智能将迈向更高层次的发展阶段。
一是提高大模型本身的性价比。可以通过模型本身的能力来提高模型的性能,比如,在(OpenAI) o1中使用的思维链技术(CoT)。也可以通过外部的驱动,比如,AI对齐,使大模型更好地理解和适应人类的思维方式和行为模式。通过在闭环系统中与人类互动,大模型能够在执行任务后接收人类的反馈,从而纠正错误并优化性能。这种与人类对齐的能力,将使大模型更加精准地服务于人类的需求,提高其在各种应用场景中的适用性和有效性。
二是多模态生成。这一方向强调了大模型在生成文本之外,还能够生成图像、声音、视频和代码等多种模态的数据。这种多模态生成能力将极大地扩展人工智能的应用范围,例如,在虚拟现实、增强现实和游戏设计等领域,提供更加丰富和真实的用户体验。同时,这也将推动人工智能在艺术创作、内容生产等领域的发展,创造出新的商业模式和市场机会。更重要的是,多模态生成将其它模态与文本挂起钩,从而实现文生图(绘画)、图生文(视觉)、文生语音(读)、语音生文(听)、文生视频(重构世界)、视频生文(理解世界)。总之,使机器具备人类的认知与感知能力成为可能。
三是AI Agent(智能体)的概念。智能体除思考之外,还需要加入“动作”与“感知”这两个环节,使之形成闭环,从而组成一个具有一定自主性的AI系统,能够在虚拟或真实的环境中执行任务并学习改进。通过与环境的交互,智能体能够获得反馈,从而提高自身的决策能力和适应性。这一方向的发展将使人工智能更加智能化和自主化,为自动驾驶、机器人技术等领域带来革命性的进步。
四是具身智能。具身智能是指将智能系统与物理实体(如机器人)结合,使其能够在现实世界中进行感知、决策和行动。这种智能系统的硬件多样化将推动通用软件的发展,使人工智能能够更好地适应不同的应用场景和任务需求,向通用人工智能迈进。具身智能的发展将为制造业、服务业和医疗保健等领域带来深远的影响。此外,具身智能思想将推动机器人技术从单一感知(如视觉或触觉)向多模态感知发展、更加关注软件与硬件的高度整合等。
五、第三代人工智能的构建
张钹院士指出,前两代人工智能只能解决有限的问题,而且还存在着不安全、不可靠、不可信和不容易推广应用的缺点。为了克服这些缺点,我们提出要发展第三代人工智能。基本思路就是要把知识驱动和数据驱动结合起来,充分利用知识、数据、算法和算力这四个要素。在发展第三代人工智能中,我们实际上跟世界水平差距不大,也可以说处于同一起跑线上,因此我们在未来的人工智能发展中,完全可以利用这个机会,掌握主动,进一步发扬创新精神,就有可能跟世界一起共同推动人工智能的发展,做出重大贡献。
张钹院士特别强调,第三代人工智能的构建必须建立在坚实的理论基础之上。目前,尽管人工智能领域取得了显著的进展,但仍然缺乏一个统一的理论框架来解释和指导实践。理论的缺失导致了实践中的困惑和误解,也给技术的安全性和可靠性带来了隐患。因此,发展一套完善的理论体系,对于指导人工智能的健康发展至关重要。
在技术层面,张钹院士提出第三代人工智能应实现安全、可控、可信、可靠和可扩展的目标。这意味着人工智能系统不仅要在技术上达到高标准,还要在伦理、法律和社会层面得到充分的考量和保障。技术的安全性和可控性是确保人工智能正确服务于人类社会的前提;可信和可靠性则是赢得用户和社会信任的关键;而技术的可扩展性则是推动人工智能不断进步和应用的基础。在机器人治理上,张钹院士指出虽然未来机器人治理有很多难题,但可研究新的伦理分析工具进行更好的伦理分析和结果预测,利用深度学习方法对不道德和道德行为给出样本进行分析,以及通过仿真模拟大量实验来解决安全性问题和伦理问题。
张钹院士还指出,第三代人工智能的发展需要重新利用知识、数据、算法和算力这四个核心要素。在当前以数据和算力为主导的人工智能发展模式中,知识的重要作用往往被忽视。张钹认为,知识是人工智能理解世界、作出决策的基础,而数据则是知识获取的源泉。算法作为实现智能行为的工具,需要不断地优化和创新。算力则是支撑算法运行和数据处理的基础。这四个要素的有机结合,将为人工智能的发展提供强大的动力。
张钹院士认为,大模型为我们提供了发展通用硬件和软件机会。人工智能正进入稳步发展阶段,对各行各业有巨大影响,必须抓住机遇发展人工智能产业。但仍有大量不确定性,因为AI不可预测、不可控。全世界对大模型强大的生成能力、迁移能力、交互能力感到惊讶,却无法解释,只能归结为“涌现”。所以为了人工智能产业的健康发展,必须将科学研究、技术创新、产业发展结合起来。(光明日报全媒体记者詹媛)
按天配资-股票114在线配资查询-股票怎么玩杠杆-中国股票配资官网提示:文章来自网络,不代表本站观点。