如何更好推动人工智能大模型技术由弱到强?郑庆华建议,可以从3条技术路线入手,一是依托大数据、大算力和强算法来推动大模型发展,也就是在原本技术路线上做延长工作;二是用“神经+符号”协同的方式,将神经网络强大的学习性、普适性与符号推理的可解释性、可组合性进行结合;三是人脑记忆启发的机器记忆智能模型,此举有望破解当前大模型存在的一些固有缺陷。
作为当下最强劲的人工智能技术,大模型之“大”,不仅在于其规模化参数众多,更在于它所蕴含的巨大潜力和广阔应用场景。除了常见的内容生成外,在自动驾驶、智慧医疗、工业互联网等众多领域,大模型都展现了优势,真正做到了赋能千行百业。
谈到大模型未来的发展趋势,不少专家都提到与具身智能的结合,而人形机器人便是最好的载体之一。到底大模型跟机器人是什么关系呢?
针对“人工智能+”行动,郑庆华认为,从学科体系的建设和人才培养来说,不光要讲理念和方法,更重要的是付出实际行动。一是要提出明确的举措,将人工智能赋能作为推动创新发展、实现新质生产力的重要手段。通过改造传统的培养方案课程体系,让人工智能技术成为一种基本能力。二是改造传统实验平台和实验方式,能够真正动手去研究算法,体验人工智能从设计、开发到应用的全过程。
一方面,算力是人工智能大模型的“燃料”。获得“吴文俊人工智能最高成就奖”的鹏城实验室主任、中国工程院院士高文表示,没有算力就无法做人工智能。如果想要让用户像用电一样方便地使用算力,就需要解决数据安全和结果传输等问题。对此,鹏城实验室正牵头推进“中国算力网”研发与建设,由其建设的“鹏城云脑”在超级算力节点方面产生了很好的效果,为后续国产算力生态建设发挥了重要作用。
另一方面,高价值数据为大模型提供了持续不断的“原材料”。模型参数规模越大,对数据的规模和质量要求也就越高。郑庆华表示,高价值数据就如同矿产资源并非取之不尽、用之不竭。有专家预测到2026年大规模语料可挖掘价值将基本消耗殆尽,在大数据上再训练出有价值数据的难度较大。另外,目前中文语料库所占比例不高,有数据显示在ChatGPT训练数据中,中文语料比重不足千分之一。
作为常年深耕网络安全领域的从业者,訾然认为,当前的网络攻击者已经在利用大模型改进他们的攻击手法,传统检测器难以识别,而安全GPT检测大模型在恶意代码理解能力、攻防对抗理解能力、安全基础知识能力等方面都超越通用大模型,且推理成本低,准确性高,便于落地。目前他所在团队开发的垂直大模型已为130余家企业提供服务。
今年的《政府工作报告》提出,深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。
月之暗面Kimi、百度文心一言、科大讯飞星火大模型……通用大模型如雨后春笋般涌现,大模型产业的应用落地也进一步提速。科大讯飞副总裁、研究院院长刘聪介绍,作为国产通用大模型的代表,星火大模型在赋能产业方面表现强劲,目前已与奇瑞汽车合作打造了大模型座舱,率先让国产大模型在智能座舱领域应用并产生实效。
从行业发展的角度看,訾然表示,各行各业的从业者应该尽可能多地去学习和拥抱大模型,探寻发展路径,让大模型更好赋能千行百业发展。
环境污染治理也成为目前垂直大模型落地的主要领域之一。北京工业大学副校长乔俊飞带领的团队在污染防治过程智能特征建模、自组织控制和多目标动态优化等方面取得了不少创新成果。乔俊飞表示,过去环境污染防治难以建立解析模型,主要依靠人工决策,而垂直大模型的落地为环境污染治理提供了技术支撑,依托数据就能对污染处理作出更加客观精准的判断,实现科学治污、精准治污。
体育在线直播平台论坛上,北京航空航天大学教授徐迈用一段国产大模型Kimi生成的演讲词开场:大模型与通用人工智能是一个充满活力引领未来的领域……大模型让交互体验变得更丰富真实,其可以称之为真正意义上的人工智能。
刘聪举了这样一个例子:想要去抽屉里拿一包薯片放在桌子上,大模型会基于对这件事情的理解做出规划,即打开抽屉、拿出薯片,再把抽屉关上,这更像是一种离身智能。但如果和具身智能结合,就会将刚才这个指令分解,并将每个指令对应结合,通过控制机器人来实现行动。
中国工程院院士、同济大学校长郑庆华表示,大模型已成为当前人工智能的巅峰,像过去对蛋白质精确结构的预测可能要几个月,还要数以千计的人才能完成,如今在大模型分析支持下,仅用几分钟就可以生成结果。
与此同时,大模型的灾难性遗忘也引发业界广泛关注。灾难性遗忘是指在新任务上训练会损害之前任务的性能。在问题求解阶段,无法记住处理过的数据或场景。例如,在无人驾驶中,人对道路情况有记忆,但自动驾驶无法记忆,每次都要重新计算,因此消耗了大量算力和电力。
西北工业大学光电与智能研究院研究员赵健表示,当前人工智能模型正在不断拓展到多模态领域,而具身智能与多模态大模型相结合,可以实现更高层次的感知、理解和决策,使人工智能有效应对现实世界中存在的各种复杂情境,为多个领域带来广阔的应用前景,成为连接AI和实际生活的桥梁和纽带。
对特定场景而言,并非所有企业都需要通用大模型的“全能”,而是更需要模型的精度。深信服科技股份有限公司安全GPT业务主管訾然表示,相较于通用大模型,想要更快实现技术商业化运营,让用户愿意为之买单,垂直大模型在落地上可能更有优势。