10月28日下午,由陕西科控投资基金、西安交通大学国家技术转移中心、21世纪经济报道联合主办,招商银行西安分行支持,21世纪创投研究院担任智库支持的“科学家遇见投资人”闭门研讨会西安交通大学专场活动在西安交通大学创新港校区举办。
“我们现在处于第四次工业的革命——一场以人工智能大数据为代表的智能化革命。”西安交通大学人工智能学院教授丁宁在会上表示,“借鉴前三次工业革命,相关技术都成为了人们工作和生活的必需品。可以预见,第四次工业革命后,人工智能也极有可能成为未来世界不可或缺的核心技术。”
丁宁本科与硕士毕业于西安交大,博士毕业于日本庆应大学,曾在阿里巴巴工作数年,于2023年回到高校从事大模型、人机交互、自然语言处理、语音处理等方向的研究。
AI正在进入“多模态融合”阶段
理解大语言模型(LLM),可以按着“模型”“语言模型”“大语言模型”逐次递进。这是一个函数式的映射系统,通过参数学习输入与输出间的关系。模型的“规模”代表参数量级,但“大”并不只是数字意义的扩张。
“在相同结构下,模型的参数量越大,它的性能越好。但并不代表,参数量大的模型一定比参数量小的模型好。”丁宁教授在演讲中指出,早期大家追求的是更大的参数量,而近两年行业开始回归理性。
他进一步解释道,大模型性能的提升并非线性依赖于参数,结构设计、训练方法和数据质量同样决定上限。当前业界普遍遵循“规模法则(scaling law)”:在相同架构下,随着参数量、算力和数据规模的增加,模型性能提升呈幂律关系。但当成本、能耗、数据清洗等因素叠加后,模型优化开始从盲目扩张走向结构创新和精细训练。
2022年底ChatGPT的出现标志着人工智能发展的转折点,也开启了大模型的产业化竞争。过去单模态(仅文本)的模型,如今正在向图像、语音、代码等多模态融合演进。
多模态能力意味着AI不再只是理解文字,而是能感知和生成来自不同世界的信息。丁宁教授认为,基于高质量的预训练模型和参数高效微调,形成的微调大模型可以广泛嵌入科研、制造、教育、医疗、金融等领域。
目前主流大模型仍以Transformer架构为基础,但在训练方式上,正在从“预训练+监督微调”向持续学习和参数高效微调演化——即用更少算力实现更快适配。这一趋势带来一个重要变化:AI从技术突破走向可负担的产业落地。
技术与资本的“双向驱动”
大模型的快速发展离不开资本的投入与产业协同。如果用一句话总结这种关系:资本是技术的放大器,技术是资本的倍增器。
具体来说,大模型训练的前期成本极高,包括算力、数据、算法和人才。没有资本介入,很难形成高质量基础模型;但如果没有技术洞见和研发积累,资本也难以真正驱动产业升级。
再从国际对比看,美国在头部企业、算力中心和生态层面仍领先,中国则在论文和专利授权方面跃居全球前列。丁宁教授在现场披露的数据显示:到2023年,人工智能领域的论文数量占全球的41%;我国在人工智能领域的专利飞速增长,截至2023年在全球的专利数占比已达到69%。
另一方面,算力依然是制约我国AI发展的关键瓶颈,模型“幻觉”、表达精度不足、产业链协同难等问题仍待突破——如,芯片、GPU、系统与模型生态需要配套发展,单靠某一环难以实现突围。
展望未来,丁宁教授认为,AI的发展将呈现多个趋势:第一,多模态融合,即文字、图像、语音、传感数据全面打通;第二,大规模与轻量化并行,即在追求能力极限的同时推动端侧部署;第三,具身智能,即AI与物理世界交互,催生机器人新生态;第四,通用人工智能(AGI)探索,即具备通用认知和自学习能力,将成为长期目标。
此外,他指出,超级智能则是一个更前瞻的概念,指具有“超过最聪明、最有天赋人类”的系统,同时可能涉及哲学层面的议题,如自主性与自我意识。这一阶段仍停留在理论探讨与未来设想之中,是人工智能发展可能的方向之一。