上周末,2025世界人工智能大会“语料筑基智生时代”语料创新发展论坛举行。论坛由世界人工智能大会组委会指导,上海库帕思科技有限公司、上海市人工智能行业协会主办。
论坛聚焦AI Ready的高质量语料数据,以“平台筑基、工具赋能、标准引领、生态协同”为主线,集中发布四大类核心成果——

库帕思发布语料工具链平台2.0
一是服务能级再上台阶,发布“对内对外”两套平台。对外,库帕思对标服务国家战略,按照全市整体部署,打造全国首个语料运营公共服务统一门户,按照“统一标准、统一门户、统一机制”的“1+N”运行框架,推动语料调用服务Agent化,同步完成上链;对内,库帕思发布语料工具链平台2.0,延续“采、洗、标、测、用”五位一体布局,完成403个功能模块,涵盖多模异构数据采集、智能清洗算子、智能预标注算子、评测数据集管理和标准化语料交付等核心功能,并在医疗、教育、金融、城市治理等领域投入实战,兼具云化部署和私有化部署,完成与现有国产算力适配。

发布语料数据系列标准
二是标准牵引生态链接,发布13项标准和1项指南。库帕思会同行业生态合作伙伴,持续开展“一业一方法、一业一指引”,不断深化标准研制工作。此次论坛集中发布了10项语料团体标准,并联合信通院共同发布3项行业标准、1项高质量数据集建设指南,标准涵盖医疗、教育、金融、自动驾驶、科学智能、城市治理等多个方向,为 “好数据”确立可量化的标尺。

工程硕博士联合培养点正式揭牌
三是持续深化语料数据人才培养,启动工程硕博士联合培养项目。与上海交通大学、复旦大学、同济大学、上海大学、上海中医药大学等高校,聚焦模数协同、数算协同等语料产品和技术领域,培育兼具学术底蕴与实战能力的复合型人才,形成学校专业教育和行业导师实践协同的“产学研铁三角”,打造语料领域产教融合新模式。
四是持续打响CICC大赛、语料风云榜等生态品牌。语料数据智能创意大赛(CICC)面向全社会寻找“好语料、好技术、好场景”,为上海“模塑申城”工程筑牢语料基石。按照“项目创新性”“项目与语料主题契合度”“项目商业价值”三大维度,对200多个团队的参赛方案,进行专家专业评审,最终评选出12家获奖单位。语料风云榜,为行业遴选标杆示范,按照专业化、链接型、前瞻性三个维度,围绕“语料库质量、品牌能力、市场表现”等16项指标,最终评选出“2025语料风云榜转型典范Top 10”“2025语料风云榜新锐势力Top 10”。

上海库帕思科技有限公司董事长山栋明带来《拥抱以数据为中心的人工智能时代》的主旨演讲
“人工智能的浪潮已经扑面而来,模型在发生一系列的变化,从过去的大参数、多模态模型在慢慢向小参数生产力模型、强推理慢思考模型、科学智能模型和面向物理AI的具身智能模型转变。相应的语料数据也会发生一系列变化。”上海库帕思科技有限公司董事长山栋明表示,因此,库帕思进行了一系列的创新实践:语料数据方法体系重构、语料技术设施体系重构、语料行业生态体系重构;同时坚持做好四件事:建基座、强技术、搭平台、育生态。
上海市委常委、副市长陈杰出席论坛并致辞。