• 最近访问:
发表于 2025-07-29 22:03:00 股吧网页版
大模型“吃啥”很关键!什么才算好语料,语料数据的“上海方案”来了
来源:上观新闻

  上周末,2025世界人工智能大会“语料筑基智生时代”语料创新发展论坛举行。论坛由世界人工智能大会组委会指导,上海库帕思科技有限公司、上海市人工智能行业协会主办。

  论坛聚焦AI Ready的高质量语料数据,以“平台筑基、工具赋能、标准引领、生态协同”为主线,集中发布四大类核心成果——

库帕思发布语料工具链平台2.0

  一是服务能级再上台阶,发布“对内对外”两套平台。对外,库帕思对标服务国家战略,按照全市整体部署,打造全国首个语料运营公共服务统一门户,按照“统一标准、统一门户、统一机制”的“1+N”运行框架,推动语料调用服务Agent化,同步完成上链;对内,库帕思发布语料工具链平台2.0,延续“采、洗、标、测、用”五位一体布局,完成403个功能模块,涵盖多模异构数据采集、智能清洗算子、智能预标注算子、评测数据集管理和标准化语料交付等核心功能,并在医疗、教育、金融、城市治理等领域投入实战,兼具云化部署和私有化部署,完成与现有国产算力适配。

发布语料数据系列标准

  二是标准牵引生态链接,发布13项标准和1项指南。库帕思会同行业生态合作伙伴,持续开展“一业一方法、一业一指引”,不断深化标准研制工作。此次论坛集中发布了10项语料团体标准,并联合信通院共同发布3项行业标准、1项高质量数据集建设指南,标准涵盖医疗、教育、金融、自动驾驶、科学智能、城市治理等多个方向,为 “好数据”确立可量化的标尺。

工程硕博士联合培养点正式揭牌

  三是持续深化语料数据人才培养,启动工程硕博士联合培养项目。与上海交通大学、复旦大学、同济大学、上海大学、上海中医药大学等高校,聚焦模数协同、数算协同等语料产品和技术领域,培育兼具学术底蕴与实战能力的复合型人才,形成学校专业教育和行业导师实践协同的“产学研铁三角”,打造语料领域产教融合新模式。

  四是持续打响CICC大赛、语料风云榜等生态品牌。语料数据智能创意大赛(CICC)面向全社会寻找“好语料、好技术、好场景”,为上海“模塑申城”工程筑牢语料基石。按照“项目创新性”“项目与语料主题契合度”“项目商业价值”三大维度,对200多个团队的参赛方案,进行专家专业评审,最终评选出12家获奖单位。语料风云榜,为行业遴选标杆示范,按照专业化、链接型、前瞻性三个维度,围绕“语料库质量、品牌能力、市场表现”等16项指标,最终评选出“2025语料风云榜转型典范Top 10”“2025语料风云榜新锐势力Top 10”。

上海库帕思科技有限公司董事长山栋明带来《拥抱以数据为中心的人工智能时代》的主旨演讲

  “人工智能的浪潮已经扑面而来,模型在发生一系列的变化,从过去的大参数、多模态模型在慢慢向小参数生产力模型、强推理慢思考模型、科学智能模型和面向物理AI的具身智能模型转变。相应的语料数据也会发生一系列变化。”上海库帕思科技有限公司董事长山栋明表示,因此,库帕思进行了一系列的创新实践:语料数据方法体系重构、语料技术设施体系重构、语料行业生态体系重构;同时坚持做好四件事:建基座、强技术、搭平台、育生态。

  上海市委常委、副市长陈杰出席论坛并致辞。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500