• 最近访问:
发表于 2025-05-21 21:55:30 股吧网页版
涉及大模型,又有量化大厂出手
来源:上海证券报

  今年以来,量化大厂在科技领域动作频频。

  记者近日采访获悉,由念空科技和上海交通大学计算机学院合作撰写的《面向特定任务大型语言模型的监督微调与强化学习分步式自适应集成》(英文名称为“Step-wise Adaptive Integration of Supervised Fine-tuning and Reinforcement Learning for Task-Specific LLMs”),投向NIPS(神经信息处理系统大会)。念空科技介绍称,该论文创新性提出了针对大模型更优的训练方式,在不增加额外数据的条件下,能使大模型变得“更聪明”。

  公开资料显示,念空科技为头部量化私募,近年来,其持续加大对人工智能的投入力度,不仅与高校合作进行相关研究,还成立了上海全频思维人工智能科技有限公司(简称“全频思维”),探索人工智能的前沿课题。

  业内人士表示,不仅是念空科技,今年多家量化大厂都在科技领域施展拳脚,相信在中国未来的科技创新浪潮中,量化私募将扮演越来越重要的角色。

念空科技联手高校探索AI

  记者近日采访获悉,《面向特定任务大型语言模型的监督微调与强化学习分步式自适应集成》于5月20日投向NIPS。

  “2025年DeepSeek问世的其中一个重要启示是揭开了OpenAI后续的O1和O3模型如此强大的秘密,即大量基于强化学习(RL)的后训练对大模型的推理能力至关重要,整个训练过程被分成SFT-RL-SFT-RL四个过程。我们的论文在此基础上,提出了新的训练框架,发现了优于DeepSeek后训练方式的训练框架。”念空科技创始人王啸在接受记者采访时表示。

何为SFT和RL?

  王啸解释称,SFT就像是学生的刷题模式,RL则是对学过的知识或题目进行举一反三,DeepSeek的训练方法更像是集中一段时间学习刷题(SFT),随后再集中参加考试,并对考试结果进行思考总结,但念空团队研究发现,在一个连续的训练过程中根据设计的自适应算法决定下一个步骤用SFT还是RL,其效果明显优于简单混合SFT和RL的模式,能够让大模型的推理能力更为强大。

  据悉,作为行业头部量化私募机构,念空科技近年来在AI领域持续加大投入力度。今年,念空科技创始人王啸还创立了全频思维,这是一家专注于研究通用大语言模型(LLM)相关底层算法和工程技术的创新型科技公司。

  王啸称,全频思维致力于探索人工智能的前沿课题,短期而言,公司会着眼于训练一个基于金融数据的专项大模型,以及解决当前大模型存在的一些痛点,比如提升大模型的逻辑推理能力,减轻大模型的幻想问题,探索大模型是否能进行自主创新等。长期来看,全频思维会和学术及产业界合作,在新材料、医药研发、AI助手等领域尝试大模型的应用。

量化大厂争赴科创盛宴

  事实上,不仅是念空科技,今年以来多家头部量化私募都在发力AI。

  比如,今年3月7日,老牌百亿级量化私募鸣石基金发布公告称,旗下“创世纪AI实验室”(G-Lab)面向全球招募AI科学家,要求候选人能“进行AI基础科学研究,开发新型算法模型,推动技术创新和AI应用在金融领域的落地”。

  2月24日,管理规模达400亿元的量化巨头宽德投资发布旗下智能学习实验室人才招聘公告。公告显示,WILL是宽德投资独立孵化的创业型实验室,将汇聚顶尖AI人才,专注于研发通用型超级科技助手,始于但不局限于金融场景。

  今年2月,九坤投资还与微软亚洲研究院刊文称,首次成功复现了DeepSeek-R1,并首次发现,输出长度与推理性能提升无关,语言混合(例如中英文夹杂)会显著降低推理能力,reasoning tokens(推理标记)确实有提升推理性能等多个问题。

  倍漾量化创始人冯霁表示,在美国华尔街,量化机构的“技术外溢”已到处可见。当机构将一群高智商的人才聚集在一起,且具备资金基础时,很多无关交易但又很重要的技术共性要素便会被提炼出来。而今天,中国量化界也在演绎着同样的故事。

成果有望持续涌现

  今年DeepSeek的横空出世,让市场关注到了量化机构的“科技潜力”,未来,量化私募是否会成为科技浪潮中的重要角色?多位业内人士给出了肯定的回答。

  思源量化创始人王雄认为,头部量化私募的人才储备密度高,并且近年来在AI基础设施上持续加大投入,因此在中国的AI浪潮中,量化行业有望涌现更多的亮点,其涉及的方向不会仅限于大模型,还包括多场景的应用探索、AI基础研究型创新等。

  某头部量化私募创始人也坚定看好量化私募在科技创新浪潮中的重要作用。

  在他看来,量化机构的科创优势主要有三点。一是丰厚的创新土壤。量化机构对高收益的追求会刺激技术的优化进步。而且相比很多初创型科技公司,量化机构充沛的现金流是其进行硬件储备的重要基础。二是密集的人才资源。量化资管团队往往是高学历人才扎堆的场所。“我们公司的科技人才密度比很多专门的科研企业都高,员工都不比拼竞赛奖牌,因为人人都有,比的是谁拿的奖牌更多”。三是大量的技术共性。量化业务中存在很多能够被提取的通用性技术,发展成熟以后可以助力各个领域。因此,量化资管在业务实操中持续更迭技术,将源源不断地产生造福全社会的“技术外溢”。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500