阿里巴巴公布大型语言模型训练相关专利
来源:人民财讯
企查查APP显示,近日,阿里巴巴(中国)有限公司申请公布“一种基于思维链训练大型语言模型的方法、装置和设备”专利。
专利摘要显示,本发明实施例中,通过获取多个初始采样数据,初始采样数据包括图像、图像的辅助文本信息以及图像的标准审核结果;根据每个初始采用数据生成思维链数据,并确定思维链数据集合;根据思维链数据集合对基础大型语言模型进行全量微调,确定中间大型语言模型;根据中间大型语言模型以及多个所述初始采样数据,迭代生成多个中间思维链数据;进而根据预先设置的奖励函数,确定各所述中间思维链数据的奖励数值;最后采用组相对策略优化算法GRPO对所述中间大型语言模型进行强化学习,确定目标大型语言模型。通过上述方法,可以提高大型语言模型的可解释性和审核精度。
郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
评论该主题
帖子不见了!怎么办?作者:您目前是匿名发表 登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》