这几天有个组织搞了一个AI大模型的交易大赛,参与选手一共有6个大模型,包括我们最为熟知的DeepSeek,以及阿里的Qwen模型,这2个算是国产选手;另外的四家,分别是:OpenAI出的GPT5、马斯克公司的Grok 4、谷歌的Gemini、Anthropic的Claude,属于国外选手。
比赛的内容,就是交易,买多和卖空都行,每个模型开始各1万美金,真实交易。
截止到我晚上写文章,2位国产选手DeepSeek和Qwen分列第一、第二,分别盈利700和400美金左右;
其他国外选手,全都是亏钱的。。。。
这里面OpenAI的大模型,亏的最惨,从10000美金,亏到了3400美金左右,5天的时间亏60%+,这技术。
最有意思的是各个大模型的策略是完全不同的:
DeepSeek截止到现在,一共完成了7笔完整的买卖交易,这7笔里只有1笔是赚钱的,赚了1489美金(下图红色箭头)。胜率虽然低,只有14%,但是盈亏比高,一把就狠狠的赚回来。
Qwen模型完成了21笔完整的买卖交易,其中7笔是赚钱的,胜率33%;
OpenAI的ChatGPT完成36笔完整的交易,只有2笔是赚钱的,胜率5.5%。老实说,能够这么稳定的亏钱,这个模型也挺不错的,只要反着来交易,那现在的利润怎么也有50%以上了;
Claude模型,只做多,不卖空,亏18%左右,能排到第四;
谷歌的Gemini是这里面的交易王者,一共交易了100笔以上,稳稳的亏掉50%以上。
马斯克公司的Grok 4,完成5笔完整的交易,只有1次赚钱,目前微亏4%。
从上面大模型的表现来看,交易的次数其实和最后的收益关系并不大,而且通常交易的越多,亏的越多;反倒是交易的次数少、胜率低,但通过高的盈亏比,一把翻身。这点倒是符合行业内的俗语:
截断损失,让利润奔跑
最后和大家说一下,本次这个比赛其实是娱乐性质为主,毕竟大模型并不是专门用来做交易的。以我过去的经验来看,真正的交易,并不会用这么复杂的大模型,而且通常是在高频领域表现不错,低频行业,大模型并不一定比普通的线性模型更好。