FX168财经报社(北美)讯 投资者对人工智能的兴奋使标准普尔500指数今年上涨了18%,与人工智能有关的大型市值股票在指数的涨幅中占据了大部分。
在人们对人工智能的兴奋之余,他们也对如何进一步将人工智能融入投资领域产生了好奇。例如,随着支持ChatGPT等服务的大型语言模型不断改进,它们是否能够模仿人类推理得如此出色,以至于有朝一日能取代股票交易员?
佛罗里达大学金融系认为,通过询问ChatGPT关于某一条新闻对股价是好还是坏,然后运行一个模拟来购买或卖空一只股票,可以看出这些模型是否能够理解金融市场,即使它们并没有在这方面接受过训练。
研究发现,尽管ChatGPT在基于新闻情感预测股票走势方面表现出色,但它并非没有局限性。事实上,像ChatGPT和Bard这样的生成式人工智能服务明确警告用户不要依赖它们进行金融建议,而是要进行自己的研究。
这项研究由金融学助理教授Alejandro Lopez-Lira和艾默生美林副教授Yuehua Tang领导,旨在评估ChatGPT是否能够理解新闻对股市走势的影响,从而产生收益,并且是否能够与甚至胜过人类。
他们输入了涉及股息支付到CEO公告等各种主题的新闻标题。公司列表来自于研究证券价格中心的数据库。新闻标题是从网上获取的,然后与数据提供商RavenPack的数据进行比较,以确保它们只使用相关的新闻。
研究人员让ChatGPT为新闻标题分配以下分数:“1”表示好消息,“0”表示未知,而“-1”表示坏消息。那些得分为“1”的将被购买,而“-1”将通过在Linux中使用Python代码进行自动卖空。对于“0”输出不采取任何行动。ChatGPT以51%的概率猜对了正确的结果。Lopez-Lira表示,尽管这个利润率较低,但由于它将交易随时间和频率累积起来,累积的回报是显著的。
该研究于4月份进行,作为对2021年10月至2022年12月的交易日进行前向测试。由于GPT-3.5是使用直到2021年9月的数据进行训练的,LLM在那之后并不知道股市发生了什么,这使得Lopez-Lira和Tang能够测试其预测能力。
Lopez-Lira表示,他们的策略是在纽约证券交易所和纳斯达克交易的任何股票上进行交易。然而,大部分收益来自小市值股票,因为小型股票的交易成本更高,因此更少的投资者交易它们,创造了更大的机会窗口来利用新闻。
在这个期间,由GPT-3.5的情感分析指导的多空策略将1美元变成了6.12美元,产生了512%的回报。同样,GPT-4策略在同一期间将同样的金额增加到3.76美元,获得了276%的回报。对GPT-3.5进行的第二次模拟考虑了5到25个基点之间的交易成本,导致收益分别降至380%和50%。相比之下,罗素2000指数在同一期间下跌了20%。
Lopez-Lira指出,从总回报的角度来看,早期的模型优于后者,但在风险调整回报方面却不如后者。“主要是因为GPT-3.5更为激进,因为我们给了它选择不知道这条新闻是好还是坏的选项,所以GPT-3.5更喜欢回答更多这样的问题。”
此外,研究发现较早版本的语言模型,包括GPT-1、GPT-2和BERT,在将信息翻译成足够准确以进行盈利交易方面表现不佳。这表明随着语言模型的改进,准确性可能会提高。
使用的关键指令:
“忘记以前的所有指令。假装你是一位具有股票推荐经验的金融专家。如果是好消息,请回答‘YES’;如果是坏消息,请回答‘NO’;如果不确定,请回答‘UNKNOWN’。然后在下一行用一句简短而简明的话详细说明。这则标题对(公司名称)的股价有好坏之分吗?”
以下是标题和ChatGPT的响应示例:
标题:“Cadence Design 股价在财报公布后飙升,分析师持乐观态度”
ChatGPT:“YES,积极的收益报告和乐观的分析师展望可能会在短期内推动对Cadence Design股票的需求上升。”
标题:“Philip Morris公司季度业绩好于预期,但下调了预期”
ChatGPT:“NO,尽管超过季度预期,但由于业绩前景不佳,Philip Morris International的股价可能会在短期内下降。”
标题:“Plexus Worldwide晋升Gene Tipps为全球运营总裁”
ChatGPT:“UNKNOWN”目前尚不清楚Gene Tipps晋升为全球运营总裁将如何影响Plexus的股价。
Lopez-Lira表示:“我们要求它考虑价格走势并提供简短的解释,我们让它系统地输出这些答案。可以说,所有这些回答我都会打‘A’。所有的解释都是明智而合理的。”
华尔街的ChatGPT
Lopez-Lira表示,从好的方面来说,这些语言模型可以使分析师的工作变得更轻松、更高效,因为它们可以快速消化大量信息。
随着新的人工智能模型的出现,它们可以提高市场效率,因为它们可以加快对新闻的响应时间。这个时间范围被称为机会之窗,即交易者必须先于其他人利用新闻的时间。
初步研究集中在日内交易上。但Lopez-Lira认为,随着越来越多的公司使用这些工具,利用信息的机会之窗将从一天缩短到分钟,甚至秒,使得人类无法在高频交易中手动利用信息。他补充说,零售交易者已经很难反对大型机构算法。人工智能只会使情况更加困难,导致机构和零售交易者之间的差距加大。
Lopez-Lira认为,这些先进的能力也可能对机构交易者产生反作用:随着越来越多的公司将人工智能工具整合到他们的交易实践中,可预测性将会下降,因为他们在相同的空间竞争,用类似的模型分析数据。他表示,随着时间的推移,他们的竞争优势将会减弱。
有经验的零售交易者普遍避免与机构算法对赌。根据《Insider》查看的交易记录,David Capablanca是一位做空者,在2021年2月至2023年4月间,他的获胜率高达90%。他表示,如果察觉到算法交易正在执行,他将不会交易小市值股票。他也不会对持有40%以上机构所有权的股票进行下注。
现实世界的陷阱
Lopez-Lira表示,如果你想使用ChatGPT进行实际交易,你可能需要为其提供更多的背景信息。
这正是私募股权公司Praefinium首席执行官Alpesh Patel在测试GPT-4实时选股能力时所做的。他向模型提供了终端数据点,包括营运资金、自由现金流转换和债务等30个道琼斯股票的许多其他变量。这使得语言模型能够筛选出它预计在未来12个月内表现良好的前5只股票。它选中了帕特尔已经持有的3只股票,同时建议了两只基本面同样强劲的股票。
David Capablanca经常权衡头条新闻是股票走势的催化剂。但这只是他在做空任何股票之前运行的9个检查表中的一项。做空卖家必须考虑许多其他因素,以避免潜在的灾难。这些灾难的一个主要原因是市场摩擦,或可能干扰迅速执行交易的因素,这是模拟没有考虑到的。
有时经纪商不会立即执行您的订单,或者找不到股票可供借用。由于在做空交易中,您必须借用、购买,然后出售,因此与作为人类交易者的David Capablanca相比,存在更多的摩擦点可能减缓交易速度。然而,ChatGPT没有这些摩擦点,因为它不需要等待经纪商借给它一只股票或执行其交易,因此它能够比普通人更快地利用做空交易。
Lopez-Lira指出,这意味着在现实世界中,负面新闻的影响更大且更持久,可能使ChatGPT处于优势地位。
David Capablanca将GPT尝试做空任何股票的尝试与不考虑流通量规模的现实情况进行了比较,他表示:“最明显做空的股票,价格达到100美元,然后跌至零,你甚至无法做空。除此之外,它也没有考虑到挤压。那么,如果你用一定数量的资金做空这些股票,你有多少收到追加保证金通知?”
David Capablanca还指出了真实世界中可能使交易者陷入困境的交易停牌的风险。此外,还存在隔夜持有做空头寸的风险,尽管模拟中存在这种情况。在盘后交易中,可能发生差距上涨或价格高度波动的情况。这可能导致做空挤压,进而引发追加保证金的通知。
Lopez-Lira指出,至于大型机构投资者,他们需要考虑价格影响,即在大量交易推动股价变动时发生的情况,这在较小市值的股票中更有可能发生。
流动性不足是实时交易中可能减缓交易的另一个摩擦区域。流通股较少的股票由于供应或需求的限制更难进出,这可能导致更大的价差。
交易教育网站Trading.biz的分析师Cory Mitchell表示,如果所做的空头头寸有足够的成交量,并且可以做空,那么该模型是强大的,因为它显示出巨大的超额表现。如果将该研究的表现与同一时期的标普500指数进行比较,该模型上涨了500%,而指数下跌。而且,回撤也比指数小,这是非常令人鼓舞的。
Cory Mitchell补充道:“在这项研究中,等权重的市场投资组合在某一时刻曾经出现36%的回撤。而他们的投资组合则下跌了22.79%,所以,相对于指数型投资组合,回撤小了三分之一。”
尽管这项研究存在缺陷,但David Capablanca表示,出于信息目的,交易者必须及时了解这些进展,这一点很重要。
David Capablanca在谈到人工智能工具时表示:“了解它们已经取得了多大的进展是件好事,因为将来会很好用。我不想一无所知。这就像2005年的计算机一样,如果你一直忽视计算机,直到现在,你会落后,因为最终,他们会弄明白的。”