张晓燕:金融行业大语言模型面临诸多挑战
张晓燕是清华大学五道口金融学院的副院长,同时也是讲席教授和正高级职称。此外,她还担任中国证监会第十七届发审委的兼职委员。以下是她在出席“新起点·新突破·新格局——2023中国普惠金融国际论坛暨数字经济开放研究平台学术峰会”并发表演讲的部分节选,主要是讲金融行业大语言模型面临诸多挑战。
清华大学教授张晓燕
第一,金融专业领域知识的匮乏性(大语言模型在某个领域语料不足),比如金融GPT,投放什么样的饲料养出什么样的动物,如果饲料不够,模型就理解不了,要经过很长时间的训练,原料够不够,这是一个挑战。
第二,训练成本,训练大语言模型算力需求太贵了,大家之前看动不动就上亿、上万亿,所有的成本都是非常高的,以50B参数量的BloombergGPT为例,训练花费了267万美元,这个费用并不是绝对大多数企业能够承担的,只有头部企业才能买得起。
第三,金融信息的及时性需求(大语言模型的训练语料滞后性问题),大语言模型的训练过程中,由于训练需要花费大量时间,因此训练好的模型有滞后问题。金融领域往往我们会关心当天发生了什么,可以决定明天要干什么,如果它掌握的信息比较滞后的话,对于很多金融决策的判断都会受到影响。
第四,金融政策的精确性要求。比如某家公司的CEO是谁?某家公司的年收入是多少?这些我们往往需要其回答唯一正确的答案,但是由于大语言模型存在幻觉问题,对于这种问题的回答很容易出错。
为了应对以上挑战,目前有了很多新的技术出现,比如说为了解决及时性的问题,就要及时更新数据库,让大语言模型拥有最新的信息,这些技术方面的信息假以时日都能解决。除了技术挑战之外,它更大的挑战是监管规范与合规性的要求。
全球对于AI的态度,不管在中国还是在别的国家,也一直处于一个争论的状态,有没有一个国际准则,大家都是在趟着水走,这些讨论涉及到什么地方?比如说数据安全,用户的隐私保护,比如说它输出的内容审查,模型的有毒性、偏见、公平性、合规性审查等等,这些依然是悬而未决的。
本文由小熊AI网发布,不代表小熊AI网立场,转载联系作者并注明出处:https://www.xiaoxiong360.com/html/industry/1140.html