“人工智能(AI)的瓶颈不在模型性能,而在数据设计。”
Wayker Korea AI证券市场数据业务负责人Han Taekyung表示,金融AI之所以难以进一步突破,关键不在于模型本身,而在于缺少一套能够把一线实务知识有效接入大语言模型(LLM)的“金融本体(Ontology)”。
Han Taekyung拥有18年从业经历,兼具量化交易与开发背景。本科就读于高丽大学,主修计算机工程和统计学,后在KAIST完成金融工程硕士课程,曾在Samsung Asset Management、Doomoolmury、MOT AI等机构任职。目前,他在Wayker Korea负责推进基于金融本体的AI证券市场分析服务研发。
他指出,生成式AI的出现,显著提升了金融数据分析的生产效率。过去需要人工完成的企业业绩解读、新闻主题提取、数据建模等工作,如今正越来越多交由AI处理,整体效率可提升数十倍。
不过在他看来,金融领域的下一步重点,并不是继续堆叠模型能力,而是先把数据体系和调用逻辑搭建起来。
他表示,如果在“高性能但缺乏最新数据的模型”和“性能适中但能够接入最新数据的模型”之间做选择,后者在实际业务场景中往往更有价值。相比模型本身,更重要的是“给AI什么”,也就是如何设计输入内容,以及如何打通数据接入与调用路径。
在Han Taekyung看来,LLM在金融分析中的能力目前仍以检索为主,因此边界也十分清晰。以“韩国股市中净资产收益率(ROE)最高的是哪只股票”为例,通用LLM通常只能列出“以高ROE著称”的个股;但如果将LLM接入合适的金融数据引擎,就有可能真正给出ROE最高的股票。
他强调,金融AI真正稀缺的,往往不是公开网页上能够直接获取的信息,而是并未公开在互联网上的数据,以及各类专业分析工具。而针对不同问题应接入哪些数据、调用哪些工具,最终仍需要一线业务专家来完成设计。
他进一步解释称,金融本体的核心,在于定义企业业绩、股价、宏观经济指标、统计模型等各类金融数据之间的关系及其适用语境,从而让AI能够在正确的上下文中进行调用。现实难点在于,这类知识中有相当一部分属于“隐性知识”,而行业对本体建设的需求认知也并不充分。
他认为,量化和投资专家的市场价值本就已被认可,因此他们往往缺乏把个人方法论系统化、并沉淀为AI训练数据的动力。这也使得金融AI很难充分覆盖一线业务中的隐性知识。
Han Taekyung举例说,在教科书中,高负债率通常会被视为风险信号,但在实际判断中并不能一概而论。“Apple的负债率大约为500%,但没有人会因此认定它会倒下。”他表示,真实的投资决策还需要结合企业现金流、融资能力和产业结构等因素综合判断;而支撑这些判断所需的数据定义与组织方式,往往分散在不同专家的经验体系中,尚未被系统化整理。
他总结称,如果不能把这些一线隐性知识与LLM有效连接起来,金融AI的进一步发展终将面临瓶颈。与此同时,能够为LLM调度工具与数据的“编排(orchestration)”工作,也只能由真正理解业务的人来完成。随着AI能力持续增强,掌握这类方法论的领域专家,作用只会更加关键。