Wayker Korea：金融AI的瓶颈不在模型，关键在数据与金融本体

Han Taekyung，Wayker Korea AI证券市场数据业务负责人。图片来源：受访者提供

“人工智能（AI）的瓶颈不在模型性能，而在数据设计。”

Wayker Korea AI证券市场数据业务负责人Han Taekyung表示，金融AI之所以难以进一步突破，关键不在于模型本身，而在于缺少一套能够把一线实务知识有效接入大语言模型（LLM）的“金融本体（Ontology）”。

Han Taekyung拥有18年从业经历，兼具量化交易与开发背景。本科就读于高丽大学，主修计算机工程和统计学，后在KAIST完成金融工程硕士课程，曾在Samsung Asset Management、Doomoolmury、MOT AI等机构任职。目前，他在Wayker Korea负责推进基于金融本体的AI证券市场分析服务研发。

他指出，生成式AI的出现，显著提升了金融数据分析的生产效率。过去需要人工完成的企业业绩解读、新闻主题提取、数据建模等工作，如今正越来越多交由AI处理，整体效率可提升数十倍。

不过在他看来，金融领域的下一步重点，并不是继续堆叠模型能力，而是先把数据体系和调用逻辑搭建起来。

他表示，如果在“高性能但缺乏最新数据的模型”和“性能适中但能够接入最新数据的模型”之间做选择，后者在实际业务场景中往往更有价值。相比模型本身，更重要的是“给AI什么”，也就是如何设计输入内容，以及如何打通数据接入与调用路径。

在Han Taekyung看来，LLM在金融分析中的能力目前仍以检索为主，因此边界也十分清晰。以“韩国股市中净资产收益率（ROE）最高的是哪只股票”为例，通用LLM通常只能列出“以高ROE著称”的个股；但如果将LLM接入合适的金融数据引擎，就有可能真正给出ROE最高的股票。

他强调，金融AI真正稀缺的，往往不是公开网页上能够直接获取的信息，而是并未公开在互联网上的数据，以及各类专业分析工具。而针对不同问题应接入哪些数据、调用哪些工具，最终仍需要一线业务专家来完成设计。

他进一步解释称，金融本体的核心，在于定义企业业绩、股价、宏观经济指标、统计模型等各类金融数据之间的关系及其适用语境，从而让AI能够在正确的上下文中进行调用。现实难点在于，这类知识中有相当一部分属于“隐性知识”，而行业对本体建设的需求认知也并不充分。

他认为，量化和投资专家的市场价值本就已被认可，因此他们往往缺乏把个人方法论系统化、并沉淀为AI训练数据的动力。这也使得金融AI很难充分覆盖一线业务中的隐性知识。

Han Taekyung举例说，在教科书中，高负债率通常会被视为风险信号，但在实际判断中并不能一概而论。“Apple的负债率大约为500%，但没有人会因此认定它会倒下。”他表示，真实的投资决策还需要结合企业现金流、融资能力和产业结构等因素综合判断；而支撑这些判断所需的数据定义与组织方式，往往分散在不同专家的经验体系中，尚未被系统化整理。

他总结称，如果不能把这些一线隐性知识与LLM有效连接起来，金融AI的进一步发展终将面临瓶颈。与此同时，能够为LLM调度工具与数据的“编排（orchestration）”工作，也只能由真正理解业务的人来完成。随着AI能力持续增强，掌握这类方法论的领域专家，作用只会更加关键。

Seulgi Son sageson@d-today.co.kr

关键词