随着企业加快引入AI,治理和管控正成为无法回避的核心议题。业界越来越普遍地认为,如果缺乏有效治理,AI很难真正进入企业级应用场景。
但另一面也同样明确:管控如果过严,往往会直接影响用户体验。对AI的约束过多,反而可能让工具变得难以使用。因此,企业AI治理的关键,并不是一味加强控制,而是在可用性与可控性之间找到现实可行的平衡点。
数据平台公司Snowflake正试图解决这一问题。在美国旧金山举行的年度大会Snowflake Summit期间,Snowflake协作与治理解决方案Horizon业务负责人Prasana Krishnan在接受采访时表示,治理过强会抑制使用,治理不足又会带来失控风险,而细粒度管控与自动化配置正是实现两者平衡的关键。
在本届Snowflake Summit上,Snowflake发布了多项面向AI和数据协作的新能力。其中包括Zero Copy Sharing,即无需复制或迁移数据即可直接访问;以及Open Sharing,即便对方没有Snowflake账户,也可以完成数据共享。
Prasana Krishnan表示,Zero Copy Sharing的核心在于数据无需复制即可实现即时访问,从而减轻治理负担。以Fidelity为例,该公司已要求所有外部共享数据均通过零拷贝方式接入。
Open Sharing则将数据共享范围进一步扩展至Snowflake平台之外的用户。Prasana Krishnan指出,无论是Zero Copy Sharing还是Open Sharing,目标都是在不移动数据的前提下扩大协作范围。
除共享能力外,Snowflake还在本届大会上升级了数据治理平台Horizon Catalog,重点围绕AI代理治理、业务语境理解与安全能力整合展开。
Prasana Krishnan表示,此次更新的核心可归纳为三部分:打通企业全量数据资产、引入Horizon Context,以及强化治理能力。
首先,新版Horizon Catalog将支持把企业内部更广泛的数据资产纳入统一治理范围。即使数据并不存储在Snowflake内部,Horizon Catalog也可以获取相关元数据,并应用统一的业务语境和治理规则。
他进一步介绍称,即便Iceberg表位于外部目录中,企业仍可通过Polaris和Iceberg API在Snowflake内继续执行脱敏和治理策略;而存储在AWS Redshift中的数据,也可以通过Cortex进行查询。
Horizon Context的作用,则是帮助AI理解企业内部的业务语境。其实现路径是先在企业数据资产范围内采集元数据,再补充数据血缘等流转信息,不断丰富上下文信息,并在执行AI查询或BI查询时自动调用这些语境能力。
Prasana Krishnan表示,Snowflake可借助语义视图自动生成功能,自动整合既有元数据以及BI工具中的业务定义,生成语义视图草案,人工只需进行最终确认或少量修改。与此同时,Cortex Sense还会分析Snowflake内部的查询历史,以识别数据之间的关联,使用量越大,识别准确度也越高。
在治理层面,Prasana Krishnan指出,企业在引入AI时往往顾虑重重,其中一个长期存在的障碍就是治理配置过于复杂。为此,Snowflake提出了意图驱动治理(intent-driven governance)的思路。
按照他的说法,意图驱动治理允许用户直接用自然语言描述所需的治理规则,Snowflake再据此定义相应策略并生成相关SQL。系统还会持续进行监控,一旦发现执行结果偏离原始意图,就会发出提醒。
Prasana Krishnan表示,治理体系大致可以分为认知、保护和审计三个阶段。首先要识别敏感数据所在位置;随后通过列级脱敏等方式实施细粒度访问控制;当AI代理查询数据时,也可以根据角色设置不同的脱敏策略;到了审计阶段,则能够区分并核查访问行为究竟来自人工用户还是AI代理。
他还表示,如果企业希望让所有成员都能从数据中获取洞察并推动执行,仅有AI模型并不足够。企业还需要管理良好的数据底座、可供工具和应用调用的能力,以及用于统筹这些能力的编排层。