必一(中国) 直击中枢业务! 得物财务数仓Claude AI Coding应用实战

发布日期：2026-05-28 07:35 来源：未知作者：admin 浏览次数：

一、前言：财务数仓为什么需要AI？

二、应用场景概览：从「单点提效」到「全链路增强」

三、中枢应用场景深度解析

四、归来与权衡

一、前言：财务数仓为什么需要AI？

1、财务数仓的额外性

在电商数仓体系中，财务域是复杂度最高、容错率最低的界限。不仅因为财务对于数据准确性的要求高，也因为财务是横向域，与险些系数的域都少见据交叉，因此对业务 Sense 的要求很高。财务数仓工程师推行上在作念三件事：

业务翻译：将往来、支付、资金、促销补贴、资本等数十个业务系统的数据，翻译成通用的财务话语；

财富架构：从 ODS 到 DWD、DWS、ADS 层层构建，确保财务 UE、财务管报等公司中枢机合算得准、算得快；

质地兜底：GMV 口径是否斡旋，退款是否扣减，分担是否跨周期对皆，任何一个字段的偏差都可能导致空幻的谋划决策。

ag真人app官方网站入口

财务域的独有挑战在于：字段间存在严格的数学公式关系（正向－冲销＝冲销之后），业务轨则触及跨周期分担，对于质地的要求极高。若是单纯依靠东说念主工兜底，要么容易出错，要么需要冗余巨额东说念主力作念复核。尤其是在请托压力大的时候，质地问题就更容易被冷落。

2、痛点聚焦

从财务数仓的额外性动身，咱们不错归来财务数仓的痛点，大体不错分为如下几类：

基本上，在需求连络的每个关节，都可能因为"东说念主"的问题，带来隐患。

3、AI 大模子能带来什么改变

为了灵验惩办"东说念主"的问题，比如催得太急、看不外来、没看仔细、领略空幻等问题，咱们引入 AI 来作念改变。中枢念念路是：大模子的介入不是替代数仓确立工程师，而是在「需求领略 → 代码编写 → 质地测试 → 文档千里淀」每个关节注入强推理才气。应用 AI 来代替东说念主作念巨额的叠加性使命，同期减少初级空幻概率。

那么为什么 AI 能作念到这小数？从技能发展的趋势看，有三个中枢才气撑抓了这一变革：

超大高下文冲破学问孤岛：200k+ token 的高下文窗口，不错将表结构界说、词根字典、筹划计较逻辑一次性注入模子的 “使命挂牵”，终局基于全域元数据的推演，让大模子具有挂牵；

业务语义的自动抽象与对皆：大模子能领略 “日活”“留存率”“归因窗口” 等业务术语，并映射为具体 SQL 终局，减少因需求领略偏差导致的返工；Claude 在编码界限显耀优于其他模子，是因为它能 “懂” 业务逻辑，而不是浅易的机械施行；

突破东说念主类极限的范例施行力：东说念主工在病笃工期下范例遵守率同样昭着下落，而大模子注入范例后，可结实保管在高位。独一指示给得明确，大模子 “险些” 不会出错。

参考：亚马逊 AWS 对于构建一个强项、具备自我纠错才气且能查询多种数据源的 Text-to-SQL 惩办决议架构图。

二、应用场景概览：从「单点提效」到「全链路增强」

1、场景与提效预期

基于上述不雅点，在财务界限，大模子不错在哪些具体的关节落地呢？以下是凭证笔者近期实践警戒，列出的可落地场景及提效预期。

2、东说念主机和洽模式：数仓研发的「L3 时刻」

若是借用自动驾驶的分级轨范，面前数仓大模子应用正处于从 L2（赞成驾驶）向 L3（有条件自动驾驶）过渡的阶段，即在明确的 Prompt 经管与范例文档撑抓下，AI 能接纳绝大部分轨范化的施举止作。

在财务域的实践中，咱们亦然按照这套自动驾驶分级的步履，将平方使命拆解成了三级：

这种单干背后的逻辑是：范例施行是东说念主类的短板、AI 的长板；业务判断是 AI 的短板、东说念主类的长板。东说念主工在病笃工期下对定名范例、分区经管、重视要求的遵守率同样昭着下落，且容易因疲钝产生遗漏；而 AI 一朝"学会"了团队范例，输出的范例遵守度可结实保管在较高水平。反过来，AI 无法替代的是那些需要领略业务高下文、权衡采选、处理不对的使命。

3、AI 对于数仓全链路研发的提效作用

学习 Andrej Karpathy 对于 ChatGPT 共享的内容时，最大的感受是：AI 最强的才气，是 "泛化"。因此，若是咱们不错把数仓研发的链路拆分廓清，那么 AI 例必粗略对其中的每一个关节提效，最终带来研发效力的大幅度栽植！

三、中枢应用场景深度解析

1、AI OneData 轨范化建模（财务核算数据表情）

1）布景：财务核算 OneData 为什么难搞？

因为：仅第一轮模子遐想，就触及百张以上的表、多个子域、十余个业务过程、数百个筹划。若是辩论到后续的二次/三次迭代，使命量例必大到无法瞎想。在面前以请托为主的阶段，很难破耗如斯多的时期作念基建。以某次核算表情为例，各层表数目分散如下：

同期，财务域的中枢特征是起首多（全公司系统）、筹划多（单表字段数宽广），但以可累加筹划为主。财务严格意旨上莫得原子筹划，全是基于业务筹划加工出来的派生涯划，且一个财务筹划同样有多种口径：业务口径、资金口径、财管报口径。何况，表情触及多个子域（核算域、技能资本域、促销补贴域、交易化域、分析域），障翳从「计费 → 核算 → 结算 → 财务分析」的端到端业务过程体系。若是要绝对领略核算 OneData 的构建，不仅要懂数仓，还要懂财务，还要熟识公司财务系统，这个要求相称难作念到！主要难点鸠合在四个方面：

①口径溯源极其复杂：巨额逻辑在工程侧终局，绝大多数表缺休闲务文档、技能文档、口径文档，口径逻辑需要基于代码估计，存在空幻可能性，溯源使命量纷乱。

②范例施行不一致：财务域触及表定名范例（DIM/DWD/DWS/ADM 各有形态要求）、时期周期范例（1d/7d/30d/wtd/mtd/ytd 等多种）、生命周期范例、刷新周期范例、轨范字段英文定名原则（{主体}{业务场景}{币种标记}{度量类型}{时期单元}）。范例越细，东说念主工遵守率越低。

③跨域依赖复杂：财务是横向域，与各业务域交叉。核算域依赖巨额上游表，技能资本域需要从云做事、算法、产研东说念主力、标注东说念主力等多个起首接入数据。

④文档输出繁琐：每个 ADM 表都必须包含 OnePage 文档（OneData 决议最紧要内容），加上口径文档、模子使用诠释、下流 mapping 文档，文档间巨额叠加但需各写一遍。

是以，咱们更需要通过 AI 的才气，来作念一套新时间的建模步履论，以适当 “低参加、大遐想” 的智能建模场景。

2）建模步履论：范例即 Prompt × 迭代按捺法 × 海量文献阅读

①第一个步履论：范例千里淀是前提

AI 的输出质地全都取决于输入的范例文档质地。财务核算表情中，咱们千里淀了完整的范例体系看成 Prompt 的中枢输入，包括：

模子遐想范例：表定名、时期周期、生命周期、刷新周期；

轨范字段英文定名原则：{主体 /fin}{业务场景 / 用度类型}{币种标记}{度量类型}{时期单元}；

财务业务全链路遐想理念：计费层 → 核算层 → 结算层 → 财务分析层；

业务过程总线矩阵：多个业务过程与多个维度的交叉关系；

数据质地监控范例：完整性、准确性、一致性、合规性、业务轨则等多个大类。

②第二个步履论：迭代是常态

不要期许 AI 一次给出好意思满斥逐。考证的要害是遴荐复杂字段进行抽查 —— 在财务场景中，要点考证触及条件取值的字段（如分担逻辑、冲销逻辑、多口径筹划），对照 SQL 代码考证溯源旅途。每次迭代的产物不单是修正后的输出，更紧要的是范例文档的完善。因此，针对每次迭代的斥逐，快速识别要改造的点并修改，这小数就很紧要。也即是说，AI 不错显耀栽植咱们的迭代速率！

③第三个步履论：海量文献阅读

因为超大的 Context，是以不仅不错把历史上已有的文档一次性灌入进去，也不错把原有遐想链路的表和代码交给大模子领略，省去巨额阅读和领略的时期。同期，粗略帮咱们精确地画出业务架构图，赞成数仓工程师领略业务、构建模子。举例财务数仓架构图，好多子模块的逻辑，都是大模子读取代码后输出念念路，再由数仓团队整理造成的。

3）Prompt 和效果

将以上范例看成学习学问输入给模子，再把原始数据表给到模子，模子即不错产出建模建议。

Prompt 示例：

请读取以下范例文档：

数仓范例财富确定（含词根字典、定名范例）；

离线数仓确立范例白皮书；

团队 Cursor Rules。

分析见识表（输入对应的表名）的建表语句，按照数仓建模范例（ODS → DWD/DIM → DWS → ADM）的形态，输出重构后的建模建议。

第一次生成的效果展示了初步建模建议，在经过连接的调优和学问输入后，最终版块要丰富好多，造成了完整的财务核算数据 OneData 决议。

4）收益

经过一段时期的实施，第一版核算数据结构一经落地，效果如下：

效力栽植显耀：百张表的口径溯源、文档输出等轨范化使命大幅压缩；

范例遵守率大幅栽植：表定名、字段定名、时期周期等范例严格施行，遵守率较东说念主工有昭着改善；

可复用性强：范例文档、器具剧本、Prompt 模板、使命经由 SOP 均可跨子域复用（已在核算域、技能资本域考证）；

数据质地监控体系：基于口径逻辑自动推选 DQC 轨则（完整性、准确性、一致性、合规性、业务轨则等多大类）。

2、AI SQL Coding 实践（财务 UE 表迭代案例）

1）实践念念路

以财务 UE 表某次迭代为代表的案例，主要斥逐有：

代码结构优化，可读性大幅栽植：筹分袂段廓清、逻辑分层明确，珍贵资本昭着责问；

代码确立速率栽植：在范例与口径已对皆的前提下，从需求到可上线代码耗时裁汰。

性能优化：合座基线提前完成，为下流留出更多缓冲时期。

那么，咱们是奈何终局这种斥逐的？主要靠两点，一是 PRD 快速阅读与领略，二是代码确立效力栽植。

2）奈何领略 SQL Coding 中枢才气

①PRD 阅读与领略方面，AI 粗略帮咱们终局：

快速将 PRD 中的见识、筹划、维度、过滤条件索要为结构化要点；对「大促期间」、「小仓卖家」、「冲销」等未精确界说的表述，自动生成待证据问题清单；输出「筹划口径」「统计周期」「主键与粒度」等需证据条款。

②代码确立效力栽植方面，AI 粗略帮咱们终局：

基于词根、分层、定名范例与建表模板，生成安妥数仓范例的 DDL 与 SELECT 语句；多维度团员、归因逻辑、窗口函数、多层嵌套等复杂逻辑，必一(中国)由模子生成第一版 SQL，东说念主工校验微调；对存量长 SQL 进行分段、抽取大家逻辑、斡旋立场与重视。

3）实践中大模子显耀栽植点

财务 UE 表迭代需求使用 AI 确立后，具体效果如下：

①筹划结构分段、编码范例性、重视廓清度：

新表：按数仓分层与定名范例生成 DDL 与 SQL，筹划按业务域/统计口径分段组织，重视完整（字段含义、口径诠释、KEY 象征等），既安妥范例又便于阅读；

旧表调动：在保留业务逻辑正确性的前提下，对历史「屎山」代码进行结构化改写——斡旋别号、补全重视、拆分过宗子查询、显式写出分区过滤等，使后续珍贵与排查资本昭着下落；

代码展示对比：改造前 vs 改造后，可从「可读性、范例遵守度、重视障翳」等维度作念对比分析。

②代码撰写速率大幅度栽植：

AI Coding 的主要步履：

Step 1：整理需求 → 技能文档将 BI 需求文档中的字段信息整理进技能文档，明确字段范围；

Step 2：大模子分析字段起首教导大模子读取 DWD 源码，分析哪些字段已存在、哪些需要新增关联；

Step 3：大模子编写 ETL 代码由大模子自动在 DWD → DWS → ADM 三层添加字段代码，输出改造代码鸠集；

Step 4：定名范例校准引入筹划字典和 Cursor Rules，让大模子按范例重定名字段（去掉不范例后缀）；

Step 5：测试 SQL 生成与跑数考证大模子生成自测 SQL，逐步考证各层数据一致性，欠亨逾期追问原因并溯源。

③性能优化及自动调参：

自动识别性能瓶颈：鸠合施行遐想、大表扫描、数据歪斜等常见问题，由模子分析 SQL 与表结构，指出潜在慢点；

优化建议生成：在分区剪辑、谓词下推、JOIN 递次、中间斥逐死亡等方面给出具体改写建议；

参数调优决议：针对 Spark/ODPS 等引擎的资源树立、并行度、歪斜处理参数，给出可落地的调优建议，供运维或确立同学选用。

④基线优化栽植案例：

原链路：多张表串行/并行产出，合座耗时较长；

新链路：经模子赞成作念表统一与逻辑下千里，按捺至更少的表，合座耗时昭着裁汰；

优化效果：在保证口径一致的前提下，表数目与启动时期双降，基线提前完成，资源占用与谐和依赖均得到简化。

3、AI 数据测试（财务 UE 表邮费迭代案例）

1）财务数据测试的额外挑战

在数仓确立使命中，数据测试是保险数据质地的要害关节，但亦然最复杂、最耗时的关节之一。相当是在财务类筹划确立中，数据测试濒临着多重挑战：

①测试复杂度高，影响面广：

一个筹划的改造同样不是伶仃的，它会激励四百四病，影响其他联系计总筹划。在复杂的业务场景中，一个字段的修改可能需要同步考证数十个联系字段的正确性。这种复杂的依赖关系使得东说念主工测试很难作念到全面障翳，容易出现遗漏。

②业务逻辑复杂，公式考证贫窭：

财务筹划同样有明确的数学公式关系：正向 - 冲销 = 冲销之后：需要考证每个字段的正向值、冲销值、冲销之后值之间的计较关系；子项相加 = 汇总项：需要考证各个子项字段相加是否等于汇总字段；

财务的分担逻辑触及跨周期问题，难以考证：某些业务场景下，订单时期与收入证据时期不匹配，需要进行跨周期分担，测试逻辑极其复杂。这些公式关系看似浅易，但在推行测试中，需要辩论多样界限情况、精度问题、空值处理等，考证使命量纷乱。

③测试用例遐想贫窭：

一个需求同样繁衍出巨额测试点，单纯凭借个东说念主警戒和才气，很难作念到全面障翳，容易出现测试盲区，包括：

字段级别的计较逻辑考证；

汇总关系的考证；

冲销逻辑的考证；

界限场景的考证；

精度问题的考证；

业务轨则转变的考证。

④业务话语到数据话语的转变贫窭：

业务东说念主员描摹的需求同样是当然话语，而数据测试需要将其转变为精确的数据考证逻辑。举例："退小仓场景下，卖家邮费出资放在第一笔收入冲销，挂在临了一单"；"邮费返利抵减技能做事费"；"跨周期分担，交易化订单时期与往来订单时期不匹配"。

2）AI 在数据测试中的应用实践

那么，咱们奈何通过 AI，来惩办这些复杂问题呢？以某次财务 UE 表邮费迭代表情为例，咱们深度应用 AI 进行数据测试，获取了显耀效果。

①表情布景：

该表情触及邮费联系字段的全面重构，包括：

迭代字段：修改多个邮费联系字段的计较逻辑；

新增字段：新增精深量邮费细分字段；

删除字段：毁掉部分历史字段；

逻辑变更：邮费返利抵减逻辑谐和、冲销逻辑优化等。

②AI 应用场景：

a.测试用例自动生成：向 AI 提议测试要求后，AI 粗略自动生成完整的测试 SQL 和诠释文档，包括：

正向-冲销=冲销之后的考证逻辑；

子项相加等于汇总项的考证逻辑；

业务轨则转变的考证逻辑；

界限场景的考证逻辑。

b.轨则领略层面的测试补充：AI 粗略从轨则领略层面补充测试案例，如抽样考证、精度考证等，减少因领略不一致带来的质地问题。相当是在复杂的跨周期分担场景中，AI 粗略识别出东说念主工容易忽略的测试点。

c.复杂逻辑的逐步分析：针对复杂的业务逻辑，AI 粗略逐步分析不安妥预期的关节，匡助找到潜在的代码 Bug。举例在邮费冲销逻辑中，AI 粗略分析退小仓场景下的多种分支情况，识别出逻辑瑕疵。

d.高下流影响分析：AI 粗略分析一个字段的改造对高下流的影响，匡助识别需要同步考证的联系字段，幸免遗漏。

e.公式考证与精度问题会诊：AI 粗略自动生成公式考证 SQL，并识别精度问题。在测试过程中，AI 粗略区分委果的逻辑空幻和可接受的精度瑕疵，幸免误报。

3）推行效果与收益

经过 AI 加抓之后，效果和收益昭着，包括：

①确立效力栽植：

测试 SQL 生奏效力昭着栽植：从提议测试要求到生成完整测试 SQL，时期大幅裁汰；测试用例障翳度栽植：AI 粗略识别出东说念主工容易忽略的测试点，测试障翳更全面。

②请托质地栽植：

一次请托通过率显耀栽植：从轨则领略层面补充测试案例，减少领略不一致带来的质地问题；针对复杂逻辑逐步分析，找到潜在代码 Bug；自动生周至面的测试用例，减少测试盲区。

③问题发现才气栽植：

AI 在测试过程中粗略：发现东说念主工难以发现的逻辑空幻，识别精度问题并区分可接受的瑕疵，分析复杂的业务轨则转变问题，会诊高下流影响关系。

概括收益较高。通过 AI 赞成数据测试，合座请托质地大幅栽植，主要体当今：测试障翳更全面，减少遗漏，问题发现更实时，减少返工，测试效力更高，裁汰测试周期，质地保险更可靠，栽植请托信心。

4、AI 需求文档转机（财务 UE 表邮费复杂逻辑解读）

1）痛点

领略 PRD 和与业务居品反复查对口径，大致占数仓总体使命时期的较大比例。BI 需求文档同样复杂难解，第一眼看往时看不懂。

2）实践案例：邮费 UE 迭代技能文档

以邮费 UE 迭代需求为例，BI 需求文档触及巨额字段口径谐和、新增字段、毁掉字段、冲销逻辑重写等复杂内容。举例通过飞书 MCP 让 Cursor 凯旋读取 BI 需求文档，大模子自动归来出两张表（DWS 层和 ADS 层）各自需要改什么。大模子输出的论断结构廓清，按表分类列出：

字段含义/口径谐和（哪些字段的逻辑需要改）；

数据起首与计较点（应收邮费、实收邮费的新口径）；

新增字段清单（应收拆分、冲销联系、实收拆分、资本、UE 等）；

毁掉字段清单（联系历史字段）；

冲销逻辑要点（退小仓轨则）；

两表关系与终局递次（先改 DWS 再改 ADS）。

Prompt 实例：读取「邮费逻辑梳理」文档内容，分析其笔墨描摹与财务 UE 表的代码，分析要改造的点，帮我生成对应改造代码和改造原因重视。

通过这个分析斥逐，粗略很快地定位要改造的代码，然后一步步领略业务逻辑和具体奈何改造。

3）效果

经过这个过程快速 get 到 PRD 缺失的内容、快速对皆，总体疏浚时期灵验缩减。诚然在总时期占比上看似不高，但粗略的是工程师最头疼的碎屑化疏浚时期。

四、归来与权衡

1、中枢价值

面前商场上，部分头部大厂由于自己居品计谋的原因，放胆了里面使用最新的大模子和 IDE 器具，导致一线使用大模子的效力受到制约。而咱们则粗略更活泼地遴荐最适当的器具组合，在使用妙技和警戒积存上具备上风。举例，咱们有如下两个方面的上风：

1）才气层面：

范例化轨则遵守：注入范例青年景斥逐遵守度结实保管在高位；

业务抽象才气：快速领略 PRD 中的见识、筹划与口径，识别无顶点；

推行落地案例丰富：财务 UE 表迭代等表情已有可量化斥逐。

2）组织与场景层面：

模子遴荐活泼，不绑定单一厂商，按任务类型选用最优模子；

组织精简高效，从确定标的到试点上解析径廓清，试错迭代周期短；

离线数仓分层与范例结实，模子易学易用、效果可预期；

离线任务可重跑、可回溯，模子产出便于充分校验后再上线。

2、将来权衡

使用大模子的才气不单是局限在财务、局限在个东说念主，也要向系数这个词团队引申，包括：优先遴荐 1-2 个痛点明确、范例相对廓清的场景作念试点；将灵验的 Prompt 遐想、高下文组织形态、测试用例模板等警戒在团队内共享，造成可复用学问库；从「东说念主作念」为主转向「东说念主定例则与口径、模子施行关节」的和洽模式，让大模子成为数仓同学的平方助手。将来已来。

作家丨丹克必一(中国)

上一篇：上一篇：必一体育华为一刀切出河南最大IPO

下一篇：下一篇：必一体育中国官网入口好意思方证实：暂停一项对台军售案