Agentic AI 原生的数据平台
LakeInsight 在湖仓底座之上构建了 Agentic AI 核心层,通过 Semantic Agent、AI Coding Agent 和智能问数 Agent 三大引擎,实现从代码语义自动提取到智能开发、自然语言查询的全链路 AI 原生能力,形成自我增强的智能闭环。
LakeInsight Semantic Agent(语义智能体)
Semantic Agent 是 LakeInsight AI 原生的语义基础设施,全自动地从业务代码中提炼结构化语义信息,无需人工二次配置:
(1) 自动化语义提取流水线
- 代码解析:扫描数仓建模、ETL 和指标计算中使用的 SQL 与数据处理代码,识别其中的表结构、字段定义和计算逻辑
- 血缘提取:自动解析字段之间的依赖关系和转换链路,构建全链路数据血缘图谱
- 指标与术语识别:从代码中提取业务指标的计算口径和命名规范,形成统一的业务术语表
- 知识图谱构建:将提取的语义信息组织为结构化的湖仓知识图谱,包含表、字段、指标、术语及其关联关系
(2) 自我增强闭环
- 上层 Agent 产出的新代码会自动回归业务代码层
- Semantic Agent 持续增量解析,语义层随开发过程自动更新
- 整个语义层始终保持最新状态,无需人工维护
AI Agent 核心引擎
LakeInsight 提供三大 AI Agent,覆盖数据查询、开发编码和诊断修复场景:
(1) 智能问数 Agent
- 支持自然语言交互,自动将用户问题转换为精确的 SQL 查询
- 通过语义检索 API 获取字段含义和指标口径,确保查询结果符合业务定义
- 跨表查询时自动推断 JOIN 路径,模糊查询自动解析时间范围和聚合粒度
- 面向业务分析人员,无需理解底层表结构即可进行自助分析
(2) AI Coding Agent
- 内置 LakeSoul、Flink 和 Spark 的开箱即用开发技能
- 通过自然语言描述开发需求,自动生成数据采集、建模和发布的代码
- 生成代码自动对齐已有指标口径和业务术语,避免重复定义
- 支持将验证完成的代码一键发布为生产任务
(3) 诊断修复 Agent
- 实时监控任务执行状态,自动解析错误日志
- 结合血缘图谱和语义信息,智能定位问题根因
- 提供修复建议或自动修复代码,降低运维成本
MCP Server 标准化接口
- 基于 Model Context Protocol(MCP)提供覆盖全链路的标准化 API 接口
- 将湖仓操作、代码开发、任务管理等能力封装为 Agent 可调用的标准化工具
- 支持与外部 AI 助手和生态工具的无缝集成
统一语义检索 API
作为一站式平台的体验枢纽,统一语义检索 API 向上层 Agent 和用户提供:
- 字段含义查询:输入表名和字段名,返回业务含义、数据类型和关联指标
- 指标口径查询:检索指标的计算逻辑、数据来源和下游依赖
- 血缘关系查询:追溯字段的完整上下游依赖链路
- 知识图谱检索:基于图结构检索表、字段、指标和术语之间的语义关联
各类用户——数据工程师、智能问数使用者和 AI 模型开发者——通过统一的检索接口获取精确语义,无需关心底层知识图谱的构建细节。