跳到主要内容

Agentic AI 原生的数据平台

LakeInsight 在湖仓底座之上构建了 Agentic AI 核心层,通过 Semantic Agent、AI Coding Agent 和智能问数 Agent 三大引擎,实现从代码语义自动提取到智能开发、自然语言查询的全链路 AI 原生能力,形成自我增强的智能闭环。

LakeInsight Semantic Agent(语义智能体)

Semantic Agent 是 LakeInsight AI 原生的语义基础设施,全自动地从业务代码中提炼结构化语义信息,无需人工二次配置:

(1) 自动化语义提取流水线

  • 代码解析:扫描数仓建模、ETL 和指标计算中使用的 SQL 与数据处理代码,识别其中的表结构、字段定义和计算逻辑
  • 血缘提取:自动解析字段之间的依赖关系和转换链路,构建全链路数据血缘图谱
  • 指标与术语识别:从代码中提取业务指标的计算口径和命名规范,形成统一的业务术语表
  • 知识图谱构建:将提取的语义信息组织为结构化的湖仓知识图谱,包含表、字段、指标、术语及其关联关系

(2) 自我增强闭环

  • 上层 Agent 产出的新代码会自动回归业务代码层
  • Semantic Agent 持续增量解析,语义层随开发过程自动更新
  • 整个语义层始终保持最新状态,无需人工维护

AI Agent 核心引擎

LakeInsight 提供三大 AI Agent,覆盖数据查询、开发编码和诊断修复场景:

(1) 智能问数 Agent

  • 支持自然语言交互,自动将用户问题转换为精确的 SQL 查询
  • 通过语义检索 API 获取字段含义和指标口径,确保查询结果符合业务定义
  • 跨表查询时自动推断 JOIN 路径,模糊查询自动解析时间范围和聚合粒度
  • 面向业务分析人员,无需理解底层表结构即可进行自助分析

(2) AI Coding Agent

  • 内置 LakeSoul、Flink 和 Spark 的开箱即用开发技能
  • 通过自然语言描述开发需求,自动生成数据采集、建模和发布的代码
  • 生成代码自动对齐已有指标口径和业务术语,避免重复定义
  • 支持将验证完成的代码一键发布为生产任务

(3) 诊断修复 Agent

  • 实时监控任务执行状态,自动解析错误日志
  • 结合血缘图谱和语义信息,智能定位问题根因
  • 提供修复建议或自动修复代码,降低运维成本

MCP Server 标准化接口

  • 基于 Model Context Protocol(MCP)提供覆盖全链路的标准化 API 接口
  • 将湖仓操作、代码开发、任务管理等能力封装为 Agent 可调用的标准化工具
  • 支持与外部 AI 助手和生态工具的无缝集成

统一语义检索 API

作为一站式平台的体验枢纽,统一语义检索 API 向上层 Agent 和用户提供:

  • 字段含义查询:输入表名和字段名,返回业务含义、数据类型和关联指标
  • 指标口径查询:检索指标的计算逻辑、数据来源和下游依赖
  • 血缘关系查询:追溯字段的完整上下游依赖链路
  • 知识图谱检索:基于图结构检索表、字段、指标和术语之间的语义关联

各类用户——数据工程师、智能问数使用者和 AI 模型开发者——通过统一的检索接口获取精确语义,无需关心底层知识图谱的构建细节。