跳转至

知识库简介

Datus Agent 知识库是一个多模态智能系统,将分散的数据资产转换为统一的、可搜索的存储库。可以将其视为"数据的 Google",深入理解 SQL、业务指标和数据关系。

核心目的

  • 数据发现:查找相关的表、列和模式
  • 查询智能:理解业务意图并生成 SQL
  • 知识保存:捕获和组织 SQL 专业知识
  • 语义搜索:按含义查找信息,而非关键字

核心组件

1. Schema 元数据

目的:理解数据库结构并提供智能表推荐。

  • 存储:表定义、列信息、样本数据、统计信息
  • 能力:按业务含义查找表、获取表结构、语义搜索
  • 用途:自动表选择、数据发现、schema 理解

2. 语义模型

目的:通过语义信息增强数据库 schema 以改进 SQL 生成。

  • 存储:表结构、维度、度量、实体关系
  • 能力:Schema linking、列使用模式、外键发现
  • 用途:准确的临时 SQL 生成、智能过滤、正确的 JOIN 构造

3. 业务指标

目的:管理和查询标准化的业务 KPI。

  • 存储:指标定义、主题树分类
  • 能力:通过 MetricFlow 直接查询指标、指标优先策略
  • 用途:一致的报告、消除重复 SQL、标准化定义

4. Reference SQL

目的:捕获、分析和使 SQL 专业知识可搜索。

  • 存储:历史查询、LLM 摘要、查询模式、最佳实践
  • 能力:按意图查找查询、获取相似查询、学习模式
  • 用途:知识共享、通过示例优化、团队入职

5. 外部知识

目的:处理和索引领域特定业务知识,实现智能搜索。

  • 存储:业务术语、规则、概念、层级分类
  • 能力:业务术语语义搜索、上下文增强、术语解析
  • 用途:Agent 上下文增强、术语标准化、知识传承

关键特性

  • 统一搜索:跨所有知识域的单一界面
  • 语义搜索:使用向量嵌入按含义查找
  • 智能分类:自动分类和组织
  • 可扩展:延迟加载、批处理、增量更新