知识库简介¶
Datus Agent 知识库是一个多模态智能系统,将分散的数据资产转换为统一的、可搜索的存储库。可以将其视为"数据的 Google",深入理解 SQL、业务指标和数据关系。
核心目的¶
- 数据发现:查找相关的表、列和模式
- 查询智能:理解业务意图并生成 SQL
- 知识保存:捕获和组织 SQL 专业知识
- 语义搜索:按含义查找信息,而非关键字
核心组件¶
1. Schema 元数据¶
目的:理解数据库结构并提供智能表推荐。
- 存储:表定义、列信息、样本数据、统计信息
- 能力:按业务含义查找表、获取表结构、语义搜索
- 用途:自动表选择、数据发现、schema 理解
2. 语义模型¶
目的:通过语义信息增强数据库 schema 以改进 SQL 生成。
- 存储:表结构、维度、度量、实体关系
- 能力:Schema linking、列使用模式、外键发现
- 用途:准确的临时 SQL 生成、智能过滤、正确的 JOIN 构造
3. 业务指标¶
目的:管理和查询标准化的业务 KPI。
- 存储:指标定义、主题树分类
- 能力:通过 MetricFlow 直接查询指标、指标优先策略
- 用途:一致的报告、消除重复 SQL、标准化定义
4. Reference SQL¶
目的:捕获、分析和使 SQL 专业知识可搜索。
- 存储:历史查询、LLM 摘要、查询模式、最佳实践
- 能力:按意图查找查询、获取相似查询、学习模式
- 用途:知识共享、通过示例优化、团队入职
5. 外部知识¶
目的:处理和索引领域特定业务知识,实现智能搜索。
- 存储:业务术语、规则、概念、层级分类
- 能力:业务术语语义搜索、上下文增强、术语解析
- 用途:Agent 上下文增强、术语标准化、知识传承
关键特性¶
- 统一搜索:跨所有知识域的单一界面
- 语义搜索:使用向量嵌入按含义查找
- 智能分类:自动分类和组织
- 可扩展:延迟加载、批处理、增量更新