知识库管理

管理、迁移、搜集和更新知识库数据

文档库 媒体库
总馆
12 个知识库
北京馆
8 个知识库
上海馆
7 个知识库
其他分馆
25 个知识库
知识库名称 所属馆区 类型 文件数量 大小 更新时间 同步状态 上线状态 操作
科技文献知识库
包含科研论文和学术资料
总馆
文档
1,532
4.2 GB
2024-11-12
已同步 已上线
展品图像库
科学馆展品高清图片集
北京馆
图片
4,287
12.8 GB
2024-12-14
同步中 未上线
科普视频库
科学讲解和演示视频
上海馆
视频
546
128.5 GB
2025-01-10
已同步 已上线
教育资源库
教育教学和课程资源
总馆
混合
2,184
8.7 GB
2025-02-08
同步失败 未上线
实验数据集
科学实验的结构化数据集
广州馆
结构化数据
128
1.5 GB
2025-03-13
已同步 已上线

知识库迁移

将已有中国科技馆智能体的知识库插件对应的内容迁移到智能体知识库平台中,并优化其内容结构。

上次迁移 2024-11-05
迁移任务 1 进行中 / 2 已完成
服务有效期至 2025-06-15

知识库搜集

主要描述和各地方馆收集需要导入的知识库文件,保证数据准确性与权威性。

活跃爬虫 3
今日搜集数据 1.2 GB
授权到期日 2025-06-30

知识库更新

定期自动更新知识库内容,确保数据时效性和准确性。支持回溯与版本管理。

可更新知识库 3
下次自动更新 2025-04-18 23:00
服务到期日 2025-06-20

功能说明

1 知识库迁移

将已有中国科技馆智能体的知识库插件对应的内容迁移到智能体知识库平台中,并优化其内容结构。

2 知识库收集

主要描述和各地方馆收集需要导入的知识库文件,保证数据准确性与权威性。支持以下文件类型:

文本文档数据:

单次上传文档数量为 100 个,支持 .doc/.txt/.docx/.pdf/.ppt/.pptx 六种格式。.txt 文件不能超过 10MB,.pdf 文件不能超过 500MB 且不能超过 1000 页;单文件最大不超过 50MB 且不能超过 1000 页当前允许共享资源知识文件上限为 100GB(已使用 0.01/100GB)

结构化知识库:

单次上传文档数量不超过 20 个,支持 .xlsx/.xls/.csv/.json 四种文件格式。支持 UTF-8、GBK、GB2312、GB18030、ASCII 五种编码格式。单个文件大小不超过 100MB,不超过 10 万行,20 列,每行不超过 15 万字,且文件中最多支持一个 sheet 工作表(超出范围的内容会被自动忽略)

网页数据源:

仅支持有新所上传 url 的网页数据源上传 url 条件为抓取项目,自动解析所采全部字段数据的网页数据

3 知识库更新

将知识库文件整理、筛选、更新到智能体知识库中,建立完善的知识库本管理体系,记录每次更新的内容和时间。同时,能回溯机制。一旦更新后出现严重问题,能恢复到上一个稳定版本,保障服务的连续性。按照优先等级在使用多种模型文本服务过程中的反馈,了解围绕对知识内容的需求和挑战,为知识库更新的重要参考,不断优化知识内容和服务质量。

知识库统计

总知识库数量
52
已上线知识库
35
总存储空间
205.8 GB
本月新增文档
1,245

数据分布图

总馆: 35%
北京馆: 18%
上海馆: 15%
其他分馆: 32%
显示 1552 个知识库