4.1.2如何进行知识导入?

有权限的管理员进入控制台-智能问答-数据集管理处:
在界面中点击需要导入知识的数据集卡片即可进入界面;

输入图片说明
在界面上方选择“知识导入”,点击右上角的“导入知识”即可开始导入知识;

输入图片说明
通用文本类文档导入:支持文档格式有 docx、txt、pdf、md;

输入图片说明
第1步: 支持①选择文件进行导入;单文件不超过100MB一次最多选择 20个文件;
第2步: 解析处理:系统默认分段配置,同时也支持②自定义分段,建议预处理规则内若是将 AI 生成问答对勾选上后需在「片段管理」内进行复核问答对是否正确。

输入图片说明
复杂版式文档导入:支持内容较复杂的 pdf文档,如包含文字、图片、表格等;

输入图片说明
第1步:仅支持①单文件导入训练,单次最多支持添加 20 个文件,单个文件不超过 100MB 或500页;
第2步:解析处理:仅支持②自动分段、需消耗云粒(10云粒/页)

输入图片说明
F&Q导入:建议有预设好标准的 FAQ 问答题目进行导入,支持 csv、xlsx 格式文件;

输入图片说明
第1步: 建议下载模板进行导入增加训练成功率,仅支持①导入文件,单次最多 20 个文件,单文件不超过100MB;
第2步: ②解析处理:不支持自定义。

输入图片说明
表格导入:建议文字类的表格内容进行导入,支持格式 xlsx;

输入图片说明
第1步: 仅支持单文件导入训练,单次支持①导入 1 个文件且不超过 100MB;
第2步: ②解析处理:不支持自定义;

输入图片说明
网页导入:支持导入公网链接导入,http、https 格式,暂不支持钻取;

输入图片说明
第1步: ①支持同时导入 5 条网址;
第2步: ②解析处理:若是勾选 AI 生成问答对则会对原片段进行补充,但建议在片段管理内进行复核准确性;支持勾选自动更新:每天、每7天、每30天、自定义天数,会在24:00自动更新(若是勾选了 AI 生成问答对更新会覆盖之前生成的 AI 问答对)

输入图片说明
关联知识库导入:支持关联云盘内都知识库及文件夹

输入图片说明
第1步: 支持①选择知识库内的知识主题,单次只支持1个主题;支持选择云盘文件夹,单个文件夹最多不超过300个子文件;

输入图片说明
第2步: ②解析处理:支持自定义分段。

输入图片说明