基于知识图谱和知识库的大模型对话系统(三)
基于知识图谱和知识库的大模型对话系统(三)
补全知识图谱
数据准备:
使用现有的知识图谱作为基础数据源。
将数据集分为50%的训练/验证数据和50%的测试数据。
实体关系抽取模型:
模型包括编码器(Encoder)和解码器(Decoder),以及中间层处理逻辑。
编码器:
基础模型是ERNIE(Enhanced Representation through kNowledge IntEgration),这是一种预训练的语言模型。
经过多个Transformer块进行处理,输出序列H。
关系分类器:
输入Q(查询)、S(句子)和M1、M2(共享参数)。
通过一系列操作得到实体G。
解码器:
包括前馈神经网络、交叉注意力和自注意力机制。
最终输出Q。
模型评估与筛选:
根据设定的临界值θ1和θ2来决定是否舍弃或人工筛选模型。
如果大于临界值θ1,则直接舍弃;否则进入下一步骤。
如果大于临界值θ2,则由人工进一步筛选;否则更新知识图谱并进行迭代更新。
迭代更新:
对知识图谱进行迭代更新,以改进模型性能。