基于知识图谱和知识库的大模型对话系统(三)

32
0
0
2024-05-20

基于知识图谱和知识库的大模型对话系统(三)

补全知识图谱

图谱补全数据准备:

  • 使用现有的知识图谱作为基础数据源。

  • 将数据集分为50%的训练/验证数据和50%的测试数据。

  1. 实体关系抽取模型:

    • 模型包括编码器(Encoder)和解码器(Decoder),以及中间层处理逻辑。

      • 编码器:

        • 基础模型是ERNIE(Enhanced Representation through kNowledge IntEgration),这是一种预训练的语言模型。

        • 经过多个Transformer块进行处理,输出序列H。

      • 关系分类器:

        • 输入Q(查询)、S(句子)和M1、M2(共享参数)。

        • 通过一系列操作得到实体G。

      • 解码器:

        • 包括前馈神经网络、交叉注意力和自注意力机制。

        • 最终输出Q。

  2. 模型评估与筛选:

    • 根据设定的临界值θ1和θ2来决定是否舍弃或人工筛选模型。

    • 如果大于临界值θ1,则直接舍弃;否则进入下一步骤。

    • 如果大于临界值θ2,则由人工进一步筛选;否则更新知识图谱并进行迭代更新。

  3. 迭代更新:

    • 对知识图谱进行迭代更新,以改进模型性能。