Skip to main content

提取 Extraction

语言模型实际上非常擅长从非结构化文本中提取结构化信息。这非常有用,因为很多信息都以文本形式存储,但为了在下游使用时更方便,通常需要将其转换为结构化格式。

在这里理解的最有用的概念是 OutputParser(输出解析器)。OutputParser 负责指定语言模型应该以何种模式响应,并将其原始文本输出解析为结构化格式。

在进行提取时,您可以使用 OutputParser 定义要提取的信息的模式。然后,您可以创建一个 PromptTemplate(提示模板),该模板接收原始文本块,并包含提取信息的指令,使其以指定的格式提取信息。