让我们探索一个更具体的例子,以了解自由文本标签如何增强医疗环境中的模型性能,特别是主观、客观、评估、计划 (SOAP) 注释,这是医疗保健提供者用来记录患者互动的常用格式。
假设一家医院使用大型语言模型 (LLM) 从医生和患者之间的对话中自动生成 SOAP 注释。虽然 LLM 能够提取关键信息,但有时可能会误解医学术语、错过重要的细微差别或无法正确分类主观或客观数据点。通过在 Dataiku 中使用自由文本标签,人工注释者(例如医疗专业人员)可以浏览生成的 SOAP 注释并添加自定义注释,纠正任何误解或添加模型遗漏的上下文。
Dataiku 中的标记任务可以在几种不同的数据类型上完成。
Dataiku 中的标记任务可以在几种不同的数据类型上完成。
在这种情况下,医疗保健 巴西 WhatsApp 号码列表 从业者使用自由文本标签来注释来自 LLM 的 SOAP 注释。
在标注界面右侧可以添加自由文本注释,用户可以跳过并保存注释以备复习。
在标注界面右侧可以添加自由文本注释,用户可以跳过并保存注释以备复习。
例如,在本例中,审阅者添加了带有潜在二次诊断的评估说明,以确保模型能够捕捉关键的医疗细节。这使得数据集能够更好地符合临床预期,从而提高模型在未来迭代中的准确性。
在工作流程的下一阶段,我们将看到审阅者在验证注释方面发挥的关键作用。这种简化的审阅流程可确保整个项目的数据质量得到维护。一旦注释得到验证,它们就会成为最终数据集的一部分,有助于完善模型的输出。