还插入关于用相应文本段落回答了哪个问题的评论或类

Transform business strategies with advanced india database management solutions.
Post Reply
suchona.kani.z
Posts: 164
Joined: Sat Dec 21, 2024 5:54 am

还插入关于用相应文本段落回答了哪个问题的评论或类

Post by suchona.kani.z »

在软件开发中,任何自动化测试通常都是先开发,然后才是实际代码。在这个项目中,自动化测试是在最后创建的。背景是我迭代地开发了应用程序中的实际流程,即使没有测试,开发的复杂性对我来说似乎也足够了。

技术细节
应用程序的结构
该应用程序由 REST 接口、类文件和用于生成注释的模块组成。将来,只需稍作调整即可使用 PyMuPDF 的替代品。

标注流程
该 API 提供以下端点:


要创建注释作业,首先通过 POST 调用 /annotationsjobs,并将要搜索的文本作为 JSON 传递到正文中:



出于控制目的,每个文档的一些元数据存储在“documentdetails”中。该注释作为后台任务异步调用。

这两种 GET 方法/annotationsjobs可用于检索所有作业或单个作业的状态/元数据。一旦文档处于完成注释状态,就可以找到一个或多个传递的文本。现在可以/下载带注释的文档。原始文件补充了后缀“_anno”。

下载完所有文件后,/annotationsjobs/{job_id}即可使用 DELETE 删除作业和临时存储的文件。

开发过程中的挑战
在我进行研究之前,我曾在几个地方认为所讨论的任务将 奥地利 whatsapp 数据​ 是一个挑战。然而,我了解到 Python 或使用的库几乎总是提供优雅且易于使用的解决方案。以下是一些示例:

1. 如何在数组中查找具有特定属性的对象?
该解决方案用一行代码解决了这个问题,如果未找到 ID,则将对象设置为 None,以便您可以继续处理结果,并且代码保持清晰:


2. 如何在后台执行任务,以便API可以快速向调用者发送响应?
对于这个问题还有一个简单的解决方案:

3. 在搜索合适的 PDF 库时,我了解到 PDF 中的注释是使用坐标创建的。尽管可以在几个经过测试的库中搜索文本,但将其转换为坐标似乎更具挑战性。使用PyMuPDF,文本搜索可以直接输出坐标;多行结果每行有两个坐标:

应用实例
该应用程序的想法是注释大型语言模型在文本中找到的信息,以便在用户之间建立接受和/或信任。为了实现这个想法,应用程序作为 Docker 容器与其他容器一起运行。此设置实现了一个展示,可以在其中上传 PDF 文档,并且用户可以向 Aleph Alpha API 提出问题。然后,基于 PDF 文档的 Luminous 语言模型会回答这些问题。此外,还会向用户显示解释,并提供原始 PDF 副本供下载,其中注释了解释。

前景
该应用程序的一个可能的扩展是,除了突出注释之外,似内容。在这方面,我将评估客户会议的反应。

这些作业当前在运行时有效,并且不会持久化。为了在展示之外进行高效使用,保留作业数据似乎是明智的。

结论
对我来说,开发应用程序和我的 Python 技能是一项令人兴奋的挑战,我在应对过程中获得了很多乐趣。在我看来,Python非常容易学习,并且很快就能取得良好的学习进度和成果。

您可以在我们之前发布的博客文章中找到来自 adesso 世界的更多令人兴奋的主题。

亚历山大·齐林斯基 图像
作者 亚历山大·齐林斯基

Alexander Zielinski 为公司提供数字化和 IT 服务管理领域的咨询服务,在这些领域拥有 10 多年的经验。他的行业重点是法定健康保险。

类别: 软件开发
标签: Python 软件项目
阿斯达夫
我们的博客文章一览
在我们的技术博客中,我们将带您踏上令人兴奋的 adesso 世界之旅。您可以在我们之前的博客文章中找到其他有趣的主题。
Post Reply