由此我们可以理解,如果我们能够以方便的格式轻松访问数据,那么使用 进行实验会更容易。但实际上,许多公司(出于不可避免的原因)难以建立可用于推进分析的中央数据存储库。
因此,要使用并获得大部分 或任何 阿尔巴尼亚电话号码数据 其他 技术,必须拥有强大、可扩展、灵活且可维护的管道,以便能够高效地将源数据存储到 管道可以工作的地方。换句话说,您需要易于使用但功能强大的 (提取、转换和加载)工具和强大的数据库,以便能够轻松地将加载的数据传递给 。
理想的解决方案是将 组件集成到数据库中,这样用户就无需经历处理或构建大型数据集的痛苦。 最用户友好和最有效的。将 的功能带到数据附近,为数据科学家提供了更大的灵活性,他们可以轻松地用它进行实验。如果这个组件是 ,它为半技术用户提供了额外的自由来应用高级分析。
因此,为了最大限度地利用 等工具并将其用于实际用例, 的支持扩展和部署和监控等后建模基础设施也至关重要。在接下来的文章中,我们将介绍多个端到端机器学习管道。