不难想象这将节省大量时间。但要真正体会到用户无需执行的操作的价值,让我们看看这个过程的背后发生了什么,看看到底发生了什么。
用户的问题——“与 2020 年相比,2021 年冷冻披萨的销量是多少?”——通过 NLP 转换为 SQL 查询。该查询不仅通过一个数据库执行,还可能通过公司可能使用的十几个系统执行——想想在 Teradata、Oracle、Hadoop 等数据库中同时执行的查询。
如果回答问题所需的数据位于不同的系统中,增强分析平台会自动连接这些表。
它执行查询并返回数据。但系统不 阿根廷电话号码数据 只是输出数据。相反,它使用 NLG 将数据翻译成人类语音。
这个过程循环多次,直到用户最终得出可行的结论。然后用户向适当的决策者提出建议。 的人工分析快很多倍,使得在无限大的范围内迭代和验证决策成为可能。
用户无需编写代码,也无需咨询数据分析师,这可能需要等待数周甚至数月才能得到答案。他们不必费力地浏览公司的 庞大而孤立的数据库 – 因此,他们不必与各个部门的看门人打交道,因为这些看门人可能会减慢或阻止他们访问数据。
将真正棘手的问题交给专家,并“增强”其他一切
总而言之,增强分析有望带来前所未有的速度和 可扩展性 数据分析过程。这并不意味着 SQL 编码不再是一项有价值的技能,也不意味着数据科学家的专业知识不再需要。有些问题(尤其是涉及预测机器学习的问题)需要训练有素的人脑。
它的含义是,那些高薪的数据科学家、分析师和架构师将不再花时间做死记硬背的工作和回答更常见的问题。