数据分析的未来:Smartbi教您如何增强分析

提到“增强分析” , 就不得不提这家咨询公司 。“商业智能”这个概念 , 就是由最早提出来的 。在2017年 , 首次提到“增强分析” , 并对其进行定义:增强分析是下一代数据和分析范式 , 它面向广泛的业务用户、运营人员和民间数据科学家 , 利用机器学习将数据准备、洞察发现和洞察共享等过程自动化 。
这个概念刚开始比较模糊 , 后来逐渐清晰 。直接到2021年 , 在发布的《Hype Cycle for ICT in China, 2021》中做了最新的定义:增强数据分析包括机器学习(ML)和人工智能(AI) , 在统一的平台上提供数据管理和分析能力 。它通过将ML和AI应用于现有的操作流程中 , 使数据管理和分析自动化 , 从而更有效地进行数据分析 。它使更多的用户获得更深入的洞察力 , 减少了当前依赖IT处理所带来的效率问题和口径偏差 。
从定义可以看出 , 增强分析并不是一种技术或是一个产品 , 而是一系列的技术和方法 , 其目的就是为了提升数据分析的效率和降低数据分析的门槛 。增强分析相关的技术可以分为了三类:增强数据准备、增强数据分析和增强机器学习 。
1、增强数据准备
准备数据是数据分析的前提 , 也是最耗时的工作 。数据准备不仅包含ETL , 通常还包含有数据探查、数据质量、数据模型、数据清洗等工作 , 涵盖了数据管理的各个方面 , 甚至还包括数据集成和数据仓库的管理 。
增强数据准备通过两个方面来提升效率 , 一方面是可视化交互 , 通过拖拉拽的方式实现可视化的数据配置、数据源的混合以及数据清洗工作 , 让数据准备变得更加快捷;另一方面是算法辅助 , 利用ML和AI技术实现部分流程的自动化 。例如自动查找数据之间的关系 , 对数据质量进行评估 , 推荐用于连接、丰富、清洗数据的最佳方法 , 还有自动查找元数据和血缘关系等功能 。
2、增强数据分析
增强数据分析的目标是为了让分析更加易用和智能 。

数据分析的未来:Smartbi教您如何增强分析

文章插图
易用方面
增强数据分析帮助用户无需建模和编写代码 , 通过可视化的界面即可洞察数据 , 提高分析的可用性 , 技术主要包含了自然语言查询 (Query,NLQ)和自然语言生成(,NLG )两个方向 。
NLQ是指用户直接在搜索框输入或通过对话的方式查询数据 。想要将用户的问题与数据表中的数据对应上 ,  (to SQL ) 技术就是其中的关键 。这一任务的本质 , 是将用户的自然语言语句转化为计算机可以理解并执行的规范语义表示 , 是语义分析 () 领域的一个子任务 。
NLG是将语义信息以人类可读的自然语言形式进行表达 。根据输入信息的不同 , NLG 又可分为:数据到文本的生成、文本到文本的生成、意义到文本的生成等 。在数据分析中应用 NLG 主要是数据到文本的生成 , 它能够将分析结果转换为人类理解的清晰叙述 , 以帮助用户更好的理解数据 , 讲好数据故事 。
智能方面
增强数据分析帮助用户自动寻找数据规律 , 将相关结果自动转化为可视化图表 , 提高分析的效率 , 典型的技术包括自动洞察 () 和自动可视化 () 。
自动洞察是增强分析的核心功能 , 但同样也是一个宽泛的概念 。现在大部分的主流 BI 平台都有自动洞察的相关功能推出 , 且方向各有不同 。自动洞察的目标就是代替一部分分析师的工作 , 从数据中发现潜在信息和价值 。