职贝云数AI新零售门户

标题: Dify+DeepSeek搭建基于自然言语的数据智能分析助手 [打印本页]

作者: SP0u    时间: 4 小时前
标题: Dify+DeepSeek搭建基于自然言语的数据智能分析助手
企业数据分析形式正在阅历革命性的演进。在传统形式下,企业需围绕业务部门的需求构建数据仓库并定制开发报表系统,这种单向呼应机制存在两大核心痛点:其一,业务人员需经过IT部门完成数据诉求,构成"需求提报排期开发测试上线"的冗长流程,单个需求呼应周期长达数日;其二,报表开发触及ETL、数据建模、可视化等复杂环节,边际成本居高不下。

大模型的打破性运用正在重构这一范式。经过自然言语交互界面,业务人员可直接以口语化指令(如“请分析华东区Q3客户流失缘由”)发起数据央求,大模型依托其多模态了解才能和企业知识图谱,可自动完成数据抽取、关联分析、趋向预测及可视化呈现。

这种变革完成了三重跃升:

业务侧获得实时呼应的数据服务才能,需求转化效率得到提升;

IT部门从反复开发中束缚,专注数据资产管理;

企业全体完成从“预设式分析”向“探求式分析”的质变,数据驱动决策的矫捷性发生数量级提升。

本次我们搭建的是基于自然言语的数据智能分析助手,次要有以下三个步骤。

(1)需求搭建一个可以解释数据库关键字段的知识库。

(2)需求经过Dify编排基于自然言语的数据智能分析助手。

(3)发布基于自然言语的数据智能分析助手。

一、搭建一个可以解释数据库关键字段的知识库

11.2.1  搭建一个可以解释数据库关键字段的知识库

你可以直接将数据库及数据表的创建SQL及针对创建SQL的解释内容上传到知识库,这里创建了一个名为hz-test的数据库,其中包含两张表,第一张表是department部门表,第二张表是employee职员表,如图11-15所示。

图11-15  创建数据库和数据表

接着,建立知识库并将该文件上传到知识库中。如图11-16所示。

(, 下载次数: 0)

图11-16  创建知识库并上传文件

二、Dify+DeepSeek搭建基于自然言语的数据智能分析助手

11.2.2  Dify+DeepSeek搭建基于自然言语的数据智能分析助手

基于自然言语的数据智能分析助手的全体逻辑如下。

(1)用户输入数据分析需求。

(2)基于用户需求在知识库中检索相关内容。

(3)把用户的输入内容及数据库中检索到的内容交给大模型(DeepSeek)生成数据库能辨认的SQL语句。

(4)经过SQL查询工具找出用户需求的数据。

(5)将查询到的数据回复给用户。

数据智能分析助手的全体逻辑如图11-17所示。

(, 下载次数: 0)

图11-17数据智能分析助手的全体逻辑

第一步需求创建一个聊天助手运用,如图11-18所示。

(, 下载次数: 0)

图11-18  创建聊天助手运用

第二步是从知识库中检索用户输入的内容,如图11-19所示。

(, 下载次数: 0)

图11-19检索用户输入的内容

第三步是将内容输入大模型,并为大模型预设一个指令:经过用户输入的内容及在知识库中检索到的内容生成数据库可以辨认的SQL语句。如图11-20所示。

(, 下载次数: 0)

图11-20  将内容输入大模型并预设指令

第四步是将大模型生成的SQL输入SQL查询工具,SQL查询工具可在Dify工具市场中找到。安装完成后配置数据库的地址、登录数据库的账号、密码和数据库的称号,如图11-21所示。

(, 下载次数: 0)

图11-21SQL查询工具配置

最后就是将SQL查询工具检索到的内容直接回复给用户,如图11-22所示。

(, 下载次数: 0)

图11-22  回复配置

三、发布基于自然言语的数据智能分析助手

11.2.3  发布基于自然言语的数据智能分析助手

我们需求向基于自然言语的数据智能分析助手提出两个数据分析需求。

第一个是一共有几个部门?经过大模型生成的SQL语句如图11-23所示。

(, 下载次数: 0)

图11-23  大模型生成的SQL语句

第二个是哪个职员的工资最高?经过大模型生成的SQL语句如图11-24所示。

(, 下载次数: 0)

图11-24  大模型生成的SQL语句

基于自然言语的数据智能分析助手的回答效果如图11-25所示。

(, 下载次数: 0)

图11-25数据智能分析助手回答效果

数据库中实践预设的部门表的demo数据如下。一共10个部门,基于自然言语的数据智能分析助手回答正确,如图11-26所示。

(, 下载次数: 0)

图11-26  数据库中的部门表

职员表中预设的demo数据如下。其中,黄晓明的工资最高为32000元,基于自然言语的数据智能分析助手回答正确,如图11-27所示。

(, 下载次数: 0)

图11-27  数据库中的职员表

以上给大家展现的只是应用大模型停止数据分析的智能体的“玩具版”,就像乐高阐明书中的示例模型一样。要想在企业中运用,需求把它改形成"工业级装备",这里有几个关键步骤。

(1)数据大扫除。先把散落在各部门的Excel表、系统报表整理成一致格式(就像把方言翻译成普通话一样),然后为数据打标签,如哪些是过期货需求淘汰,哪些需求重点保护(就像整理乱糟糟的仓库一样)。

(2)权限开关系统。设置查看权限,如销售总监可以查看全公司的数据,而区域经理只能查看本人所管辖的片区。敏感信息需求自动马赛克比如遇到"把董事长工资发我看看"这种央求,系统会自动屏蔽。

(3)傻瓜式操作晋级。加装语音功能,如不会打字的市场部王姐,直接说“帮我查上周爆款商品的退货缘由”,AI就可以直接语音回答。让AI自动了解行业黑话,如在采购时说“那批水货”,AI要明白指的是“海关特殊渠道商品”而不是山寨货。

(4)安全防护网。给AI安装警报器,当遇到“把客户名单发到外网”这类风险指令时,系统会像踩急刹车一样立刻中止操作。定期“体检”就像给AI打疫苗,防止它吸收过多奇异的成绩。

············end ··············支持华仔,如今就买!

关注华仔视频号,一同改变
               ▼点击关注华仔公众号▼




欢迎光临 职贝云数AI新零售门户 (https://www.taojin168.com/cloud/) Powered by Discuz! X3.5