SQL 中的 For Xml Path解析
最近出的每日一题里面,有一道是关于合并同类型数据为一行的题,使用SQL Server 2017版本及以上的直接使用STRING_AGG()函数即可,但是2016版本以下是没有这个功能的,那该如何求解?
今天就给大家介绍一下FOR XML PATH,它就是用来处理低版本数据库中数据合并的,是一个比较古老的功能了,新版本中也依然还能使用。
FOR XML PATH 是将查询结果集以XML形式展现,将多行的结果,展示在同一行。
我们用实例来给大家介绍它的神奇之处。
我们创建一个统计学生爱好的表
CREATE TABLE Stu_Hobby( Stu_Name NVARCHAR(20),--姓名 Age INT,--年龄 Hobby NVARCHAR(20) --爱好 ) INSERT INTO Stu_Hobby VALUES ( N'张三',19,N'踢足球'), ( N'张三',19,N'打篮球'), ( N'张三',19,N'游泳'), ( N'李四',21,N'看电影'), ( N'李四',21,N'阅读'), ( N'王五',22,N'唱歌'), ( N'王五',22,N'玩游戏'), ( N'马六',19,N'踢足球'), ( N'赵七',20,N'爬山'), ( N'赵七',20,N'跑步')
查询学生爱好表Stu_Hobby里面的数据:
测试数据建立好后,我们开始对这个表里面的数据进行查询,并使用上FOR XML PATH。
SELECT *FROM dbo.Stu_Hobby FOR XML PATH;
结果如下:
它会生成一段XML代码,我们点击这行代码会弹出一整个XML的页面,由于篇幅较长,我们只截取一部分,具体如下:
此外我们还可以在FOR XML PATH的后面写参数,如果后面接参数,会将节点换成参数名称,例如:
SELECT * FROM dbo.Stu_Hobby FOR XML PATH(hobby)
结果如下图:
已经变成了我们添加的参数了。
跟我们实际需求相接近的是下面这个功能
我们可以单独输出某个字段的值,例如我们想看看学生爱好表中Hobby这一列具体有一些什么值,可以这样写:
SELECT Hobby+'、' FROM dbo.Stu_Hobby FOR XML PATH('')
注意:上面的+是字段拼接,就是将两个字符串用+连成一个字符串。然后我们把XML中的给去掉。
结果如下:
可以看到我们写的所有爱好都给列出来了,没有去掉重复的,可以理解成把列里的值都显示出来了。
我们现在想把上面的学生表里每个学生的爱好单独显示一行,爱好用"、"隔开。
SELECT A.Stu_Name, A.Age, (SELECT Hobby+'、' FROM [dbo].Stu_Hobby WHERE --必须加的匹配条件 Stu_Name=A.Stu_Name AND Age=A.Age FOR XML PATH('')) AS Hobby FROM [dbo].Stu_Hobby A GROUP BY A.Stu_Name,A.Age
见证奇迹的时刻到了!!!
对比我们先前建的表,这里已经将Hobby列的数据按每个学生变成了一行。
上面的WHERE条件是必须要的,如果去掉会怎么样呢?我们把WHERE条件注释掉看看会怎么样?
SELECT A.Stu_Name, A.Age, (SELECT Hobby+'、' FROM [dbo].Stu_Hobby --WHERE --必须加的匹配条件 --Stu_Name=A.Stu_Name AND Age=A.Age FOR XML PATH('')) AS Hobby FROM [dbo].Stu_Hobby A GROUP BY A.Stu_Name,A.Age
结果如下:
就会将Hobby列所有值都显示出来,很显然这不是我们要的结果
不知道小伙伴们有没有发现Hobby列的结果尾部多了一个"、",看着好别扭,有没有什么办法将它去掉呢?答案是肯定的。
先用一个LEFT()和LEN()函数来处理一下Hobby列
SELECT T.Stu_Name, T.Age, LEFT(T.Hobby,LEN(T.Hobby)-1) AS Hobby FROM (SELECT A.Stu_Name, A.Age, (SELECT Hobby+'、' FROM [dbo].Stu_Hobby WHERE --必须加的匹配条件 Stu_Name=A.Stu_Name AND Age=A.Age FOR XML PATH('')) AS Hobby FROM [dbo].Stu_Hobby A GROUP BY A.Stu_Name,A.Age ) T
结果如下:
这样我们的需求就得到了完美解决,但是这个代码有点长额,能不能简短一点呀?答案也是肯定滴!在将代码精简之前,我们需要先给大家介绍一个配合使用的函数:
STUFF()
STUFF()函数的作用
STUFF()函数用于删除指定长度的字符,并可以在指定的起点处插入另一组字符。STUFF()函数中如果开始位置或长度值是负数,或者如果开始位置大于第一个字符串的长度,将返回空字符串。如果要删除的长度大于第一个字符串的长度,将删除到第一个字符串中的第一个字符。
STUFF()函数的语法
STUFF ( character_expression , start , length ,character_expression )
参数解释
character_expression:一个字符数据表达式。character_expression 可以是常量、变量,也可以是字符列或二进制数据列。
start :一个整数值,指定删除和插入的开始位置。如果 start 或 length 为负,则返回空字符串。如果 start 比第一个 character_expression 长,则返回空字符串。start 可以是 bigint 类型。
length:一个整数,指定要删除的字符数。如果 length 比第一个 character_expression 长,则最多删除到最后一个 character_expression 中的最后一个字符。length 可以是 bigint 类型。
返回类型
如果 character_expression 是受支持的字符数据类型,则返回字符数据。如果 character_expression 是一个受支持的 binary 数据类型,则返回二进制数据。
注意事项
如果开始位置或长度值是负数,或者如果开始位置大于第一个字符串的长度,将返回空字符串。如果要删除的长度大于第一个字符串的长度,将删除到第一个字符串中的第一个字符。
如果结果值大于返回类型支持的最大值,则产生错误。
--以上信息来源微软官方文档
这定义看的头晕,我们还是来看看怎么使用吧
实例:
SELECT STUFF('abcdefg',1,0,'1234') --结果为'1234abcdefg' SELECT STUFF('abcdefg',1,1,'1234') --结果为'1234bcdefg' SELECT STUFF('abcdefg',2,1,'1234') --结果为'a1234cdefg' SELECT STUFF('abcdefg',2,2,'1234') --结果为'a1234defg'
说了这么多,我们看看STUFF怎么解决我们上面的问题吧,上代码:
SELECT A.Stu_Name, A.Age, STUFF( (SELECT '、'+Hobby FROM [dbo].Stu_Hobby WHERE --必须加的匹配条件 Stu_Name=A.Stu_Name AND Age=A.Age FOR XML PATH('') ),1,1,'') AS Hobby FROM [dbo].Stu_Hobby A GROUP BY A.Stu_Name,A.Age
是不是比LEFT简短一些啦?我们看一下结果是不是我们想要的。
完美!
好了,FOR XML PATH就介绍到这里了,小伙伴可以对比以上两种优化的方法,自行比较哪种方式更加简单易懂。