1、第9章 数据分析进阶章节内容 9.1 DAX语言高阶函数应用 9.L1数据分组和合并函数 9.L2数据查询函数 9.1.3日期时间函数 9.L4排名函数 9.2DAX语言数据分析高阶技巧 921VAR的用法 922度量值的收纳盒 9.3 DAX语言数据分析深入理解 931公式引擎 9.3.2存者引擎 9.3.3 DAX公式性能分析29.1.1数据分组和合并函数数据分组和合并函数用于构造作为计算基础的逻辑数据表,可以 作为计算函数的数据源参数,也可以用于构造计算表。两张基础表Productl=DataTable(ProductlD,STRING,ProductName,STRING,Produc
2、tPrice,DOUBLE,(001,Coffee,20.0,“0027 tea,15.0,003,Juice,18.0Product?=DataTable(ProductlD,STRING,ProductName,STRING,ProductPrice,DOUBLE,003,Juice,18.0,004,Cake,12.0,005,Bread,10.0)39.1.1数据分组和合并函数 L UNION函数 UNION函数实现集合的并运算,其原型是:UNION(/,.)其中table_epression可以是已有的数据表名,也可以是返回表对象的DAX表达式,UNION要录至少有2个参数,作为合并
3、参数的多个表的结构需要保持一致,即列 数相同,列属性相容,最终结果表的列属性名由第一个参数给出的表的列属性 名决定。最终返回的逻辑表包含作为参数的表对象的所有数据行,因此可能会 有重复行出现。一 例如,ProductTablel=UNION(productl,product2)的计算结果表如图9-1 所示。X V 1 ProductTablel=UNION(productl product2)ProductID 匚|ProductName 日ProductPrice002tea15003Juice18001Coffee20005Bread10004Cake12003Juice1849.1.1数
4、据分组和合并函数 2.EXCEPT函数 EXCEPT函数实现集合的减运算,其原型是:EXCEPT(,其中table_expression1和table_expression2是两个具有相同结构的表对象,可以是已有的数据表名,也可以是返回表对象的DAX表达式。返回值是 用表对象table_expression1减去表对象table_expression2之后得到的逻辑 表,艮口包含属于table_expression1但是不属于table_expression2的数据行,最终结果表对象的列属性名由参数table_expression1给出的表的列篇性名 决定。_ _ 例如,ProductTabl
5、e2=EXCEI 1 ProductTable2=EXCEPTlCProductljProductZ)冬|9-2月斤小 oProductID 号ProductName 臼ProductPrice 号002tea15001Coffee209.1.1数据分组和合并函数 3.INTERSECT函数 INTERSECT函数实现集合的交运算,其原型是:INTERSECT(,)其中table_expression1和table_expression2是两个具有相同结构的表对象,可以是已有的数据表名,也可以是返回表可象的DAX表达式。INTERSECT 函数判断table_expression1中的每个数据
6、行是否出现在table_expression2 中,如果出现厕作为结果表对象中的一人数据行。由于两不表中的任何 一个表都可能会有重复的数据行,因此用两个表作为参数调用INTERSECT 函数时,两个表放置的参数位置不同,函数返回的结果表对象也可能是 不同的。69.1.1数据分组和合并函数 ProductTable3=INTERSECT(ProductLProduct2)的计算结果如下图所zj OX V1 ProductTable3=INTERSECT(Productl,Product2)ProductID 臼ProductName 臼ProductPrice 臼003Juice18 Produ
7、ctTable4=INTERSECT(ProductTableLProduct2)的计算结果如下图所示,注J 响。x v1 ProductTable4=INTERSECT(ProductTablel,Product2))复行对结果的影ProductID 号|ProductName 臼ProductPrice 臼005Bread10004Cake12003Juice18003Juice1879.1.2数据查询函数案例基础:,完整的产品表Product:Product=UNION(Productl,EXCEPT(Product2,ProductTable3)假设还有一张产品销售表SALESSale
8、s=DataTable(ProductlD,STRING,Count,INTEGER,SALESDATE,DATETIME,001,200,2021-1-1,002,100,2021-1-1,003,500,2021-1-2,001,200,2021-1-2,002,100,2021-1-3,004,100,2021-1-3,001,200,2021-1-4,002,1,100;,2021-l-4,001,500,2021-1-4,005,200,2021-1-5,002,100;,2021-l-5,003,100,2021-1-5)89.1.2数据查询函数 PRODUCT和SALES两表之间
9、通过ProductID字段建立1对多的联系同 SalesZ CountProductID*国 SALESDATE折叠人199.1.2数据查询函数 1.RELEATED 函数 对于已建立好关系的两张表如果以其中一张表为基准表,另一张 表为查询表的话,则用查询表的某个数据列作为参数调用 RELATED函数时,RELATED函数会为基准表中的每个数据行,根据 关系从查询表中提取作为RELATED函数参数的数据列的值。因此RELATED函数主要有两种用途一个是通过关系提取查询表的指定列数据从而为基准表构造一个新的计 算列;另一个就是在不构造计算列的情况下,通过对提取自查询表的数据进行 筛选,从而为基于
10、基准表的计算构造新的筛选上下文。109.1.2数据查询函数 RELATED函数的原型是:RELATED()基准表由调用RELATED函数的表达式上下文确定,而RELATED函数唯一的参数(column是指 查询表中的某个数据列名称(希望根据关系从查询表中提取的数据列)。例如,如果要为SALES表添加一个计算歹!JProductname,则基准表是SALES表,查询表为 Product表,计算列Productname的度量值公式如下:Productname=RELATED(ProductProductName)X V 1 Productname=RELATED(ProductProductNam
11、e)ProductID 日CountSALESDATE 日Productname p|0012002021/1/1 0:00:00Coffee0021002021/1/1 0:00:00tea0035002021/1/2 0:00:00Juice0012002021/1/2 0:00:00Coffee0021002021/1/3 0:00:00tea0041002021/1/3 0:00:00Cake0012002021/1/4 0:00:00Coffee0021002021/1/4 0:00:00tea119.1.2数据查询函数 2.RELATEDTABLE函数 RELATEDTABLE函数
12、主要用于将建立好关系的两张表连接起来,从而构造计算所基于的筛选 上下文。其函数原型是:RELATEDTABLE()调用RELATEDTABLE函数时,通常将建立好关系的两张表中的一张表作为基准表,参数 tableName是与基准表连接的另一张表,RELATEDTABLE函数会根据基准表中的每个数据行依 据关系去tableName表中查找匹配的数据行,函数调用结果所得到的是一个临时逻辑表。案例:统计Product表中每种商品的销售总量:销售总量=sumx(RELATEDTABLE(Sales),SalesCount)X/1 销售总量=sumx|(|RELATEDTABLE(Sales),Sale
13、sCount)ProductID 日ProductName 臼ProductPrice 号销售总量Q002tea15400003Juice18600001Coffee201100005Bread10200004Cake12100129.1.2数据查询函数 3.LOOKUPVALUE函数当两张表之间没有建立关系时,可以使用LOOKUPVALUE函数实现查找任 务。LOOKUPVALUE函数可以在指定的目标数据源表中查找满足参数给出 条件的数据行,并返回指定的数据列的属性值,并且LOOKUPVALUE函数 在目标表中查找时,会忽略所有加在目标表上的筛选条件,因此适合于 在复杂的上下文环境中进行查找
14、。其函数原型是:LOOKUPVALUE(,.,)139.1.2数据查询函数案例:实现为SALES表增加一个计算列“产品名称”显示每条销售记录中产品的名称产品名称二 1。01叩丫31呢(中111戊叫0|11卸31716111戊仃111戊1口53屈叩0|11(12,“未找到“)X J 1产品名称=2 look叩value(Product ProductName,Product ProductID,SalesProductID,未找到)3ProductID 臼Count 臼SALESDATE 臼Productname 臼产品名称臼0012002021/1/1 0:00:00CoffeeCoffee0
15、021002021/1/1 0:00:00teatea0035002021/1/2 0:00:00JuiceJuice0012002021/1/2 0:00:00CoffeeCoffee0021002021/1/3 0:00:00teatea0041002021/1/3 0:00:00CakeCake0012002021/1/4 0:00:00CoffeeCoffee0021002021/1/4 0:00:00teatea149.1.2数据查询函数 4.VALUES函数 VALUES函数用于对数据列的值去重或者对数据表的数据行去重,提取不包含重复值的结果。其函数原型是:VALUES()唯一的参
16、数表示需要提取不重复数据的数据源表或数据列的名 称。VALUES函数的主要用途是作为其他函数调用时的参数为统计和计算提供数据源或筛选条件 来源。案例:得到SALES表中哪些产品有销售记录,实现X 产品名称表alesPES)、,,ProductID 卜|产品名称表二 values(SalesProductlD)001002003004005159.1.2数据查询函数 5.HASONEVALUE函数 HASONEVALUE函数通常用于筛选器使用情况判断。如果作为筛 选器使用的表的字段被筛选后在使用的当前上下文中只剩下一 个非重复的值,则返回真,而如果对作为筛选器的表字段没有 使用,或者筛选后留下多
17、个值,则返回假。函数原型是:HASONEVALUE()唯一的参数表示作为筛选器使用的表字段。HASONEVALUE函数通常可以作为IF函数的第一个参数实现动态 计算。169.1.2数据查询函数案例:结合卡片图和筛选器实现查看单独一个产品的销售量。销售总量的度量值:总销售量二 if(HASONEVALUE(ProductProductName),sum(SalesCount)J 选中不止一种产品“)Vr-116001L_J匡曲回py密MIMeDRD 蓝 度必E圆回 TV筛选器公 可视化P搜索里Iflfl此视觉对象上的筛选器E_ 0tea目等于Juice局圉筛选类型唱口基本筛选xzDa搜索回全选字
18、段 Bread1总销售呈 Cake10 Juice1钻取1 1 tea1跨报表 Coffee1179.1.3日期时间函数 i.构造基于时间智能分析的日历表在商业智能分析中,往往需要基于销售或生产等商业活动的日期 进行不同粒度的时间智能分析,例如分析不同年份、季度、月份、星期的商业活动指标,以及这些指标的同比、环比等分析。商业活动的年度分析往往与自然年不同,并不都是从1月1日开始 到12月31日结束,因此这些时间智能分析需要构造和商业活动紧 密相关的日历表,日历表中包含着和商业活动相关的年度、季度、月度、星期、日期以及其他可能的不同粒度的日期和时间数据。189.1.3日期时间函数CALENDAR
19、函数用于构造日历表,其函数原型是:CALENDAR(,)参数start_date表示开始日期,end_date表示结束日期,CALENDAR函数将 构造一个从starjdate开始直到end_date为止的所有日期组成的日历表,这个日历表只有一列数据,列名为date。例。在二手房数据库中,如下公式将创建一张名为“2000至2020 年日期表”的新表,该表包含2000年1月1日到2020年12月31日的 所有日期。2000至2020年日期表=CALENDAR(DATE(2000,1,1),DATE(2020,12,31)199.1.3日期时间函数通常会基于应用系统数据库中包含交易日期的某个数据表
20、调用 CALENDAR函数生成定制的日历表,然后结合日期函数来构造年、月、日、星期、季度等计算列,从而形成面向应用的具有各个时 间粒度数据的日历表,作为调用日期时间智能函数进行沿时间维 度的数据分析的基础209.1.3日期时间函数X 工23456 789101112housesales_calendar=ADDCOLUMNS(CALENDAR(FIRSTDATE(housesale_date),LASTDATE(housesale_date),“年“,YEAR(Da-te),“季度“,ROUNDUP(mon-th(Date )/3,0),月,MONTH(Da-te),“周“,WEEKNUM(D
21、ate),“年季度”,year(Date)&Q&round up(month(Da-te)/3,0),“年月”,year(Dae )*100+MONTH(Da-te),“年周”,year(Date)*100+WEEKNUM(Date),“星其月几”,WEEKDAY(Da-te)Date|年Hl季度HI月E周年季度EE年月H年周H星期几2018/7/1 0:00:00201837272O18Q320180720182712018/7/2 0:00:00201837272O18Q320180720182722018/7/3 0:00:00201837272O18Q32018072018273201
22、8/7/4 0:00:00201837272O18Q320180720182742018/7/5 0:00:00201837272O1SQ.320180720182752018/7/6 0:00:00201837272O18Q320180720182762018/7/7 0:00:00201837272O18Q320180720182772018/7/8 0:00:00201837282O18Q.320180720182812018/7/9 0:00:00201837282O18Q32018072018282219.1.3日期时间函数时间智能分析以二手房数据库为例,首先介绍一下基于时间的智能分
23、析的概念。在关 系视图中将house表的sales_data列与housesales_calendar表的date列用鼠 标拉到一起,就将前面构造的日历表housesales_calendar与二手房销售表 house建立了关系,接下来就可以通过对housesales_calendar表的筛选来构造不同粒度的时间智能分析。229.1,3日期时间函数在报表页中放置两个卡片图可视化对象,分别显示“二手房销售数量”和“二手房每平米 均价”两个量化指标。使用二手房销售日历表housesales_calendar构造一个切片器对象,则可以根据切片器对象的 值属性是使用的二手房销售日历袤的哪一列,能够对二
24、手房销售数据进行不同年份、季度 等粒度的日期智能分析。V E-2018/3/18 2019/2/28II O-O693二手房销售数量33.32 千每平米均价国曲 E l w的 随陋。国R曲 宣后区分回 匡史HE4 为 k.Housesales.calendartDateDate X钻取跨报表239.1.3日期时间函数创建一个矩阵对象,设置其行属性为日历表的“年季度”歹U,值属性为“二手房销售数量”和“二手房每平米均价”两个度量值。这对于该矩阵的每一行,都会根据这一行的“年季 度”列的值,对二手房销售信息表的数据行进行筛选,在此筛选上下文环境中,再计算度 量值,就得到了矩阵对象中对于该行年季度值
25、的“二手房销售数量”和“二手房每平米均 价”。星曲M M屋皿 西区必后呢曲陋 黑面号区0 晅 Slo Q|i=一249.1.3日期时间函数 二手房销售量年同比增长率的计算公式是:二手房销售量年同比增长率二本年度二手房销售量-上年度二手房销售量上年度二手房销售量 年度同比增长率二 divide(count(houseno)-CALCULATEfcountfhousetnoDAMEPERIODLASTYEARChousesalesalendartDate CALCULATE(count(houseno),SAMEPERIODLASTYEAR(housesales_calendarDate)259.
26、1.1 数据分组和合并函数 年度同比增长率2=divide(count(houseno)-CALCULATE(count(houseno),PREVIOUSYEAR(,housesales_calendar,Date),CALCULATE(count(houseno),PREVIOUSYEAR(,housesales_calendar,Date)269.1.1数据分组和合并函数V 口 7-1阵年度同比增长率醺同比增长率2-120182.602.6020193.433.43|20200.79-0.58I总计2.27IIL_JI邑号破.行年/X列在此处添加数据字段值年度同比增长率 X年度同比增长率
27、2 V X279.1.4排名函数 1.RANKX 函数 RANKX的功能是按照某个规则给数据表中的每一行进行排名,其函数原型是:RANKX(,)第一个参数是要进行排名的数据源表 第二个参数(expression是返回唯一一个标量值的DAX表达式,通常会包含表中 的列属性,指定了为表中每个数据行计算排名值的规则。第三个可选参数,如果不给出,则默认值就是第二个参数(expression。第四个可选参数用于规定排序的方向,不设置时默认值为0或者FALSE,表示按 照降序进行排名,如果设置为1或者TRUE,则表示按照升序进行排名。第五个可选参数用于规定当用于排名的数据行的expression值相同时,
28、如何规定 相同值之后的值的排名。289.1.4排名函数假设希望从装修程度角度分析一下二手房价格的排名,则可以定义按照装修程度对二手房 每平米均价排名的度量值:装修程度二手房均价排名二rankx(all(houseequipment),house每平米均价)然后在报表页中创建一个矩阵可视化对象,将其行属性设置为house表的equipment列,值 属性设置为度量值“每平米均价”和“装修程度二手房均价排名”。equipment每平米均价装修程度二手房均价排名 豪装40,601.491中装37,437.622精装34,758.063简装32,283.864毛坯28,609.605总计34,009.
29、204H T Q行equipment 7 X列在此处添加数据字段值每平米均价 X装修程度二手房均价排XV团299.1.4排名函数 通过对比2010年前后二手房均价的相对排名,演示第三个参数的作用。2010年之前装修程度二手房均价排名=rankx(all(houseequipment)J2010 年之前每平米均价)2010年起装修程度二手房均价相对2010年前的排名=rankx(all(houseequipment)J2010年之前每平米均价2010年及之后每 平米均价)在报表页中创建一个矩阵可视化对象,将其行属性设置为house表的 equipment列,值属性设置为度量值“2010牟之前每*
30、米上匀价”、“2010年之前装修程度二手房均价排名”、“2010年及之后每平米均价”和“2010年起装修程度二手房均价相对2010年前的排名”。309.1.4排名函数_ 一由二Equipment 2010年之前每平米均价201阵之前装修程度一手房均价排名201闿及之后每平米均价2010讦起装修程度一手房均价相对2010年前的排名,豪装40,040.00141,433.331中装38,26131230,720.005精装35,827.32333,119.845简装34,33322427,502.015毛坯27,343.97528,962.975总计35,788.77431,117.795行equ
31、ipment v X列在此处添加数据字段值2010年之前每平米均价v X2010年之前装修程度二,X2010年及之后每平米均 X2010年起装修gg二手N X319.1.4排名函数 2.TOPN 函数如果需要按照某种规则进行排名后返回排行较前的若干数据,则可以使用TOPN()函数,其 函数原型如下:TOPN(n_value,table,orderBy_expression,order,orderBy_expression,order.)第一个参数n_value说明返回的数据行数 第二个参数table说明数据源表 第三个参数orderBy_expression给出排名依据的表达式,通常会包含数据
32、源表中的列属性。可选参数order说明是按照升序还是降序排名,其用法与RANKX()函数中一致。如果进行排 空时,当orderBy_expression的值相同舟,仍然希望继续根据其彳也规则分出哇名高低,厕 可以继续使用可速的后续orderBy_expression。TOPN函数实际上返回的是参数table的一个子集,包含按照给定表达式排名后的n_value 个数据行。329.1.4排名函数可以使用TOPN来构造生成表,提取二手房销售表中面积最大的10 套二手房,其DAX公式定义如下,而生成的数据表如图所示:面积最大的10 套二手房=TOPN(10,house,housearea)X/1 面积
33、最大的 1。套二手房=TOPNlOj house,house area)no Hrooms 日halls 臼toilets 臼area 臼direction臼 househeight 臼buildingheight 臼equipment 臼buildingyear 臼10776522204南北89中装200714317422223.4南北1728精装200911973423227.1南北56毛坯201610710422223.8南1010精装200611294524239.3南北2028毛坯201413410422245.8南东北77毛坯200810433423231南北16毛坯2014143
34、88423228.8南北36毛坯201310801423262.8南北1224精装201110767422279.5南北1625精装201333921 VAR的用法 VAR方法的基本语法是:度量值=VAR临时变量名1二DAX公式工 VAR临时变量名2二DAX公式2 VAR临时变量名n=DAX公式n RETURN临时变量名n34921 VAR的用法 计算信息表二 var maxprice=max(houseunit_price)var minprice=min(houseunit_price)var avgprice=AVERAGE(houseunit_price)var tl=row(属性J
35、最高价,值,maxprice)var t2/row(属性11J最低价11J值4minprice)var t3=row(属性,平均价J 值avgprice)var total=union(union(tl,t2),t3)return total属性日 值 臼最高价 100700最低价 9700平均价 34009.2021857923359.2.1 VAR的用法 季度同比增长率VAR方法=VAR CURSALES=count(houseno)VAR PREVSALES=CALCULATE(count(houseno),PREVIOUSQUARTER(,housesales_calen darDat
36、e)VAR RES=divide(CURSALES-PREVSALES,PREVSALES)RETURN RES369.2.1 VAR的用法VAR用法的优点主要是:可以将复杂的计算过程分解表达,从而便于实现,也便于理解;VAR中定义的名字对象的计算,其计算过程不受上下文筛选环境的影响,仅仅由其DAX公式定义本身决定,而如果不使用VAR用法,则名字对象所 对应的子表达式的计算会受其所应用的外部表达式的上下文筛选环境约 束。VAR定义的名字被计算后,就被保存下来,后面需要时就可以直接使用,而不需要重新计算,从而可以提高性能。可以方便进行调试。379.2.2度量值的管理随着数据分析的进度不断拓展,从
37、不同角度对当前的数据集建 立了不同的分析模型后,每个 分析模型都需要建立相应的度 量值,因此度量值会越来越多,而且分属于不同的数据表,这 样会使得当前数据表视图显得 非常杂乱,难以管理。5fl 2000至2020年曰期表 block distance_metroblockhouse2000年后每平米均价201 0年之前每平米均价201 0年及之后二手房数量1201 0年及之后二手房数量2201 0年及之后每平米均价201 0年及之后每平米均价2201 0年及之后每平米均价338922度量值的管理当面临复杂的数据分析模型时,首先在创建度量值时对属性列名 要使用带表名限定的形式,然后可以根据需要创
38、建一张或多张专 门存储度量值的表,以分类管理所有的度量值。(1)创建一张专门的度量值管理表。(2)将分散在其他表中的度量值移动到专门的度量值管理表中。39922度量值的管理通过Power Bl Desktop主页”中的“输入数据”按钮,调出“创建表”对话 框,表名可以自己决定,需要顾名思义,例如可以命名为“房价相关的度量 值”;该表只有一列,这一列其实没有实际用途,仅仅是为了满足建表的结 构需要,因此列名也可以随便取名。40922度量值的管理首先选中要管理的度量值,然后通过Power Bl Desktop的“度量工 具”选项卡中的“主表”按钮调出度量值归属表的下拉列表,选 择“房价相关的度量值
39、”表,这样就将选中的度量值的归属表从 原表调整为“房价相关的度量值”表。文件 主页 帮助 外部工具 表工具 度量工具$力格式I常规$V%,线叵格式化ZI 3图数据类别|未分类属性S 1新建度量值快度量值计算字段二手房统计信息表=CALCULATE(AVERAGE(house unit_price)jALLEXCEPT(house,house equipment)lOoflH帽相关的度量值area direction househeight buildingheight 习 equipmentbuildingyear 南北3精装2008BK004A 尸位系曲枳区大的i ux一手房ICANALYS
40、ISMETRICS189.8南北77中装2009BK007 噩 ANALYSISMETRICS1(.179南北67精装2013BK0231(.block180.9南北67精装2010BK061 剧 block1(.distance metroblock189.6南北77中装2009BK007 distance_metroblock1(house179.1南北27精装2010BK023窗 houseIC188.4南北77简装2007BK230层房里露iousesales_calendar197.3南北47简装2006BK230-同前率中扩(介2南北精装BK0601jmetrostation191
41、.33720061 0每平米均价3南北7精装2009BK230PRICECONDTABLE 面情出即旃187.6南北77中装2008BK230RANKPARA178.2南北37简装2011BK023身总房价11321 2 2184.3南北47中装2009BK0601最高总房价11335 2 2185.3南北27精装2010BK715既 ageclass 5 arpa419.3 DAX语言数据分析深入理解任何DAX公式的计算过程都是由以下两个引擎处理的:公式引擎和存储引擎。当Power BI将一个DAX公式发送给包含着语义模型的分析服务引擎后,分析 服务引擎会产生一个相应的查询计划,并由公式引擎
42、和存储引擎具体执行。存储引擎负责提取数据,公式引擎负责完成存储引擎无法有效完成的复杂的 计算和处理操作。429.3.1公式引擎公式引擎负责将DAX公式查询分解为由一系列具体执行步骤构成 的查询计划,这些具体的执行步骤包括表的连接、结合筛选上下 文条件对数据的筛选、数据的聚合计算以及数据的查询等等。公式引擎能够实现对数据的计算和处理,但是当需要数据时,公 式引擎依赖于存储引擎提供数据。439.3.2存储引擎当收到公式引擎的数据提取请求后,存储引擎根据要求从表中直 接取出数据,或者也可能需要将来自不同表的数据集成起来,然 后以未压缩的形式返回给公式引擎。DAX的存储引擎有两种不同的实现:基于内存存
43、储的VertiPaq引擎 和基于原始数据源的DirectQuery引擎。449.3.2存储弓【擎(1)VertiPaq存储引擎 VertiPaq存储引擎在微软的官方名称是xVelocity in-memory Analytical Engine-这是一种内存列式数据库。在大多数数据源中,例如关系数据库 中,数据表都是按行存储并由多个属性构成,每行数据表示现实世界的一个 实体,所有行的相同属性构成了表的列。在实际存储的时候,数据按照一行 接一行的方式存储。当数据表被VertiPaq存储引擎从数据源读取到内存后,会进行如下处理:数据表在内存中按照列进行存储,即每一列独立存储,并且会根据数据类型对每
44、列数 据进行编码和压缩;为每列数据分别建立数据字典和索引;如果需要的话,创建实现表和表之间的联系数据结构;如果有计算列的话,计算得到计算列的数据并进行压缩。459.3.2存储弓【擎(2)DirectQuery存储引擎 DirectQuery存储引擎每次在需要向公式引擎返回数据时都是从数据源中读取数据表的内容,并且不会将数据缓存在内存中。一般来说,应该尽可能的使用VertiPaq存储引擎以获得较好 的性能。但在有些情况下可能必须使用DirectQuery存储引擎,可能的情况包括:原始数据源中数据会被频繁更改而报表中的可视化对象必须反映最新的数据分析结果;原始数据源中的数据量太大以至于无法用Ver
45、tiPaq存储引擎保存到内存中,则可以根据公式引擎的请求 使用DirectQuery存储引擎在数据源中查询,然后返回查询的结果数据集;数据源的数据所有方限制数据的使用,不允许应用下载完整的数据集本身,因此只能使用DirectQuery 存储引擎返回查询结果数据;数据源是包含有度量值的特殊情况,这些度量值只有在数据源中才具有正确的语义,因此无法导入 DAX公式引擎所在的应用在本地内存使用,则需要使用DirectQuery存储引擎返回在数据源中查询的结果。469.3.3 DAX公式性能分析可以使用Power BI自带的性能分析器对DAX分析模型的计算性能进行分析。在“视图”选项 卡中将“性能分析器”选中后可以显示性能分析器子窗口,可以分析报表中视觉对象的计 算性能,包括DAX公式查询的执行时间、视觉对象的显示绘制时间以及其他处理花费的时间 代价等。使用“复制查询 操作。.”功能还可以看到DAX公式所对应的实际查询计划所需要执行的每一步具体文件 主页 插入 建模 视图 帮助 外部工具 格式 数据/钻取|Aa I Aa I Aah“ii I Ihl ill il卜in页面视图移动布局匚j网格线对齐网格艇对象 口国尽筛选器书签选择!性能分析器1步切片器Imoffl福割雷318用示窗格 A X 。刷新视觉对象停止回啊清除口导出塞犯调蓄大小 移动设存 页面选项 性能分析器开始记录47
©2010-2025 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100