关于聚合组使用的疑问

classic Classic list List threaded Threaded
2 messages Options
Reply | Threaded
Open this post in threaded view
|  
Report Content as Inappropriate

关于聚合组使用的疑问

zhongyuhai
本人CUBE有8个维度,如下:
stat_period-统计日期
year-业务年
month-业务月
comid-机构
d1-xxx
d2-xxx
d3-xxx
d4-xxx

尝试了一下的聚合方案:

聚合方案1:
聚合组A:
强制维度:stat_period
包含维度:其余7个维度
生成CUBE,共200M。

聚合方案2:
聚合组A:
强制维度:stat_period
包含维度:5个维度,不包含year和month
聚合组B:
强制维度:year
包含维度:5个维度,不包含stat_period和month
聚合组C:
强制维度:month
包含维度:5个维度,不包含stat_period和year
生成CUBE,共700M。

按理解,聚合方案1应该产生更多的CUBOID,聚合方案2应该产生更少的CUBOID,当不明白为什么聚合方案2的数据量更大呢?

谢谢!

Reply | Threaded
Open this post in threaded view
|  
Report Content as Inappropriate

Re: 关于聚合组使用的疑问

shaofengshi
Is there any other difference? Like the source data count, the encodings,
or the measures?


在 2017年5月21日 上午10:19,zhongyuhai <[hidden email]>写道:

> 本人CUBE有8个维度,如下:
> stat_period-统计日期
> year-业务年
> month-业务月
> comid-机构
> d1-xxx
> d2-xxx
> d3-xxx
> d4-xxx
>
> 尝试了一下的聚合方案:
>
> 聚合方案1:
> 聚合组A:
> 强制维度:stat_period
> 包含维度:其余7个维度
> *生成CUBE,共200M。*
>
> 聚合方案2:
> 聚合组A:
> 强制维度:stat_period
> 包含维度:5个维度,不包含year和month
> 聚合组B:
> 强制维度:year
> 包含维度:5个维度,不包含stat_period和month
> 聚合组C:
> 强制维度:month
> 包含维度:5个维度,不包含stat_period和year
> *生成CUBE,共700M。*
>
> 按理解,聚合方案1应该产生更多的CUBOID,聚合方案2应该产生更少的CUBOID,当不明白为什么聚合方案2的数据量更大呢?
>
> 谢谢!
>
>
>
> --
> View this message in context: http://apache-kylin.74782.x6.
> nabble.com/-tp8046.html
> Sent from the Apache Kylin mailing list archive at Nabble.com.




--
Best regards,

Shaofeng Shi 史少锋
Loading...