最新阿里云ACP大数据题库更新(12.3)

1.ODPS表t1、t2都是分区表,分区键是pt,对于sql语句select t1.id from t1 left outer join t2 on t1.id=t2.id where t1.pt=’20140101’ and t2.pt=’20140101’,哪一个说法是正确的

A.两张表都会进行分区裁剪

B.t2表会进行分区裁剪

C.t1表会进行分区裁剪

D.两张表都不会进行分区裁剪

【参考答案】C

【参考解析】当两个表进行join操作的时候,主表的Where限制可以写在最后,从表要先完成分区筛选后再进行Join操作;从表分区限制条件不允许写在Where条件里,要求写在ON条件或者子查询,主表可以写在WHERE条件里(最好先用子查询过滤)。

 

2、DRDS事务支持哪种一致性?

A.最终一致性事务

B.会话一致性事务

C.强一致性事务

D.因果一致性事务

【参考答案】A

【参考解析】

 

3、关于ODPS MR哪项说法是正确的?

A.mapworker 在输出数据时,需要为每一条输出数据指定一个key

B.进入reduce前,数据需要进行合并操作,然后按照key排序

C. map和reduce前都需要对数据进行分片

D.reducer的个数和mapper的个数一致

【参考答案】A

【参考解析】

 

4、大型会员制连锁超市S使用OTS来存储消费记录表,里面包含了客户的vip卡号、订单标识,超市分店标识,商品标识,购买时间等,业务逻辑遵循以下规则:每个vip卡号对应一个客户,同时一个客户职能拥有一个vip卡号;该连锁超市的不同分店都拥有唯一的分店标识;订单标识按照时间顺序产生;为了让数据分布和访问了的分布尽可能均匀,一下备注主键中哪一组最合适?

A.购买时间,vip卡号

B.vip卡号,购买时间

C.vip卡号

D.订单标识,vip卡号

【参考答案】B

【参考解析】主键的第一列是分片键
购买时间,vip卡号:购买时间,不同时间购买热度不一样
VIP卡号,购买时间:每天每张卡产生的消费记录数从总体上来讲是均匀的,每一个分片键中的访问压力也应该是均匀的。以CardID作为表的分片键可以较好地利用预留读写吞吐量资源
VIP卡号:不能唯一标识
订单标识, VIP卡号:作为表的分片键不是一个好的选择。因为订单标识是顺序增长的,因此在同一段时间内产生的消费订单的订单标识的值会集中在一个较小的范围内,这些消费订单记录会集中写入到个别的分片,预留读写吞吐量没有得到高效的利用。

 

5、对于ADS的数据一致性问题,那个说法是错误的?

A.当updateType=realtime时,对于不同主键数据的多次变更,ADS不保证先执行的变更会比后执行的变更更优秀的查询

B.当updateType=realtime时,不支持事务,并且仅遵循会话一致性的设计,所以ADS并不能作为OLTP系统使用 解释:最终一致性

C.当updateType=realtime时,当业务端暂停数据写入的若干时间后,ADS会保证数据的一致性

D.当updateType=realtime时,对于同一主键数据的多次变更,ADS会遵循ADS返回语句执行成功的顺序进行

【参考答案】B

【参考解析】

 

6、对于ODPS的多路输出(multi insert),哪些项描述是不正确的?

A.对于源表为分区表的,相同的一个分区不能出现多次

B.目标表为分区表的,对于不同的分区,可以混合使用insert into
和insert overwrite,对于相同的分区则不可混用

C.一般情况下,单个sql中最多可以写128路输出

D.对于源表为未分区表的,该表可以出现多次

【参考答案】BD

【参考解析】一般情况下,单个SQL里最多可以写128路输出,超过128路报语法错误。
在一个multi insert中,对于分区表,同一个目标分区不可以出现多次; 对于未分区表,该表不能出现多次。
对于同一张分区表的不同分区,不能同时有insert overwrite和insert into操作,否则报错返回。

 

7、ADS使用DUMP DATA导出数据时,以限制导出行数为1000为例(LIMIT 1000),哪些说法是正确的?

A.实际数据行数可能小于1000

B.实际数据行数可能等于1000

C.实际数据行数严格等于1000

D.实际数据行数可能稍大于1000

E.

【参考答案】ABD

【参考解析】导出方式对海量数据的计算输出具有良好的性能(百万行数据导出在数百毫秒数据级),但是,对于数据精确度有一定牺牲,即实际返回的数据行数,可能是不完全精确。 以限制导出行数为1000为例(LIMIT 1000):
实际数据行数可能稍大于1000,例如此时有120个数据分片,则等同于每个分区明确指定”LIMIT 9″,最多肯能返回1080
实际数据行数可能稍小于1000,如果符合条件的行数的总数小于1000
实际数据行数可能稍小于1000,如果数据分片很均匀,例如此时有120个数据分片,如果某些分片返回数据行小于9的话,则等同于每个分区明确指定”LIMIT 9″

 

8、ADS中,同一个表组的表具有以下哪些相同的属性?

A.记录条数

B.一级hash分区数

C.副本数

D.二级List分区数

【参考答案】BC

【参考解析】ADS要求一个表组下所有表的一级分区数目一致。
一个表组所有表副本数一致。

 

9、云盾安骑士可以保防阿里云以外的服务器。

 判断题答案 (正确填T,错误填F)

【参考答案】T

【参考解析】

 

10、ODPS SQL不支持正则表达式。

 判断题答案 (正确填T,错误填F)

【参考答案】F

【参考解析】