DLA支持MongoDB的嵌套字段查询

  1. 云栖社区>
  2. 阿里云Data Lake Analytics>
  3. 博客>
  4. 正文

DLA支持MongoDB的嵌套字段查询

xumingmingv 2020-02-13 11:22:46 浏览277
展开阅读全文

背景

DLA之前对于MongoDB只支持简单类型的映射查询,对于嵌套字段无法直接查询,最近我们加入了对嵌套字段直接查询的支持,这篇文章给大家介绍一下。

MongoDB嵌套字段查询详解

首先我们在MongoDB里面准备一个带有嵌套数据结构的collection:

db.Ha.insert({
    id: 1,
    name: "james",
    age: 1,
    details: {
      city: "hangzhou"
    }
});

这里 details 里面的 city 字段就是一个嵌套的字段。然后我们来创建一个DLA里面的表:

CREATE EXTERNAL TABLE `Ha` (
    `id` int,
    `name` string,
    `age` int,
    `city` string
)
TBLPROPERTIES (
    COLUMN_MAPPING = 'city,details.city;'
)

注意,我们这里用到了 COLUMN_MAPPING 的功能,它的作用是把用户在DLA层面声明的字段名映射到底层MongoDB里面的字段名,这里我们把 city 映射到了底层的 details.city 这个嵌套的字段。我们来查一下试试:

mysql> select * from Ha;
+------+-------+------+----------+
| id   | name  | age  | city     |
+------+-------+------+----------+
|    1 | james |    1 | hangzhou |
+------+-------+------+----------+

搞定!

总结

这篇文章给大家介绍了一下怎么利用DLA去直接查询MongoDB里面的嵌套字段,在这个功能出现之前,我们只能把整个嵌套字段映射成一个string字段,然后利用json函数把要查询的具体嵌套字段拆解出来,有了这个功能之后,查询MongoDB嵌套字段会更方便,更高效。
Happy DLAing

欢迎关注数据湖技术社区

数据湖开发者社区由 阿里云开发者社区 与 阿里云Data Lake Analytics团队 共同发起,致力于推广数据湖相关技术,包括hudi、delta、spark、presto、oss、元数据、存储加速、格式发现等,学习如何构建数据湖分析系统,打造适合业务的数据架构。

x

网友评论

登录后评论
0/500
评论
xumingmingv
+ 关注
所属团队号: 阿里云Data Lake Analytics