开发者社区 问答 正文

MaxCompute筛检重复数据,将新数据存储到mysql数据库中

大家好,我这儿有个基于MaxCompute的数据分析的项目,想通过程序筛检MaxCompute中的冗余数据,并且存储到mysql中.求个合作.

展开
收起
arvinlbc 2017-05-15 14:10:59 4310 分享
分享
版权
举报
1 条回答
写回答
取消 提交回答
  • 1、查找表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断 select * from peoplewhere peopleId in (select   peopleId from   people group by   peopleId having count (peopleId) > 1) 2、删除表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断,只留有rowid最小的记录 delete from people where peopleId in (select   peopleId from people group by   peopleId   having count (peopleId) > 1)and rowid not in (select min(rowid) from   people group by peopleId having count(peopleId )>1) 3、查找表中多余的重复记录(多个字段)  select * from vitae awhere (a.peopleId,a.seq) in   (select peopleId,seq from vitae group by peopleId,seq having 
    

    扩展资料 FROM子句指定SELECT语句查询及与查询相关的表或视图。在FROM子句中最多可指定256个表或视图,它们之间用逗号分隔。 在FROM子句同时指定多个表或视图时,如果选择列表中存在同名列,这时应使用对象名限定这些列所属的表或视图。 例如在usertable和citytable表中同时存在cityid列,在查询两个表中的cityid时应使用下面语句格式加以限定: SELECTusername,citytable.cityid FROMusertable,citytable WHEREusertable.cityid=citytable.cityid 在FROM子句中可用以下两种格式为表或视图指定别名: 表名 as 别名 表名 别名

    “答案来源于网络,供您参考” 希望以上信息可以帮到您!

    2019-09-27 10:08:58 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等