开发者社区> 问答> 正文

MaxCompute用正则表达式清洗数据的时候遇到报错:FAILED: ODPS-0121095:Invalid arguments - in function regexp_substr bad utf8 string input: 造成insert语句整体失败。 请问怎么忽略这一条错误的数据,继续处理其它数据?

MaxCompute用正则表达式清洗数据的时候遇到报错:FAILED: ODPS-0121095:Invalid arguments - in function regexp_substr bad utf8 string input:
造成insert语句整体失败。
请问怎么忽略这一条错误的数据,继续处理其它数据?

展开
收起
祁同伟 2017-09-04 19:03:19 5388 0
1 条回答
写回答
取消 提交回答
  • TA有点害羞,没有介绍自己...

    加上判断条件 where is_encoding(content, 'utf-8', 'gbk')

    2019-07-17 21:33:35
    赞同 2 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
大数据AI一体化的解读 立即下载
极氪大数据 Serverless 应用实践 立即下载
大数据&AI实战派 第2期 立即下载