开发者社区 问答 正文

vodps支持 正则匹配中文吗?

odps支持 正则匹配中文吗?

展开
收起
琴瑟 2017-05-27 17:28:55 7045 分享
分享
版权
举报
2 条回答
写回答
取消 提交回答
  • 回一楼的的用法,执行会报错,稍微修正一下,单斜杠改为双斜杠\即可运行:
    select regexp_extract("阿里巴巴", "([\\x{4e00}-\\x{9fa5}]+)", 1);

    2024-08-09 16:57:30 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论
  • TA有点害羞,没有介绍自己...

    支持;
    maxcompute(原ODPS)正则表达式规范,请参考:
    https://help.aliyun.com/document_detail/27871.html

    odps数据都是以utf8编码保存,对于中文字符可以用对应的16进制编码表示,格式是x{1234}
    中文字符编码的范围是[x{4e00}-x{9fa5}],
    例如select regexp_extract("阿里巴巴", "([\x{4e00}-\x{9fa5}]+)", 1) from dual; 可以匹配上中文字符串“阿里巴巴”

    2019-07-17 21:13:44 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论