初学者遇到的PostgreSQL字符集问题的解决-阿里云开发者社区

初学者遇到的PostgreSQL字符集问题的解决

2017-08-11 2282

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云原生数据库 PolarDB MySQL 版，Serverless 5000PCU 100GB

简介： 当初学者在使用PostgreSQL数据库，输入中文时，会遇到“ERROR: invalid byte sequence for encoding "UTF8": 0xd6d0”的错误，原因是由于没有正确设置客户端字符集。

当初学者在使用PostgreSQL数据库，输入中文时，会遇到“ERROR: invalid byte sequence for encoding "UTF8": 0xd6d0”的错误，原因是由于没有正确设置客户端字符集。

问题的原因：

默认情况下，PostgreSQL是不转换字符集的，如果你的数据库是UTF8的字符集，一般终端的中文字符集会设置为GBK，或en_US（查看终端的字符集可以看LANG环境变量的设置），所以你输入的中文是GBK的编码，这个编码不经转换的存入数据库中，而数据库是UTF8的，PostgreSQL一看没有这样的UTF8编码，所以当然报错了。

解决方法为：

方法一：设置postgresql的客户端编码为GBK，这时PostgreSQL就知道输入的内容是GBK编码的，这样PostgreSQL数据库会自动做字符集的转换，把其转换成UTF8编码。

方法二：直接设置终端的字符集编码为UTF8，让输入的编码直接为UTF8，而不是GBK。

看我具体的演示：

方法一：设置postgresql的客户端编码：

设置psql客户端字符集为GBK，方法有两种，一种是在psql中输入“\encoding GBK” ，另一种是设置环境变量“export PGCLIENTENCODING=GBK”，看我的演示：
#psql -d dsc
dsc=# insert into t values(1,'中国');
ERROR: invalid byte sequence for encoding "UTF8": 0xd6d0
HINT: This error can also happen if the byte sequence does not match the encoding expected by the server, which is controlled by "client_encoding".
dsc=# show client_encoding;
client_encoding
-----------------
UTF8
(1 row)

dsc=# \encoding GBK
dsc=# show client_encoding;
client_encoding
-----------------
GBK
(1 row)

dsc=# insert into t values(1,'中国');
INSERT 0 1
dsc=# commit;
WARNING: there is no transaction in progress
COMMIT
dsc=# select * from t;
id | name
----+------
1 | 中国
(1 row)

[postgres@dsc ~]$ export PGCLIENTENCODING=GBK
[postgres@dsc ~]$ psql
psql: FATAL: conversion between GBK and LATIN1 is not supported
[postgres@dsc ~]$ psql -d dsc
psql (8.4.3)
Type "help" for help.

dsc=# select * from t;
id | name
----+------
1 | 中国
(1 row)

dsc=# insert into t values(2,'我的中国');
INSERT 0 1
dsc=# select * from t;
id | name
----+----------
1 | 中国
2 | 我的中国
(2 rows)

方法二：设置终端的编码为UTF8：

[postgres@dsc ~]$ export LANG=zh_CN.UTF8

然后修改终端软件的字符集编码，我使用的是SecureCRT，修改方法为：

Option->Session Option->外观->字符编码，把那个下拉框的内容改成“UTF8”:

然后再插入数据测试：

[postgres@dsc ~]$ psql -d dsc
psql (8.4.3)
Type "help" for help.

dsc=# select * from t;
id | name
----+----------
1 | 中国
2 | 我的中国
(2 rows)

dsc=# insert into t values(3,'我的中国');
INSERT 0 1
dsc=# select * from t;
id | name
----+----------
1 | 中国
2 | 我的中国
3 | 我的中国
(3 rows)

相关实践学习

使用PolarDB和ECS搭建门户网站

本场景主要介绍基于PolarDB和ECS实现搭建门户网站。

阿里云数据库产品家族及特性

阿里云智能数据库产品团队一直致力于不断健全产品体系，提升产品性能，打磨产品功能，从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手，打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系，结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台，为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案，提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。

初学者遇到的PostgreSQL字符集问题的解决

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像