大容量导入或导出的数据格式 -- Unicode字符格式

简介:

应用场景



使用包含扩展/DBCS 字符的数据文件在多个 SQL Server 实例之间大容量传输数据时,建议使用 Unicode 字符格式。

 

从服务器导出数据时,Unicode 字符数据格式允许使用与执行该操作的客户端不同的代码页

 

在这种情况下,使用 Unicode 字符格式有下列优点:

1. 如果源数据和目标数据的类型为 Unicode,则使用 Unicode 字符格式可以保留所有的字符数据。

2. 如果源数据和目标数据的类型不为 Unicode,则使用 Unicode 字符格式可以尽可能减少丢失源数据中无法在目标数据中表示的扩展字符。

 

Unicode 字符格式数据文件遵循 Unicode 文件的约定。该文件的前两个字节为十六进制数字 0xFFFE。 这两个字节用作字节顺序标记,指定在文件中高位字节是存储在前面还是后面。

 


重要提示

对于用于 Unicode 字符数据文件的格式化文件,所有输入字段必须为 Unicode 文本字符串(即固定大小 Unicode 字符串或字符终止 Unicode 字符串)。


 

Unicode 字符格式数据文件中存储的 sql_variant 数据的操作方式与字符格式数据文件中的同类数据的操作方式相同,唯一的不同是该数据存储为 nchar 而不是 char 数据。

 

Unicode 字符格式的命令选项



您可以使用 bcp、BULK INSERT 或 INSERT ... SELECT * FROM OPENROWSET(BULK...) 将字符格式数据导入到表中。 对于 bcp 命令或 BULK INSERT 语句,您可以在命令行中指定数据格式。 对于 INSERT ... SELECT * FROM OPENROWSET(BULK...) 语句,您必须在格式化文件中指定数据格式。

 

下列命令行选项支持 Unicode 字符格式:

命令

选项

说明

bcp

-w

使用 Unicode 字符格式。

BULK INSERT

DATAFILETYPE ='widechar'

大容量导入数据时使用 Unicode 字符格式。


 

参考:

https://msdn.microsoft.com/zh-cn/library/ms188289.aspx
















本文转自UltraSQL51CTO博客,原文链接:http://blog.51cto.com/ultrasql/1628101 ,如需转载请自行联系原作者


相关文章
|
5月前
|
数据库
编码与解码--数据库编码格式--后端编码格式
编码与解码--数据库编码格式--后端编码格式
32 0
|
3月前
|
数据库
在Excel中将某一列的格式通过数据分列彻底变为文本格式
在Excel中将某一列的格式通过数据分列彻底变为文本格式
48 0
如何将Excel中以文本形式存储的数字批量快速地转换为数值类型
如何将Excel中以文本形式存储的数字批量快速地转换为数值类型
如何将Excel中以文本形式存储的数字批量快速地转换为数值类型
Excel中的数字格式与文本格式进行转换
Excel中的数字格式与文本格式进行转换
112 0
Excel中的数字格式与文本格式进行转换
|
SQL JSON 数据库
Json 内容转换为 Hive 所支持的文本格式1 | 学习笔记
快速学习 Json 内容转换为 Hive 所支持的文本格式1
163 0
Json 内容转换为 Hive 所支持的文本格式1  |  学习笔记
|
SQL JSON HIVE
Json 内容转换为 Hive 所支持的文本格式2 | 学习笔记
快速学习 Json 内容转换为 Hive 所支持的文本格式2
97 0
Json 内容转换为 Hive 所支持的文本格式2  |  学习笔记
|
Unix
weppy格式的转换
weppy格式的转换
119 0
|
存储 Python
文件和数据格式化
文件和数据格式化
128 0
文件和数据格式化
|
存储
关于N900的TXT文本的编码注意事项
  N900上TXT文本的编码格式为UTF-8。此格式不用说,是目前兼容性相当好的一种编码。但是比如PC上(特指中文系统的XP、win7等)建立的TXT文本默认是ANSI   所以当存储有中文的ANSI编码的TXT文本在N900上中文显示成乱码,更有可能无法打开(大量特殊符号)。
840 0
|
数据采集 存储 数据挖掘
数据预处理:自定义PDF格式批量转换TXT系统
导读:随着大数据的快速发展,自然语言处理、数据挖掘、机器学习技术应用愈加广泛。针对大数据的预处理工作是一项庞杂、棘手的工作。首先数据采集和存储,尤其高质量数据采集往往不是那么简单。采集后的信息文件格式不一,诸如pdf,doc,docx,Excel,ppt等多种形式。
3503 0