一什么是oracle字符集
Oracle字符集是一个字节数据的解释的符号集合有大小之分有相互的包容关系ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储处理检索数据它使数据库工具错误消息排序次序日期时间货币数字和日历自动适应本地化语言和平台
影响oracle数据库字符集最重要的参数是NLS_LANG参数它的格式如下:
NLS_LANG = language_territorycharset
它有三个组成部分(语言地域和字符集)每个成分控制了NLS子集的特性其中:
Language 指定服务器消息的语言territory 指定服务器的日期和数字格式charset 指定字符集如:AMERICAN _ AMERICA ZHSGBK
从NLS_LANG的组成我们可以看出真正影响数据库字符集的其实是第三部分所以两个数据库之间的字符集只要第三部分一样就可以相互导入导出数据前面影响的只是提示信息是中文还是英文
二如何查询Oracle的字符集
很多人都碰到过因为字符集不同而使数据导入失败的情况这涉及三方面的字符集一是oracel server端的字符集二是oracle client端的字符集;三是dmp文件的字符集在做数据导入的时候需要这三个字符集都一致才能正确导入
查询oracle server端的字符集
有很多种方法可以查出oracle server端的字符集比较直观的查询方法是以下这种:SQL>select userenv(language) from dual;
结果类似如下:AMERICAN _ AMERICA ZHSGBK
如何查询dmp文件的字符集
用oracle的exp工具导出的dmp文件也包含了字符集信息dmp文件的第和第个字节记录了dmp文件的字符集如果dmp文件不大比如只有几M或几十M可以用UltraEdit打开(进制方式)看第第个字节的内容如然后用以下SQL查出它对应的字符集:
SQL> select nls_charset_name(to_number(xxxx)) from dual;
ZHSGBK
如果dmp文件很大比如有G以上(这也是最常见的情况)用文本编辑器打开很慢或者完全打不开可以用以下命令(在unix主机上):
cat expdmp |od x|head |awk {print $ $}|cut c
然后用上述SQL也可以得到它对应的字符集
查询oracle client端的字符集
这个比较简单在windows平台下就是注册表里面相应OracleHome的NLS_LANG还可以在dos窗口里面自己设置比如:
set nls_lang=AMERICAN_AMERICAZHSGBK
这样就只影响这个窗口里面的环境变量
在unix平台下就是环境变量NLS_LANG
$echo $NLS_LANG
AMERICAN_AMERICAZHSGBK
如果检查的结果发现server端与client端字符集不一致请统一修改为同server端相同的字符集
三修改oracle的字符集
上文说过oracle的字符集有互相的包容关系如usascii就是zhsgbk的子集从usascii到zhsgbk不会有数据解释上的问题不会有数据丢失在所有的字符集中utf应该是最大因为它基于unicode双字节保存字符(也因此在存储空间上占用更多)
一旦数据库创建后数据库的字符集理论上讲是不能改变的因此在设计和安装之初考虑使用哪一种字符集十分重要根据Oracle的官方说明字符集的转换是从子集到超集受支持反之不行如果两种字符集之间根本没有子集和超集的关系那么字符集的转换是不受oracle支持的对数据库server而言错误的修改字符集将会导致很多不可测的后果可能会严重影响数据库的正常运行所以在修改之前一定要确认两种字符集是否存在子集和超集的关系一般来说除非万不得已我们不建议修改oracle数据库server端的字符集特别说明我们最常用的两种字符集ZHSGBK和ZHSCGB之间不存在子集和超集关系因此理论上讲这两种字符集之间的相互转换不受支持
修改server端字符集(不建议使用)
在oracle 之前可以用直接修改数据字典表props$来改变数据库的字符集但oracle之后至少有三张系统表记录了数据库字符集的信息只改props$表并不完全可能引起严重的后果正确的修改方法如下:
$sqlplus /nolog
SQL>conn / as sysdba;
若此时数据库服务器已启动则先执行SHUTDOWN IMMEDIATE命令关闭数据库服务器然后执行以下命令:
SQL>STARTUP MOUNT;
SQL>ALTER SYSTEM ENABLE RESTRICTED SESSION;
SQL>ALTER SYSTEM SET JOB_QUEUE_PROCESSES=;
SQL>ALTER SYSTEM SET AQ_TM_PROCESSES=;
SQL>ALTER DATABASE OPEN;
SQL>ALTER DATABASE CHARACTER SET ZHSGBK;
SQL>ALTER DATABASE national CHARACTER SET ZHSGBK;
SQL>SHUTDOWN IMMEDIATE;
SQL>STARTUP
修改dmp文件字符集
上文说过dmp文件的第第字节记录了字符集信息因此直接修改dmp文件的第第字节的内容就可以骗过oracle的检查这样做理论上也仅是从子集到超集可以修改但很多情况下在没有子集和超集关系的情况下也可以修改我们常用的一些字符集如USASCIIWEISOPZHSCGBZHSGBK基本都可以改因为改的只是dmp文件所以影响不大
具体的修改方法比较多最简单的就是直接用UltraEdit修改dmp文件的第和第个字节比如想将dmp文件的字符集改为ZHSGBK可以用以下SQL查出该种字符集对应的进制代码:
SQL> select to_char(nls_charset_id(ZHSGBK) xxxx) from dual;
然后将dmp文件的字节修改为即可
如果dmp文件很大用ue无法打开就需要用程序的方法了网上有人用java存储过程写了转换的程序(用java存储过程的好处是通用性教好缺点是比较麻烦)我在windows下测试通过但要求oracle数据库一定要安装JVM选项