很多语言包括英语在内都使用沉音字符(accented character)因为这些字符不属于 ASCII 字符集所以如果不查看 Unicode 值也不使用 Unicode 编辑器并将其转成一个已知字符集就很难编写使用这些字符的代码
Oraclei引入了 COMPOSE 函数该函数接受一串 Unicode 字符并规则化其文本这就意味着它可以接受一个字母和一个组合标记比如说a(Unicode 字符)和沉音符(Unicode 字符)然后创建一个单独的由两个标记组合而成的字符COMPOSE 使用特殊的组合标记而没有使用 ASCII 中相应的音节标记它所使用的特殊的组合标记是Unicode 标准的一部分上面的例子的结果应该是 Unicode 字符E(有一个沉音符的小写拉丁字母a)
在 ANSI 中最常见的组合字符有
·U+沉音符(grave accent)( ` )
·U+重音符(acute accent)( )
·U+抑扬音符号(circumflex accent)(^)
·U+颚化符号(tilde)(~)
·U+元音变音
如果没有特殊的软件或者键盘驱动程序的话很难在键盘上输入 Unicode 字符和因此以纯 ASCII 文本输入 Unicode 序列的一个方法是使用 UNISTR 函数这个函数接受一个 ASCII 字符串然后以国家字符集(通常作为位 Unicode 或者 UTF 字符集安装)创建一个 Unicode 字符的序列它使用十六进制占位符序列映射任何非 ASCII 字符映射方式与 Java 类似
要输入 a 后接一个沉音符组合字符的序列可以使用 UNISTR(a\)而不要试图直接在代码中输入字符这个函数在任何字符集以及任何具有基于 Unicode 的国家字符集的数据库下都可以正常运行可以将多个组合字符放在函数中——可以在 UNISTR 函数中混合使用 ASCII 和 Unicode 占位符例如可以像下面这样使用 UNISTR 函数
select COMPOSE(UNISTR(Unless you are nai\ve meet me at the cafe\ with
your re\sume\)) from dual;
在将 UNISTR 函数的输出与 COMPOSE 组合时可以在不查找任何值的情况下生成一个 Unicode 字符例如
select it is true if compose(unistr(a\)) = unistr(\e);