Simulink不支持GBK汉字,但是可以支持Unicode编码,可以通过将字符串转换成Unicode编码格式来实现。可以使用下列函数:
1. str2num:将字符串转换为Unicode编码的数字数组。
2. native2unicode:将字符串转换为Unicode编码的字符数组。
3. char:将Unicode编码的数字或字符数组转换为Unicode编码的字符串。
1、python2与python3稍微有点区别
2、python2中默认的字符编码格式都是unicode,在字符串前加'u',表示unicode 编码
3、将unicode转换成中文,只需要用deconde解码就可以了
u='欢迎'
e=u.encode()
e
b'\xe6\xac\xa2\xe8\xbf\x8e'
e.decode()#python3中默认就是utf-8编码
'欢迎'
e.decode('gbk')#如果解码为gbk就是乱码
'娆四繋'
python2编码环境比较复杂,在这里不做详细说明
下面给出1—100带圈数字输入方法:
一、首先是带圈1—20,使用任意一种带有符号输入器的输入法(这里用QQ五笔演示),右键点击输入法状态栏,弹出选项中打开输入法符号输入器。
二、找到“数字序号”列表,点击其中的1—20带圈数字即可输入。
三、21—50的输入方法比较麻烦,需要Unicode编码转换,百度搜索“Unicode编码转换站长工具”,并打开站长工具中的该转换器。
四、打开该界面后,进入“Unicode编码”界面,输入对应的Unicode编码,㉑~㊿Unicode编码为:#12881;#12882;#12883;#12884;#12885;#12886;#12887;#12888;#12889;#12890;#12891;#12892;#12893;#12894;#12895;#12977;#12978;#12979;#12980;#12981;#12982;#12983;#12984;#12985;#12986;#12987;#12988;#12989;#12990;#12991。
五、输入完编码后,点击右下角“Unicode 转 中文”。
六、如下图,这时即可把Unicode编码转换成中文,即可得到带圈数字21—50。
七、下面是50以上带圈数字输入方法(该方法仅限在Office软件内使用),这里用Word演示,打开Word,点击“开始菜单”下的“带圈字符”。
八、在文字栏内输入所需的数字,选中“缩小文字”,点击“确定”。
九、如下图,这时即可把文字栏中的数字改为带圈数字。
1、网上有工具
2、带/u 或者%u的是unicode编码结果
3、转中文方式
详细:
unescape() 函数可对通过 escape() 编码的字符串进行解码,已废弃。
编码和解码一一对应关系
escape() 编码, unescape() 解码 废弃
encodeURI 编码,decodeURI 解码
encodeURIComponent 编码,decodeURIComponent 解码
用什么解码对应的文件内容
#加数字是Delphi中使用Unicode编码表示的字符。在Delphi中,使用Unicode编码可以表示所有的字符,包括汉字、符号、英文字母等。
例如,#21697#21517#35268#26684表示的是四个Unicode编码分别为21697、21517、35268、26684的字符。
如果想要在Delphi代码中转换为中文,可以使用如下代码:
s := #21697#21517#35268#26684;
s := WideChar(21697) + WideChar(21517) + WideChar(35268) + WideChar(26684);
这样,变量s就会包含四个Unicode编码分别为21697、21517、35268、26684的字符。如果这些字符对应的是中文,那么s就会包含四个中文字符。
此外,还可以使用如下代码将Unicode编码转换为中文字符串:
s := #21697#21517#35268#26684;
s := String(s);
在命令行界面用native2ascii工具
1.将汉字转为Unicode:
C:\Program Files\Java\jdk1.5.0_04\binnative2ascii
测试
\u6d4b\u8bd5
2.将Unicode转换为汉字:
C:\Program Files\Java\jdk1.5.0_04\binnative2ascii -reverse
\u6d4b\u8bd5
测试
java 自带的一个native2ascii.exe是一个很好的转码工具,在bin目录下。如果你的properties中有汉字,需要转成unicode . 则把含有汉字的properties拷贝到bin 目录下, 然后在cmd里面进入bin目录,输入:native2ascii -encoding utf-8 Language-ext_zh_CN.properties.native Language-ext_zh_CN.properties就ok了。Language-ext_zh_CN.properties是转码后的文件。
在做Java开发的时候,常常会出现一些乱码,或者无法正确识别或读取的文件,比如常见的validator验 证用的消息资源(properties)文件就需要进行Unicode重新编码。原因是java默认的编码方式为Unicode,而我们的计算机系统编码 常常是GBK等编码。需要将系统的编码转换为java正确识别的编码问题就解决了。
1、native2ascii简介:native2ascii 是sun java sdk提供的一个工具。用来将别的文本类文件(比如*.txt,*.ini,*.properties,*.java等等)编码转为Unicode编码。 为什么要进行转码,原因在于程序的国际化。Unicode编码的定义:Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每 种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。随着计算 机工作能力的增强,Unicode也在面世以来的十多年里得到普及。(声明:Unicode编码定义来自互联网)。
2、获取native2ascii:安装了jdk后,假如你是在windows上安装,那么在jdk的安装目录下,会有一个bin目录,其中native2ascii.exe正是。
3、native2ascii的命令行的命名格式:
native2ascii -[options] [inputfile [outputfile]]
说明:
-[options]:表示命令开关,有两个选项可供选择
-reverse:将Unicode编码转为本地或者指定编码,不指定编码情况下,将转为本地编码。
-encoding encoding_name:转换为指定编码,encoding_name为编码名称。
[inputfile [outputfile]]
inputfile:表示输入文件全名。
outputfile:输出文件名。如果缺少此参数,将输出到控制台。
4、最佳实践:首先将JDK的bin目录加入系统变量path。在盘下建立一个test目录,在test目录里建立一个zh.txt文件,文件内容为:“熔岩”,打开“命令行提示符”,并进入C:\test目录下。下面就可以按照说明一步一步来操作,注意观察其中编码的变化。
A:将zh.txt转换为Unicode编码,输出文件到u.txt
native2ascii zh.txt u.txt
打开u.txt,内容为“\u7194\u5ca9”。
B:将zh.txt转换为Unicode编码,输出到控制台
C:\testnative2ascii zh.txt
\u7194\u5ca9
可以看到,控制台输出了“\u7194\u5ca9”。
C:将zh.txt转换为ISO8859-1编码,输出文件到i.txt
native2ascii -encoding ISO8859-1 zh.txt i.txt
打开i.txt文件,内容为“\u00c8\u00db\u00d1\u00d2”。
D:将u.txt转换为本地编码,输出到文件u_nv.txt
native2ascii -reverse u.txt u_nv.txt
打开u_nv.txt文件,内容为“熔岩”。
E:将u.txt转换为本地编码,输出到控制台
C:\testnative2ascii -reverse u.txt
熔岩
可以看到,控制台输出了“熔岩”。
F:将i.txt转换为本地编码,输出到i_nv.txt
native2ascii -reverse i.txt i_nv.txt
打开i_nv.txt文件,内容为“\u00c8\u00db\u00d1\u00d2”。发现转码前后完全一样的。也就是说,等于没有转,或者说思想糊涂,对命名没有理解。。
G:将i.txt转换为GBK编码,输出到i_gbk.txt
native2ascii -reverse -encoding GBK i.txt i_gbk.txt
打开i_gbk.txt文件,内容为“\u00c8\u00db\u00d1\u00d2”。发现转码前后完全一样的。也就是说,等于没有转,或者说思想糊涂,对命名没有理解。
H:将u_nv.txt转码到本地编码GBK,输出到控制台
C:\testnative2ascii -reverse -encoding ISO8859-1 i.txt
熔岩
从这个结果看,目标达到到了,编码i.txt为ISO8859-1,转为本地编码后内容为“熔岩”。从这里应该意识到,native2ascii -reverse命令中-encoding指定的编码为源文件的编码格式。而在native2ascii 命令中-encoding指定的编码为(生成的)目标文件的编码格式。这一点非常的重要!切记!!
继续探索,新建文件12a.txt,内容“12axyz”。看看纯字母数字的编码又如何。
I:将纯字母数字的文本文件12a.txt转换为Unicode编码
native2ascii 12a.txt 12a_nv.txt
打开12a_nv.txt文件,内容为“12axyz”。
继续测试,转为ISO8859-1编码看看
C:\testnative2ascii -encoding ISO8859-1 12a.txt
12axyz
结果还是没有转码。
从结果可以得出结论:对于纯数字和字母的文本类型件,转码前后的内容是一样的。
转载请注明:氪金游戏网 » 游戏技巧 » gbk汉字不支持simulink(unicode编码转换工具)
本文仅代表作者观点,不代表氪金游戏网立场。
本文系作者授权发表,未经许可,不得转载。
2条评论
文章中提到的观点让我受益匪浅,感谢作者的分享。http://www.ghzszy.com/down_51_word.html
文章中的细节描写非常到位,让人仿佛看到了画面。http://www.ghzszy.com/down_39_word.html