Perl和Java中的Unicode比较
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了Perl和Java中的Unicode比较,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1003字,纯文字阅读大概需要2分钟。
内容图文
![Perl和Java中的Unicode比较](/upload/InfoBanner/zyjiaocheng/793/d4a8b47bb974431b82fcc7291cf861a0.jpg)
在比较字符串时,维护在Perl和Java中提供相同排序规则的函数的最佳方法是什么?这是Perl中的示例函数:
sub compare_strs
{
my ( $str1, $str2 ) = @_;
# Treat vars as strings by quoting.
# Possibly incorrect/irrelevant approach.
return ("$str1" cmp "$str2");
}
这里的担忧是:
>该字符串可以包含中文/日文字符.上面的Perl代码不能依赖于给出预期的结果.
>如何保证Perl和Java实现都能以相同的方式执行字符串排序?
解决方法:
对于Perl,不要使用cmp运算符.相反,您应该使用Unicode::Collate模块:
use Unicode::Collate;
sub compare_strs
{
my ( $str1, $str2 ) = @_;
# Treat vars as strings by quoting.
# Possibly incorrect/irrelevant approach.
return $Collator->cmp("$str1", "$str2");
}
如果您担心标准化(例如,组合标记的顺序),您也可以使用Unicode::Normalize模块.
在Java中,使用Collator类,如tutorial on comparing strings中所述.对于规范化,请参阅tutorial on normalizing text.在Java 1.6中引入了所需的类.如果您需要支持早期版本的Java,则需要使用类似于ICU libraries的内容.
使用上述适当的工具应确保两个环境的行为符合Unicode collation algorithm(因此相互兼容).
内容总结
以上是互联网集市为您收集整理的Perl和Java中的Unicode比较全部内容,希望文章能够帮你解决Perl和Java中的Unicode比较所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。