php – Twitter风格的URL Regex匹配
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了php – Twitter风格的URL Regex匹配,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1741字,纯文字阅读大概需要3分钟。
内容图文
我正在努力为使用PHP的聊天客户端实现非常宽松的Regex匹配.
聊天客户端必须能够获取完整和不完整的URL.
例如:
http://www.example.com
或www.example.com或example.com
我已经设置了一个试图实现这个目的的preg_replace:
$find = array("/([\w]+:\/\/[\w-?&;#~=\.\/\@]+[\w\/])/is","/(^(?!http:\/\/)[a-zA-Z0-9\-\.]+\.[a-zA-Z]{2,4}(\/?\S*)?)/is");
$replace = array( "<a target=\"_blank\" href=\"http://\\1\">\\1</a>","<a target=\"_blank\" href=\"\\1\">\\1</a>");
$output = preg_replace($find, $replace, $input);
因此,目标是首先找到带有协议的“完整”URL,然后尝试查找没有协议的“懒惰”URL.
目前它适用于“完整”网址,但“懒惰”网址无法获取.
任何帮助将不胜感激.
谢谢.
解决方法:
我刚才建立了类似的东西.我的想法是……以协议标识符或“www”开头的任何内容都是一个URL,以及与以有效TLD(两个字母或已知gTLD)结尾的域相匹配的任何内容(如果后跟路径).域本身就是域.
$gtlds="com|net|org|biz|edu|gov|int|pro|xxx";
$gtlds+="|aero|arpa|asia|coop|museum|name|travel";
#$gtlds+="|xn-[a-z0-9]+";
$a = array(
'/(f|ht)tps?:\/\/[^ ]+/',
'/(ftp|www)\.[a-z0-9.-]+(/[^ ]*)/',
"/([a-z0-9][a-z0-9-]*\.)+([a-z]{2}|$gtlds)\/[^ ]*/"
);
请注意,我是一个老式的正则表达式用户,所以这是ERE,而不是所有孩子们现在使用的那种花哨的PREG东西.
荒谬的gTLD列表是从IANA开始的.我已经更新了它,因此除了.XN – *之外它在答案时有效.您可以包含以.XN开头的TLD列表 – 如果您愿意,可以使用模式,也可以直接匹配它们并增加$gtlds变量.我从来没有遇到任何因忽略它们的存在而引起的问题,所以这就是我的策略.
以上RE适用于我的具体用途.我没有声称他们会为每一个不属于我的案件工作. (例如,如果引用域或URL,它们将包括尾随引号.这绝不是我必须处理的事情,因此我没有处理它.)
请注意,当您进行替换时,虽然您希望生成器锚点的HREF属性是您匹配或生成的URL,但您可能希望保留原始文本,以便进行布局和显示.
根据你如何使用这些,字边界可能会有所帮助……但你已经知道如何做到这些.
内容总结
以上是互联网集市为您收集整理的php – Twitter风格的URL Regex匹配全部内容,希望文章能够帮你解决php – Twitter风格的URL Regex匹配所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。