首页 / PYTHON / python – 匹配POS标签和单词序列

python – 匹配POS标签和单词序列

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python – 匹配POS标签和单词序列，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1969字，纯文字阅读大概需要3分钟。

内容图文

我有以下两个带有POS标签的字符串：

发送1：“像作家专业或短语如何工作的东西真的很酷.”

[(‘something’, ‘NN’), (‘like’, ‘IN’), (‘how’, ‘WRB’), (‘writer’,
‘NN’), (‘pro’, ‘NN’), (‘or’, ‘CC’), (‘phraseology’, ‘NN’), (‘works’,
‘NNS’), (‘would’, ‘MD’), (‘be’, ‘VB’), (‘really’, ‘RB’), (‘cool’,
‘JJ’), (‘.’, ‘.’)]

Sent2：“更多选项,如语法编辑器会很好”

[(‘more’, ‘JJR’), (‘options’, ‘NNS’), (‘like’, ‘IN’), (‘the’, ‘DT’),
(‘syntax’, ‘NN’), (‘editor’, ‘NN’), (‘would’, ‘MD’), (‘be’, ‘VB’),
(‘nice’, ‘JJ’)]

我正在寻找一种方法来检测(返回True),如果有序列：“will”是“形容词(无论形容词的位置,只要它在”will“”be“之后)在这些字符串中.形容词的第二个字符串,“nice”紧跟在“将”之后,但在第一个字符串中不是这种情况.

在我之前的一个问题中解决了这个简单的案例(在形容词之前没有其他词语;“会很好”)：detecting POS tag pattern along with specified words

我现在正在寻找一个更通用的解决方案,其中可选词可能出现在形容词之前.我是NLTK和Python的新手.

解决方法:

首先按照说明安装nltk_cli：https://github.com/alvations/nltk_cli

然后,这是nltk_cli中的一个秘密函数,也许你会发现它很有用：

alvas@ubi:~/git/nltk_cli$cat infile.txt 
something like how writer pro or phraseology works would be really cool .
more options like the syntax editor would be nice
alvas@ubi:~/git/nltk_cli$python senna.py --chunk2 VP+ADJP infile.txt 
would be    really cool
would be    nice

为了说明其他可能的用法：

alvas@ubi:~/git/nltk_cli$python senna.py --chunk2 VP+VP infile.txt 
!!! NO CHUNK of VP+VP in this sentence !!!
!!! NO CHUNK of VP+VP in this sentence !!!
alvas@ubi:~/git/nltk_cli$python senna.py --chunk2 NP+VP infile.txt 
how writer pro or phraseology works would be
the syntax editor   would be
alvas@ubi:~/git/nltk_cli$python senna.py --chunk2 VP+NP infile.txt 
!!! NO CHUNK of VP+NP in this sentence !!!
!!! NO CHUNK of VP+NP in this sentence !!!

然后,如果你想检查句子中的短语并输出True / False,只需读取并遍历nltk_cli的输出并检查if-else条件.

内容总结

以上是互联网集市为您收集整理的python – 匹配POS标签和单词序列全部内容，希望文章能够帮你解决python – 匹配POS标签和单词序列所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/702111.html

来源：【匿名】

【上一篇】python – 使用动态名称在pandas中创建新的数据框也添加新列【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python – 匹配POS标签和单词序列】教程文章相关的互联网学习教程文章

python画图中colorbar设置刻度和标签字体大小【代码】

fig=plt.figure(figsize=(10,8)) h=plt.contourf(data) cb=plt.colorbar(h) cb.ax.tick_params(labelsize=16) #设置色标刻度字体大小。 plt.xticks(fontsize=16) plt.yticks(fontsize=16) font = {‘family‘ : ‘serif‘,‘color‘ : ‘darkred‘,‘weight‘ : ‘normal‘,‘size‘ : 16,} cb.set_label(‘colorbar‘,fontdict=font) #设置colorbar的标签字体及其大小转载：https://blog.csdn.net/weixin_43718675/article/de...

python3用BeautifulSoup用字典的方法抓取a标签内的数据【代码】

# -*- coding:utf-8 -*- #python 2.7 #XiaoDeng #http://tieba.baidu.com/p/2460150866 #标签操作from bs4 import BeautifulSoup import urllib.request import re#如果是网址，可以用这个办法来读取网页 #html_doc = "http://tieba.baidu.com/p/2460150866" #req = urllib.request.Request(html_doc) #webpage = urllib.request.urlopen(req) #html = webpage.read()html=""" <html><head><title>The Dormouse‘s story</titl...

python3用BeautifulSoup用字典的方法抓取a标签内的数据【代码】

python - pandas或者sklearn中如何将字符形式的标签数字化

参考：http://www.php.cn/wenda/91257.html　　　　https://www.cnblogs.com/king-lps/p/7846414.html　　　　http://blog.csdn.net/kancy110/article/details/75043202原文：http://www.cnblogs.com/rrttp/p/8110329.html

23-python用BeautifulSoup用抓取a标签内所有数据【代码】

原文：https://blog.csdn.net/suibianshen2012/article/details/62040460?utm_source=copy # -*- coding:utf-8 -*- #python 2.7 #XiaoDeng #http://tieba.baidu.com/p/2460150866 #标签操作from bs4 import BeautifulSoup import urllib.request import re#如果是网址，可以用这个办法来读取网页 #html_doc = "http://tieba.baidu.com/p/2460150866" #req = urllib.request.Request(html_doc) #webpage = urllib.request.urlopen...

python selenium-webdriver 标签页切换（十四）【代码】【图】

测试过程中有时候会遇到点击某个按钮或者链接会弹出新的窗口，这时候我们的操作的页面还保持着最初打开页面，但是此时我们需要操作新打开的页面上的功能，这个时候我们需要切换一下标签页。　　其实页面的切换与frame的切换比较相识，一种切换时本页面内frame的操作，而标签页面是多页面的操作，道理很相似。下面讲解下操作页面标签会涉及到那些方法。 driver.current_window_handle 　　 #获取当前窗口的句...

python3生成标签云【代码】【图】

标签云是现在大数据里面最喜欢使用的一种展现方式，其中在python3下也能实现标签云的效果，贴图如下：-------------------进入正文---------------------首先要安装以下几个库：1#!/usr/bin/python3.42# -*- coding: utf-8 -*-34# http://www.lfd.uci.edu/~gohlke/pythonlibs/#cx_freeze5# 万能仓库下载pygame6# pip3下载simplejson还有最重要的库：pip3 install pytagcloud 或者去官网下载：https://pypi.python.org/pypi/pytagcl...

PythonNote03_HTML标签【代码】【图】

1<!DOCTYPE> 2<html> 3<head> 4<meta charset = "utf-8"/> 5<meta name="Keywords" content=""/> 6<mata name = "description" content = ""/> 7<title>03_复习随敲_0111</title> 8<style> 9 *{margin: 0;padding: 0;} 10 h1{text-align: center;color: red;} 11 ol{margin: 0 0 0 30px} 12 .zd{color: red;font-size: 20} 13</style> 14</head> 15<body> 16<h1>03_复习笔记_...

python 获取html置顶标签文本信息【代码】

class MyParser(HTMLParser):def __init__(self,key):self.data=[]self.key=keyself.falg=Falseself.linkname=‘‘HTMLParser.__init__(self)def handle_starttag(self,tag,attrs):if self.key and tag ==self.key:self.falg=Truedef handle_data(self,data):if self.falg and data:self.data.append(unicode(eval(repr(data)),"utf-8"))def handle_endtag(self,tag):if self.key and tag ==self.key:self.falg=Falsedef getresult...

利用python和shell脚本生成train.txt的标签文件【代码】【图】

1. 用shell脚本生成带绝对路径的train.txt例如我要生成如下形式的带标签的文件，如图:(如有两个标签：0 和 1)shell脚本如下：这样标签0写入了train.txt 1# /usr/bin/env sh 2 DATA=/home/ttwang/Desktop/Texture/03 DATASAVE=/home/ttwang/Desktop4 5 echo "Create train.txt..." 6 7# /usr/bin/env sh 8 find $DATA -name Grass*.jpg | sed "s/$/ 1/" >>$DATASAVE/train.txt910 echo "Done.."再写一个脚本，这样就把指定文件下的想...

用于NLP的Python：使用Keras的多标签文本LSTM神经网络分类【代码】【图】

原文链接：http://tecdat.cn/?p=8640 介绍在本文中，我们将看到如何开发具有多个输出的文本分类模型。我们将开发一个文本分类模型，该模型可分析文本注释并预测与该注释关联的多个标签。多标签分类问题实际上是多个输出模型的子集。在本文结尾，您将能够对数据执行多标签文本分类。数据集数据集包含来自Wikipedia对话页编辑的评论。评论可以属于所有这些类别，也可以属于这些类别的子集，这使其成为多标签分类问题。将...

python-TensorFlow RuntimeError：在SavedModel中找不到与标签服务相关联的MetaGraphDef【代码】

当我使用simple_save保存模型时,尝试加载模型时出现运行时错误. 要保存的代码是：session = Session() inputs = tf.placeholder(dtype=tf.float32, shape=(None, height, width, in_channel_size), name='input_img') model = Some_Model(inputs, num_classes=no_of_defects, is_training=False) logits, _ = model.build_model() predictor = tf.nn.softmax(self.logits, name='logits_to_softmax') feed_dict = {inputs: inputs}...

python – Tensorflow中的多标签分类器【代码】

我想用TensorFlow开发一个多标签分类器,我试图意味着存在多个包含多个类的标签.为了说明你可以想象这样的情况： > label-1类：灯光下雨,下雨,局部下雨,没有下雨>标签-2类：晴天,部分多云,多云,非常多云. 我想用神经网络对这两个标签进行分类.现在,我为每个(label-1,label-2)对类使用了不同的类标签.这意味着我有4 x 4 = 16个不同的标签. 通过训练我的模型目前的损失cross_entropy = tf.reduce_mean(-tf.reduce_sum(ys * tf.log(pr...

python-模板片段缓存似乎不适用于某些自定义模板标签【代码】

我一直在django应用程序中实现缓存,并通过缓存API和模板片段缓存对每个视图进行缓存.在我的某些页面上,我使用了一个自定义的django模板标签,该标签是由第三方开发人员提供的,它在其模板标签中包含一些参数,然后向远程服务器发出请求,并通过XML返回响应,并且然后将结果呈现在我的页面中.太好了-我以为我可以使用片段缓存轻松地缓存它,所以我：{% load cache %} {% cache 500 request.user.username %} {% load third party custom t...

python用来正常显示中文标签 plt.rcParams[‘font.sans-serif‘] = [‘SimHei‘]错误【图】

用来正常显示中文标签显示错误代码plt.rcParams[‘font.sans-serif’] = [‘SimHei’]无法运行我的环境：在JetBrains PyCharm Community Edition 2018.3.5 x64中，解释器是Anaconda3中的Python3.5 错误根源代码：plt.rcParams['font.sans-serif'] = ['SimHei'] 错误根源：Anaconda3的字体库中没有中文字simhei.ttf 如下图是我添加之后的文件夹字体显示解决办法 1、下载simhei.ttf字体，这里提供一个链接SimHei.ttf 2、找到你的解...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / python – 匹配POS标签和单词序列

python – 匹配POS标签和单词序列

内容导读

内容图文

内容总结

内容备注

内容手机端

【python – 匹配POS标签和单词序列】教程文章相关的互联网学习教程文章

python画图中colorbar设置刻度和标签字体大小【代码】

python3用BeautifulSoup用字典的方法抓取a标签内的数据【代码】

python3用BeautifulSoup用字典的方法抓取a标签内的数据【代码】

python - pandas或者sklearn中如何将字符形式的标签数字化

23-python用BeautifulSoup用抓取a标签内所有数据【代码】

python selenium-webdriver 标签页切换（十四）【代码】【图】

python3生成标签云【代码】【图】

PythonNote03_HTML标签【代码】【图】

python 获取html置顶标签文本信息【代码】

利用python和shell脚本生成train.txt的标签文件【代码】【图】

用于NLP的Python：使用Keras的多标签文本LSTM神经网络分类【代码】【图】

python-TensorFlow RuntimeError：在SavedModel中找不到与标签服务相关联的MetaGraphDef【代码】

python – Tensorflow中的多标签分类器【代码】

python-模板片段缓存似乎不适用于某些自定义模板标签【代码】

python用来正常显示中文标签 plt.rcParams[‘font.sans-serif‘] = [‘SimHei‘]错误【图】

PYTHON - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程