首页 / PYTHON / python-如何从Twitter搜索API创建熊猫数据框？

python-如何从Twitter搜索API创建熊猫数据框？

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python-如何从Twitter搜索API创建熊猫数据框？，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2779字，纯文字阅读大概需要4分钟。

内容图文

我正在使用Twitter Search API,该API返回字典.我的目标是根据响应字典中的键列表创建一个数据框.

此处的API响应示例：Example Response

我在状态字典中有一个键列表

keys = ["created_at", "text", "in_reply_to_screen_name", "source"]

我想遍历Statuses词典中返回的每个键值,并将它们放在以键为列的数据框中.

目前,有一些代码可以循环遍历单个键,然后分配给列表,然后追加到数据框,但是希望有一种方法可以一次完成多个键.当前代码如下：

#w is the word to be queired
w = 'keyword'
#count of tweets to return
count = 1000

#API call
query = twitter.search.tweets(q= w, count = count)

def data_l2 (q, k1, k2):

    data = []

    for results in q[k1]:
        data.append(results[k2])

    return(data)

screen_names = data_l3(query, "statuses", "user", "screen_name")

data = {'screen_names':screen_names,
       'tweets':tweets}
frame=pd.DataFrame(data)
frame

解决方法:

在使用Twitter API时,我将分享我想到的一个更通用的解决方案.假设您要在名为my_ids的列表中获取要获取的tweet的ID：

# Fetch tweets from the twitter API using the following loop:
list_of_tweets = []
# Tweets that can't be found are saved in the list below:
cant_find_tweets_for_those_ids = []
for each_id in my_ids:   
    try:
        list_of_tweets.append(api.get_status(each_id))
    except Exception as e:
        cant_find_tweets_for_those_ids.append(each_id)

然后在此代码块中,我们隔离已下载的每个扭曲状态对象的json部分,并将它们全部添加到列表中….

my_list_of_dicts = []
for each_json_tweet in list_of_tweets:
    my_list_of_dicts.append(each_json_tweet._json)

…然后我们将此列表写入txt文件：

with open('tweet_json.txt', 'w') as file:
        file.write(json.dumps(my_list_of_dicts, indent=4))

现在,我们将从tweet_json.txt文件创建一个DataFrame(我添加了一些与我正在使用的用例相关的键,但是您可以添加特定的键)：

my_demo_list = []
with open('tweet_json.txt', encoding='utf-8') as json_file:  
    all_data = json.load(json_file)
    for each_dictionary in all_data:
        tweet_id = each_dictionary['id']
        whole_tweet = each_dictionary['text']
        only_url = whole_tweet[whole_tweet.find('https'):]
        favorite_count = each_dictionary['favorite_count']
        retweet_count = each_dictionary['retweet_count']
        created_at = each_dictionary['created_at']
        whole_source = each_dictionary['source']
        only_device = whole_source[whole_source.find('rel="nofollow">') + 15:-4]
        source = only_device
        retweeted_status = each_dictionary['retweeted_status'] = each_dictionary.get('retweeted_status', 'Original tweet')
        if retweeted_status == 'Original tweet':
            url = only_url
        else:
            retweeted_status = 'This is a retweet'
            url = 'This is a retweet'

        my_demo_list.append({'tweet_id': str(tweet_id),
                             'favorite_count': int(favorite_count),
                             'retweet_count': int(retweet_count),
                             'url': url,
                             'created_at': created_at,
                             'source': source,
                             'retweeted_status': retweeted_status,
                            })
        tweet_json = pd.DataFrame(my_demo_list, columns = ['tweet_id', 'favorite_count', 
                                                       'retweet_count', 'created_at',
                                                       'source', 'retweeted_status', 'url'])

内容总结

以上是互联网集市为您收集整理的python-如何从Twitter搜索API创建熊猫数据框？全部内容，希望文章能够帮你解决python-如何从Twitter搜索API创建熊猫数据框？所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/694411.html

来源：【匿名】

【上一篇】python-如何避免在heapq中使用_siftup或_siftdown 【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python-如何从Twitter搜索API创建熊猫数据框？】教程文章相关的互联网学习教程文章

python小脚本批量创建用户和ssh互信

#!/usr/bin/pythonfrom fabric.api import *for i in range(24,34): host = ‘test@172.18.22.‘ + str(i) env.hosts.append(host)env.password = ‘111111‘def addusers(): sudo(‘useradd -d /home/ctier -s /bin/bash ctier;echo ctier:"123456" | chpasswd‘) #change user password #sudo(‘echo ctier:"654321" | chpasswd‘)def createAuth(): with lcd(‘/home/ctier/‘): ...

python创建线程示例

复制代码代码如下:import threadingfrom time import sleep def test_func(id): for i in range(0,5): sleep(1) print(‘thread %d is running %d‘ % (id,i))threads = []for i in range(0,3): t = threading.Thread(target=test_func, args=(i,)) threads.append(t)for t in threads: t.start()for t in threads: t.join()从输出结果可以看到，3个线程是交替的执行的原文：http://www.jb51.net/...

使用python创建cocos2d-x项目【图】

已准备条件：已安装vs2012，已下载cocos2d-x sdk 2.2.3包。旧版本使用包里面的模板创建项目，现在新的包，使用python 来创建 1.下载安装 python https://www.python.org/ 版本选2.2.7，高版本的有问题。2. 安装后，配置环境变量将Python的安装的根目录加入系统环境变量的Path路径中3.点击电脑开始——运行——cmd,在dos里面输入 python 看见如下信息，就是安装成功了 4.接下来就可以利用Python来创建新的项目了，将命令行...

python创建Excel文件数据的方法【代码】

# -*- coding: utf-8 -*-# @Time : 2018/12/6 17:10# @Author : suchao# @Disc: : 生成10000条Excel数据# @File : 1000data.py# @Software: PyCharmimport xlrd ,xlwtimport random"""创建一个excel对象"""book = xlwt.Workbook(encoding=‘utf-8‘,style_compression=0)"""创建sheet"""sheet = book.add_sheet(‘test‘,cell_overwrite_ok=True)"""添加字段"""sheet.write(0, 0, ‘编号‘)sheet.write(0, 1, ‘名称‘)sh...

Python 使用 PyMysql、DBUtils 创建连接池，提升性能【代码】【图】

转自：https://blog.csdn.net/weixin_41287692/article/details/83413775Python 编程中可以使用 PyMysql 进行数据库的连接及诸如查询/插入/更新等操作，但是每次连接 MySQL 数据库请求时，都是独立的去请求访问，相当浪费资源，而且访问数量达到一定数量时，对 mysql 的性能会产生较大的影响。因此，实际使用中，通常会使用数据库的连接池技术，来访问数据库达到资源复用的目的。解决方案：DBUtilsDBUtils 是一套 Python 数据库连接...

python 虚拟环境创建

创建虚拟环境：　 sudo apt-get install virtualenv 新建虚拟环境文件夹 venv virtualenv venv 进入虚拟环境source venv/bin/activate 安装套件列表模块: 用来记录项目中所使用到的各种模块，便于项目部署时统一安装所需模块 pip freeze > requirements.txt 这个套件列表文件一般存放在项目根目录下；将项目克隆到新的工作环境后，使用 pip install -r "requirements.txt" 即可安装所有项目所用到的套件在新机器中运行项目时，只需...

Python 创建和使用类【代码】

python创建和使用类的方法如下# class Dog(): # def __init__(self,name,age): # self.name=name # self.age=age # # def sit(self): # print(self.name.title()+"is now sitting") # # def roll_over(self): # print(self.name.title()+" rolled over!") # # my_dog=Dog("willie",6) # #print("My dog‘s name is "+my_dog.name.title()+".") # #print("My dog is "+str(my_dog.age)...

【Python3 爬虫】U24_多线程爬虫之Thread类创建多线程【代码】【图】

目录1.开篇知识补充2.继承自threading.Thread类1.开篇知识补充查看线程数 threading.enumerate()函数可以查看当前线程数量。查看当前线程的名字使用threading.current_thread()可以查看当前线程的信息。2.继承自threading.Thread类为了让线程更好的封装，，可以使用threading模块下的Thread，继承这个类，然后实现run方法，线程就会自动运行run方法中的代码。示例代码如下：import threading import timeclass DanceThread(thread...

如何在Python中安全地创建嵌套目录【代码】

检查文件目录是否存在的最优雅方法是什么，如果不存在，如何使用Python创建目录？这是我以前使用过的方法： import osfile_path = "/my/directory/filename.txt" directory = os.path.dirname(file_path)try:os.stat(directory) except:os.mkdir(directory) f = file(filename) 不知何故，我错过了os.path.exists。现在推荐使用这个方法： def ensure_dir(file_path):directory = os.path.dirname(file_path)if not os.pat...

python创建二维数组【代码】

1 c=[[0]*3 for i in range(3)] 23 c=[[0 for i in range(3)] for i in range(3)] 原文：http://www.cnblogs.com/smuxiaolei/p/7460678.html

python+Django创建第一个项目【代码】

1.首先搭建好环境1.1 安装pyhton，Linux系统中，python是系统自带的所以就不用安装1.2 安装Django框架使用pip安装：pip install django1.3 检查是否安装好1.4 查看Django的管理工具---django-admin.py命令2. 创建第一个项目HelloWorld: 项目的容器。 manage.py: 一个实用的命令行工具，可让你以各种方式与该 Django 项目进行交互。 HelloWorld/__init__.py: 一个空文件，告诉 Python 该目录是一个 Python 包。 HelloWorld/settings...

python 爬虫之为什么使用opener对象以及为什么要创建全局默认的opener对象

基本的urlopen()函数不支持验证、cookie或其他HTTP高级功能。要支持这些功能，必须使用build_opener()函数来创建自己的自定义Opener对象。 install_opener(opener) 安装opener作为urlopen()使用的全局URL opener，即意味着以后调用urlopen()时都会使用安装的opener对象。opener通常是build_opener()创建的opener对象。不需要每次调用都要重新创建了，每次使用URLopen都是高级的、多功能的URLopen。一些复杂情况详细解决办法：1. c...

[python]动态创建类【代码】

本文主要说明如何使用type来创建类，并添加类属性、方法。type实则是python内建元类，用来创建类，当我们用class 定义一个类时，python后台是在用type创建该类。了解type的两种用法 class type(object)| type(object) -> the object‘s type| type(name, bases, dict) -> a new type 创建A类，具有A.addr属性>>> A = type(‘A‘, (), {‘addr‘:‘beijing‘}) >>> A <class‘__main__.A‘> 定义一个函数，作为类方法的引用>>>...

mkvirtualenv创建python虚拟环境【代码】【图】

为什么要创建虚拟环境呢？如果在我们本地开发好几个项目，每个项目又用到很多第三方插件，如果没没用创建虚拟环境，那么本地项目插件就会很多很乱，如果有虚拟环境就不一样了虚拟环境安装pip install virtualenvpip install virtualenvwrapperpip install virtualenvwrapper-win 安装完上面三个插件后，需要配置一下环境变量WORKON_HOME，你创建的虚拟环境都在你配置的目录下打开cmd，执行命令mkvirtualenv C:\*********\...

用Python删除本地目录下某一时间点之前创建的文件

参考http://www.cnblogs.com/iderek/p/8035757.htmlos.listdir(dirname)：列出dirname下的目录和文件os.getcwd()：获得当前工作目录os.curdir:返回当前目录（‘.‘)os.chdir(dirname):改变工作目录到dirnameos.path.isdir(name):判断name是不是一个目录，name不是目录就返回falseos.path.isfile(name):判断name是不是一个文件，不存在name也返回falseos.path.exists(name):判断是否存在文件或目录nameos.path.getsize(name):获得文...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / python-如何从Twitter搜索API创建熊猫数据框？

python-如何从Twitter搜索API创建熊猫数据框？

内容导读

内容图文

内容总结

内容备注

内容手机端

【python-如何从Twitter搜索API创建熊猫数据框？】教程文章相关的互联网学习教程文章

python小脚本批量创建用户和ssh互信

python创建线程示例

使用python创建cocos2d-x项目【图】

python创建Excel文件数据的方法【代码】

Python 使用 PyMysql、DBUtils 创建连接池，提升性能【代码】【图】

python 虚拟环境创建

Python 创建和使用类【代码】

【Python3 爬虫】U24_多线程爬虫之Thread类创建多线程【代码】【图】

如何在Python中安全地创建嵌套目录【代码】

python创建二维数组【代码】

python+Django创建第一个项目【代码】

python 爬虫之为什么使用opener对象以及为什么要创建全局默认的opener对象

[python]动态创建类【代码】

mkvirtualenv创建python虚拟环境【代码】【图】

用Python删除本地目录下某一时间点之前创建的文件

PYTHON - 相关标签

数据 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程