【python-熊猫将数据框的所有元素连接成单个系列】教程文章相关的互联网学习教程文章

Python3入门系列之-----元组

元组 Python 的元组与列表类似,不同之处在于元组的元素不能修改。 元组使用小括号,列表使用方括号。 元组创建很简单,只需要在括号中添加元素,并使用逗号隔开即可 实例: tup1 = (1,2,3,4,5,6) 创建空元组: tup1 = () 元组中只有一个元素时,要在元素后面添加逗号 tup2 = (1,) # 如果不加逗号,类型为整数类型 注:查看类型,print type(object) 访问元组 实例:tup1 = (1,2,3,4,5,6) print(tup1[0]) #结果为:1 print(...

《零基础学 Python》系列(一)入门篇

《零基础学 Python》系列1)入门篇- 初识Python- Python语言基础- 流程控制语言- 序列的应用- 字符串及正则表达式2)进阶篇- 函数- 面向对象程序设计- 模块- 异常处理及程序调试- 文件及目录操作- 使用Python操作数据库3)高级篇 入门篇目录: 1、初识Python1.1、Python概述Python是一种跨平台的、开源的、免费的、解释型的高级编程语言。Python的应用领域非常广泛,在 Web 编程、图形处理、黑客编程、大数据处理、网络爬虫和...

Python机器学习(十九)决策树之系列二—C4.5原理与代码实现【代码】【图】

ID3算法缺点 它一般会优先选择有较多属性值的Feature,因为属性值多的特征会有相对较大的信息增益,信息增益反映的是,在给定一个条件以后,不确定性减少的程度, 这必然是分得越细的数据集确定性更高,也就是条件熵越小,信息增益越大。为了解决这个问题,C4.5就应运而生,它采用信息增益率来作为选择分支的准则。 C4.5算法原理 信息增益率定义为: 其中,分子为信息增益(信息增益计算可参考上一节ID3的算法原理)...

Python机器学习(二十)决策树系列三—CART原理与代码实现【代码】【图】

ID3,C4.5算法缺点 ID3决策树可以有多个分支,但是不能处理特征值为连续的情况。 在ID3中,每次根据“最大信息熵增益”选取当前最佳的特征来分割数据,并按照该特征的所有取值来切分, 也就是说如果一个特征有4种取值,数据将被切分4份,一旦按某特征切分后,该特征在之后的算法执行中, 将不再起作用,所以有观点认为这种切分方式过于迅速。 C4.5中是用信息增益比率(gain ratio)来作为选择分支的准则。和ID3一样,C4.5算法分类结果...

python合并同系列PDF,并保持路径结构不变【代码】【图】

以下python文件放到D盘根目录运行,会在D盘自动生成“合并后”文件夹,并且合成的pdf所在的路径结构不改变。 思路:先创建“合并后”里的子文件夹,然后才开始合成pdf,合成后的pdf保存到对应的子文件夹中,单独的pdf也会放到里面(自我合成)。pyton代码:import os import re import PyPDF2basedir = ".\\合并前" cls_list = [] for dirs in os.listdir(basedir):print(dirs)os.makedirs(.\\合并后\\+dirs)cls_dict = {}for i, n...

python自动化办公系列03_单个以及批量处理excel文件【代码】

先贴上数据集, 链接:https://pan.baidu.com/s/1ttv7NwbRmfVPcj2iBHTAfg 提取码:zg5v 下面是关于如何计算每个销售额以及总销售的代码。import os import pandas as pdos.chdir("C:\\Users\\yuyuk\\data science\\data analysis and description\\py_excel") name= "专项户外运动装备&冰爪.xlsx" df = pd.read_excel(name) df.head() df["销售额"] = df["转化率"] * df["访客数"] * df["客单价"] df_sum = df.groupby("品牌")["销...

【小工具系列】Python + OpenCV 图片序列转换成视频【代码】

图片序列转换成视频 最近一直在找一个工具,能够将一堆图片转化成视频。网上找了一些小软件,还有 win10 的照片自带的视频制作功能,都不是很满意。 又不想下载那些专业的视频剪辑软件大材小用。 然后找到了ffmpeg这个非常出名非常常用的多媒体编解码库,看了下文档试着用了下,它确实可以完成上述功能,但是命令行对输入图片的命名有规定(文件名必须开头相同、且包含连续编号),并且windows下的编译版不支持Pattern type 'glob'...

python系列整理---爬虫

网络爬虫 一.基本概念一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。 1.1 网络爬虫分类网络爬虫按照系统结构和实现技术,大致可以分为以下几种类型:通用网络爬虫(General Purpose Web Crawler)、聚焦网络爬虫(Focused Web Crawler)、增量式网络爬虫(Incremental Web Crawler)、深层网络爬虫(Deep Web Crawler)。 实际的网络爬虫系统通常是几种爬虫技术相结合实现的。通用网络爬虫通用网络爬虫又称全网爬虫(S...

Python自动化测试系列[v1.0.0][数据驱动DDTEXCEL]【代码】

数据文件序号 检索词 期望结果1 北京 北京2 上海 上海3 广州 广州获取测试数据方法 安装openpyxl C:\Users\Administrator>pip install openpyxl Collecting openpyxlDownloading openpyxl-3.0.3.tar.gz (172 kB)|████████████████████████████████| 172 kB 384 kB/s Collecting jdcalUsing cached jdcal-1.4.1-py2.py3-none-any.whl (9.5 kB) Collecting et_xmlfileUsing cached et_xmlfile-1.0.1...

Python自动化测试系列[v1.0.0][Allure测试报告]【代码】

环境配置 首先python环境中安装pytest和pytest_allure_adaptor模块,命令如下 pip install pytest pip install pytest_allure_adaptor执行测试 pytest -s -q --alluredir [path_to_report_dir][path_to_report_dir]:为执行测试后生成测试结果的路径,是个自定义路径 测试完成后,在命令中指定的[path_to_report_dir]的自定义路径下,会生成类似如下xml文件,该文件中存下了执行测试后的测试结果,文件名类似为(自动生成):95060...

二探python系列之基础语法练习题【代码】【图】

练习题:【练习题答案再页尾】简述编译型与解释型语言的区别,且分别列出你知道的哪些语言属于编译型,哪些属于解释型Pyhton 单行注释和多行注释分别用什么?布尔值分别有什么,及作用是什么?声明变量注意事项有那些?如何查看变量在内存中的地址?请写出 and 、or、not 的作用,并用代码来演示查看2、2.22、“小猿圈”分别是什么数据类型的语法是什么?写代码[ ] 实现用户输入用户名和密码,当用户名为 seven 且 密码为 123 时,显示登陆...

简单异常处理之一|Python练习系列[12]【代码】

练习内容:提示用户输入一个n,再让用户输入n个字符串,程序将每个字符串分割成两部分 用前部分除以后部分得到一个值 用异常处理应对各种异常情况 代码演示视频 完整代码和注释如下 def get_num():#获取一个数字while True:#循环输入 直到用户输入一个正确值user_strs=input('请输入一个整数数字:\n')try:num=int(user_strs)#尝试把字符整数化except Exception as e:#如果出错print('只能输入整数数字')#提示continue#从头开始return ...

任意范围素数寻找|Python练习系列[7]【代码】

素数:又名质数,是指在大于1的自然数中,除了1和它本身以外不再有其他因数的自然数 代码演示视频 完整代码和注释如下 from random import * #素数 prime_list=[] def if_prime(x):#判断x是否为素数n=2while n<x:if x%n==0:#如果x/2无余数直接返回returnif x%n!=0:#如果x/2有余数n+=1#就测试下一个除数值if n==x-1:#如果x/(x-1)仍然有余数prime_list.append(str(x))#那么x就为素数 素数列表添加该值 for x in range(1000,10000):#对...

python常识系列02-->yaml文件语法及示例【代码】

前言时间就像海绵里的水,只要愿挤,总还是有的。——鲁迅今天乌天黑地,就来了几点雨,上了一天课,嗓子不舒服了。来打打字,活跃活跃手。一、YAML文件是什么YAML是 "YAML Aint a Markup Language"(YAML不是一种标记语言)的递归缩写; 实际上YAML还是一种标记语言,只不过是更加聚焦于数据的标记语言(上面是大佬们的文字游戏); YAML也是可以用来编写配置文件的语言,语法非常简洁和强大; 在自动化测试框架中,常应用于自动化...

【Python基础入门系列】第07天:Python 数据结构--序列【代码】【图】

python内置序列类型最常见的是列表,元组和字符串。(序列是python中最基础的数据结构,而数据结构是计算机存储,组织数据的方式。) 另外还提供了字典和集合的数据结构,但他们属于无顺序的数据集合体,不能像前者通过位置索引来访问数据。python序列中的每个元素都有一个序号(元素的具体位置),这个序号叫索引,索引下标从0开始,以此类推...... 本文着重介绍python的序列及其实际应用,巩固python语法基础。 一、序列概念...