首页 / PYTHON / python – 获取具有随机类名的元素

python – 获取具有随机类名的元素

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python – 获取具有随机类名的元素，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含5328字，纯文字阅读大概需要8分钟。

内容图文

它看起来像< class id> for< img class>在Instagram的网页上每天都在变化.现在它是FFVAD,明天它将是其他东西.例如(我缩短了,链接很长)：

< img class =“FFVAD”alt =“标记你最好的朋友”decoding =“auto”style =“”sizes =“293px”src =“https://scontent-lax3-2.cdninstagram.com/vp/0436c00a3ac9428b2b8c977b45abd022 /5BAB3EBC/t51.2885-15/s640x640/sh0.08/e35/33110483_592294374461447_8669459880035221504_n.jpg\"\u0026gt; 通过这样说,我需要修复脚本并对类ID进行硬编码,以便能够抓取网页. var = driver.find_elements_by_class_name(‘FFVAD’) 有人告诉我,我可以使用img.get_attribute(‘class’)来查找类ID并将其存储起来供以后使用.但是我仍然不明白如何实现这一点,所以selenium或者汤可以从html标签中获取Class ID并在以后存储或解析它. 我现在得到的就是这个.它有点脏,不对,但想法就在那里.

import requests
import selenium.webdriver as webdriver

url = ('https://www.instagram.com/kitties')
driver = webdriver.Firefox()
driver.get(url)
last_height = driver.execute_script("return document.body.scrollHeight")

while True:
    imgs_dedupe = driver.find_elements_by_class_name('FFVAD')

    for img in imgs_dedupe:
        posts = img.get_attribute('class')
        print posts

    driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
    time.sleep(scroll_delay)
    new_height = driver.execute_script("return document.body.scrollHeight")

    if new_height == last_height:
        break
    last_height = new_height

当我运行它时,我得到这个输出,因为页面上有3个图像,我得到3x类ID

python tag_print.py 
FFVAD
FFVAD
FFVAD

解决方法:

您当前正在通过硬编码的类名搜索元素.

如果类名是随机的,则不能再对其进行硬编码.你必须要么：

>通过其他一些特征搜索元素(例如元素层次结构,其他一些属性等; XPath可以做到这一点)

In [10]: driver.find_elements_by_xpath('//article//img')
Out[10]:
[<selenium.webdriver.firefox.webelement.FirefoxWebElement (session="1ab4eeb4-10c4-4da4-996c-ee6744445dcc", element="55c48964-8cd0-4472-b35b-214a5a9bfbf7")>,
 <selenium.webdriver.firefox.webelement.FirefoxWebElement (session="1ab4eeb4-10c4-4da4-996c-ee6744445dcc", element="b7f7c8a4-e343-49ca-b416-49f72e67ae07")>,
 <selenium.webdriver.firefox.webelement.FirefoxWebElement (session="1ab4eeb4-10c4-4da4-996c-ee6744445dcc", element="728f6148-6a03-4c9a-9933-36859d65eb51")>]

>您还可以按元素的视觉特征进行搜索：大小,可见性,位置.这不能完全由XPath完成,你必须得到所有< img>用手标记并用JS检查每一个.
(见下面的例子,因为它很长.)

>从其他页面逻辑以某种方式学习这个类名(如果页面的逻辑本身可以找到并使用它,它必须存在于其他地方,并且该逻辑必须由其他东西找到,等等)

在这种情况下,类名是renderImage函数中局部变量的一部分,因此它只能通过探索其AST来通过DOM进行挽救.函数本身被隐藏在webpack机器内部(它似乎将所有资源打包成一些具有单字母名称的全局对象).或者,您可以将所有包含的JS文件作为原始数据读取,并在其中查找renderImage的定义.因此,在这种情况下,虽然理论上可能仍然存在,但它不成比例地难以实现.

通过视觉特征获取元素的示例

在任何页面上,这将找到3个相同大小的图像,并排放置(这是它们在https://www.instagram.com/kitties的方式).

由于HTMLElements不能直接传递给Python(至少我找不到任何方法),我们需要传递一些唯一的ID来代替它们,就像独特的XPath一样.

(JS代码可能更优雅,我没有太多的语言经验)

In [22]: script = """
  //https://stackoverflow.com/questions/2661818/javascript-get-xpath-of-a-node/43688599#43688599
  function getXPathForElement(element) {
      const idx = (sib, name) => sib 
          ? idx(sib.previousElementSibling, name||sib.localName) + (sib.localName == name)
          : 1;
      const segs = elm => !elm || elm.nodeType !== 1 
          ? ['']
          : elm.id && document.querySelector(`#${elm.id}`) === elm
              ? [`id("${elm.id}")`]
              : [...segs(elm.parentNode), `${elm.localName.toLowerCase()}[${idx(elm)}]`];
      return segs(element).join('/');
  }

  //https://plainjs.com/javascript/styles/get-the-position-of-an-element-relative-to-the-document-24/
  function offsetTop(el){
    return window.pageYOffset + el.getBoundingClientRect().top;
  }

  var expected_images=3;
  var found_groups=new Map();
  for (e of document.getElementsByTagName('img')) {
    let group_id = e.offsetWidth + "x" + e.offsetHeight;
    if (!(found_groups.has(group_id))) found_groups.set(group_id,[]);
    found_groups.get(group_id).push(e);
  }
  for ([k,v] of found_groups) {
    if (v.length != expected_images) {found_groups.delete(k);continue;}
    var offset_top = offsetTop(v[0]);
    for (e of v){
      let _c_oft = offsetTop(e);
      if (_c_oft !== offset_top){
        found_groups.delete(k);
        break;
      }
    }
  }
  if (found_groups.size != 1) {
    console.log(found_groups);
    throw 'Unexpected pattern of images after filtering';
  }

  var found_group = found_groups.values().next().value;


  result=[]
  for (e of found_group) {
    result.push(getXPathForElement(e));
  }
  return result;
"""

In [23]: d.execute_script(script)
Out[23]:
[u'id("react-root")/section[1]/main[1]/div[1]/article[1]/div[1]/div[1]/div[1]/div[1]/a[1]/div[1]/div[1]/img[1]',
 u'id("react-root")/section[1]/main[1]/div[1]/article[1]/div[1]/div[1]/div[1]/div[2]/a[1]/div[1]/div[1]/img[1]',
 u'id("react-root")/section[1]/main[1]/div[1]/article[1]/div[1]/div[1]/div[1]/div[3]/a[1]/div[1]/div[1]/img[1]']

In [27]: [d.find_element_by_xpath(xp) for xp in _]
Out[27]:
[<selenium.webdriver.firefox.webelement.FirefoxWebElement (session="1ab4eeb4-10c4-4da4-996c-ee6744445dcc", element="55c48964-8cd0-4472-b35b-214a5a9bfbf7")>,
 <selenium.webdriver.firefox.webelement.FirefoxWebElement (session="1ab4eeb4-10c4-4da4-996c-ee6744445dcc", element="b7f7c8a4-e343-49ca-b416-49f72e67ae07")>,
 <selenium.webdriver.firefox.webelement.FirefoxWebElement (session="1ab4eeb4-10c4-4da4-996c-ee6744445dcc", element="728f6148-6a03-4c9a-9933-36859d65eb51")>]

内容总结

以上是互联网集市为您收集整理的python – 获取具有随机类名的元素全部内容，希望文章能够帮你解决python – 获取具有随机类名的元素所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/707911.html

来源：【匿名】

【上一篇】Pygame-窗口和精灵类 – python 【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python – 获取具有随机类名的元素】教程文章相关的互联网学习教程文章

Python遍历删除元素【代码】

需求：有一个列表：ls = [1,2,3,4,5,6]，要求删除其中的偶数如果是下面这种方法，在遍历的过程中删除，会有问题for i in range(len(ls)):if ls[i]%2 == 0:del ls[i] 异常：IndexError: list index out of range因为删除一个元素后，列表的长度改变了，所以会报下标越界。可以采取一下三种方法：1.ls = [x for x in ls if x%2!=0] #列表解析 2.ls = filter(lambda x:x%2!=0,ls) #filter 3.for i in range(len(ls)-1,-1,-1)...

Python封装函数：实现删除一个list里面的重复,且元素顺序要与原list顺序对应【图】

封装函数：实现删除一个list里面的重复,且元素顺序要与原list顺序对应代码：def info(l):l1 = l[:]for i in range(len(l)):v = l.count(l[i])if l1.count(l[i]) > 1:for j in range(1, v):l1.remove(l[i])return l1print(info([1, 2, 3, 4, 2, 3, 6, 2]))思想：统计相同元素出现的次数，然后删除到1原文：http://blog.51cto.com/13241097/2114105

python---定位元素

1.定位元素：以百度输入框和搜索为例子（1）id定位：id属性在html文档中是唯一的find_element_by_id()方法通过id属性定位元素（2）name定位find_element_by_name()方法（3）class定位find_element_by_class_name()方法（4）tag定位：tag往往用来定义一类功能，通过tag识别某个元素的概率很低find_element_by_tag_name()方法（5）link定位：用来定位文本链接。find_element_by_link_txt("新闻")find_element_by_link_txt()方法通过...

Python循环列表删除元素问题【代码】

有人会遇到这种问题，遍历列表，想删除列表中的某几个元素，执行后发现有些并没有删除到，比如以下代码a=[1,2,3,4,5,6]print(a) for i in a:if i==3 or i==4:a.remove(i)print(a)从代码看主要就是想删除a列表中的 3 4 元素，程序的结果是：[1, 2, 3, 4, 5][1, 2, 4, 5]结果不尽人意，原因是我们在遍历的时候seek走到了3元素的位置if判断remove 3 这个元素3这个位置删除后位置空出来了，后面的元素就往前移动，替代了3的位置seek继...

python+selenium自动化测试——CSS选择元素（二）

id、class都是web元素的属性，因为他们是很常用的属性，所以css选择器专门提供了根据id、class选择的语法。那么其他的属性呢？比如：<a href="https://www.baidu.com"> 百度</a> 根据href选择，也可以使用css选择器 css选择器支持通过任何属性来选择元素，语法是用一个方括号[ ]比如：要选择上面的 a元素，可以使用 [ href = "https://www.baidu.com" ] 即选择属性href值为 https://www.baidu.com 的元素当然，前面可以加上css表达...

python计算列表内元素出现次数【代码】

result=[‘normal‘, ‘normal‘, ‘test2‘, ‘test1‘, ‘test2‘, ‘test1‘, ‘normal‘, ‘test1‘, ‘normal‘, ‘test2‘, ‘test2‘, ‘test2‘, ‘test1‘, ‘test2‘, ‘test1‘, ‘test2‘, ‘normal‘, ‘test2‘, ‘test2‘, ‘normal‘, ‘normal‘, ‘normal‘, ‘normal‘, ‘test2‘, ‘normal‘, ‘test1‘, ‘normal‘, ‘normal‘, ‘test1‘, ‘test2‘, ‘test2‘, ‘normal‘, ‘test2‘, ‘normal‘, ‘te...

APP自动化（java和python）——参考——appium参考——元素定位方法参考

Appium Appium 入门到原理之 Appium 基于安卓的各种 FindElement 的控件定位方法实践和建议转载：https://testerhome.com/topics/1970 TechoGoGoGo · 2015年02月04日 · 最后由 kuailel45 回复于 2016年01月11日 · 2485 次阅读目录 AppiumDriver 的各种 findElement 方法的尝试，尝试的目标应用是 SDK 自带的 Notepad 应用。findElementByName示例el = driver.findElementByName("Add note");assertThat(el.getText(),equalTo("Ad...

【python】Leetcode每日一题-删除排序链表中的重复元素【代码】【图】

【python】Leetcode每日一题-删除排序链表中的重复元素【题目描述】给你一个链表的头节点 head ，旋转链表，将链表每个节点向右移动 k 个位置。示例1：输入：head = [1,2,3,4,5], k = 2 输出：[4,5,1,2,3] 示例2：输入：head = [0,1,2], k = 4 输出：[2,0,1] 提示：链表中节点的数目在范围 [0, 500] 内 -100 <= Node.val <= 100 0 <= k <= 2 * 10^9 【分析】思路由于 $ 0 \le k \le 2 * 10^9$ ，k较大，因此需要先求出链表总长度，...

python 比较列表相邻元素（找相同或去重）（python compare adjacent elements in list for finding the same or repeat）【代码】

python 列表去除相邻重复相等数据（只保留一个）参开资料：https://stackoverflow.com/questions/3460161/remove-adjacent-duplicate-elements-from-a-list1 In [1]: import itertools 23 In [2]: a=[0, 1, 3, 2, 4, 4, 5, 6, 7, 8, 10, 11, 12, 13, 14, 16, 16, 17, 18, 18, 19, 20, 20, 21, 22, 22, 22, 23, 23, 23, 26, 29, 29, 30, 32, 33, 34, 32, 32, 15, 24] ...

Python list替换元素【代码】

替换直接对应位置赋值假设现在班里仍然是3名同学：>>> L = [‘Adam‘, ‘Lisa‘, ‘Bart‘]现在，Bart同学要转学走了，碰巧来了一个Paul同学，要更新班级成员名单，我们可以先把Bart删掉，再把Paul添加进来。另一个办法是直接用Paul把Bart给替换掉：>>> L[2] = ‘Paul‘ >>> print L L = [‘Adam‘, ‘Lisa‘, ‘Paul‘]对list中的某一个索引赋值，就可以直接用新的元素替换掉原来的元素，list包含的元素个数保持不变。由于Bart还可...

02.python程序的元素分析【图】

一、缩进缩进表达程序的格式框架-严格明确缩进是语法的一部分，缩进不正确程序运行错误-所属关系表达代码间包含关系和层次关系的唯一手段-长度一致程序内一致即可，一般用4个空格或1个TAB二、1、注释不被程序执行的辅助性说明信息-单行注释以#开头，其后内容为注释-多行注释以‘’’开头和结尾2、变量用来保存和表示数据的占位符号-变量采用标识符（名字）来表示，关联标识符的过程叫命名-可以使用等号（=）向...

leetcode刷题_PYTHON(6):链表(6)删除排序链表中的重复元素 II【代码】

存在一个按升序排列的链表，给你这个链表的头节点 head ，请你删除链表中所有存在数字重复情况的节点，只保留原始链表中没有重复出现的数字。返回同样按升序排列的结果链表。提示：链表中节点数目在范围 [0, 300] 内-100 <= Node.val <= 100题目数据保证链表已经按升序排列# Definition for singly-linked list. # class ListNode: # def __init__(self, val=0, next=None): # self.val = val # self.next =...

首页 / PYTHON / python – 获取具有随机类名的元素

python – 获取具有随机类名的元素

内容导读

内容图文

内容总结

内容备注

内容手机端

【python – 获取具有随机类名的元素】教程文章相关的互联网学习教程文章

Python遍历删除元素【代码】

Python封装函数：实现删除一个list里面的重复,且元素顺序要与原list顺序对应【图】

python---定位元素

Python循环列表删除元素问题【代码】

python+selenium自动化测试——CSS选择元素（二）

python计算列表内元素出现次数【代码】

APP自动化（java和python）——参考——appium参考——元素定位方法参考

【python】Leetcode每日一题-删除排序链表中的重复元素【代码】【图】

python 比较列表相邻元素（找相同或去重）（python compare adjacent elements in list for finding the same or repeat）【代码】

Python list替换元素【代码】

02.python程序的元素分析【图】

leetcode刷题_PYTHON(6):链表(6)删除排序链表中的重复元素 II【代码】

Python+Selenium定位不到元素常见原因及解决办法【图】

python selenium操作表格式元素实例【代码】【图】

Selenium2+python自动化,判定元素是否存在【图】

PYTHON - 相关标签

随机 - 相关标签

元素 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程