sql 重写ipCount

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了sql 重写ipCount，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1601字，纯文字阅读大概需要3分钟。

内容图文

package com.ws.sparksql
import com.ws.spark.IpFromUtils
import org.apache.spark.sql.{DataFrame, Dataset, SparkSession}

/**
  * 统计日志中ip归属地出现次数
  */
object SqlIpFromCount {

  def main(args: Array[String]): Unit = {

    val sparkSession = SparkSession.builder().appName("SqlIpFromCount").master("local[*]").getOrCreate()

    import sparkSession.implicits._

    //读取规则
    val rulesData: Dataset[String] = sparkSession.read.textFile("E:\\bigData\\testdata\\ip.txt")

    val rules: Dataset[(Long, Long, String)] = rulesData.map(l => {
      val fields = l.split("[|]")
      val beginNum = fields(2).toLong
      val endNum = fields(3).toLong
      val province = fields(6)
      (beginNum, endNum, province)
    })

    val rulesDataFrame = rules.toDF("start_num","end_num","province")

    rulesDataFrame.createTempView("t_rules")

    //广播变量,只能用sc实例
    //val broadCast: Broadcast[Array[(Long, Long, String)]] = sparkSession.sparkContext.broadcast(rules)

    //读取数据
    val data: Dataset[String] = sparkSession.read.textFile("E:\\bigData\\testdata\\access.log")

    val ipNum: Dataset[Long] = data.map(l => {
      val fields = l.split("[|]")
      val ip = fields(1)
      //ip转十进制
      val ipNum = IpFromUtils.ipToLong(ip)
      ipNum
    })

    val ipNumDataFrame: DataFrame = ipNum.toDF("ip_num")

    ipNumDataFrame.createTempView("t_ips")

    val result = sparkSession.sql("select province , count(*) as times from t_rules right join t_ips on (ip_num >= start_num and ip_num <= end_num) group by province order by times desc")

    result.show()

    sparkSession.stop()
  }
}

结果：

+--------+-----+
|province|times|
+--------+-----+
|      陕西| 1824|
|      北京| 1535|
|      重庆|  868|
|      河北|  383|
|      云南|  126|
+--------+-----+

内容总结

以上是互联网集市为您收集整理的sql 重写ipCount全部内容，希望文章能够帮你解决sql 重写ipCount所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/920871.html

来源：【匿名】

【上一篇】Spring 中 SQL 的存储过程【下一篇】关于IE的RegExp.exec的问题

更多 ►

【sql 重写ipCount】教程文章相关的互联网学习教程文章

1 Github项目地址：https://gitee.com/DamonGetup/WordCount/tree/master2 对程序设计语言源文件统计字符数、单词数、行数，统计结果以指定格式输出到默认文件中，以及其他扩展功能，并能够快速地处理多个文件。基本功能：wc.exe -c file.c //返回文件 file.c 的字符数 wc.exe -w file.c //返回文件 file.c 的单词总数 wc.exe -l file.c //返回文件 file.c 的总行数 ...

CountDownLatch demo与源码【代码】【图】

? 在之前项目中碰到一个复杂查询，就是需要先分页查询出20条数据，然后根据事件类型对这20条数据分为4类，分别用线程查询这4类的特有信息，然后等所有的线程执行完成之后，在对这20条数据根据事件排序，最后返回给前端。因为是使用的线程查询，所以不知道什么时候会执行完。找了很久找到了方案，就是使用CountDownLatch。 CountDownLatch和CyclicBarrier都是java.util.concurrent包下面的多线程工具类。今天只讲CountDownLatch，...

sql 语句中count()有条件的时候为什么要加上or null【代码】

1、sql 语句中count()有条件的时候为什么要加上or null。如count(province = ‘浙江‘ or NULL) 这部分，为什么要加上or NULL，直接count(province=‘浙江‘)有什么问题吗？不就是要找province = ‘浙江‘的数据吗，为什么要计算NULL的数据。答案：因为当 province不是浙江时 province=‘浙江‘ 结果false。不是 NULL，count在值是NULL是不统计数，（count(‘任意内容‘)都会统计出所有记录数，因为count只有在遇见null时不计数...

sql 重写ipCount【代码】

package com.ws.sparksql import com.ws.spark.IpFromUtils import org.apache.spark.sql.{DataFrame, Dataset, SparkSession}/*** 统计日志中ip归属地出现次数*/ object SqlIpFromCount {def main(args: Array[String]): Unit = {val sparkSession = SparkSession.builder().appName("SqlIpFromCount").master("local[*]").getOrCreate()import sparkSession.implicits._//读取规则val rulesData: Dataset[String] = sparkSession...

Selectcount(*)、Count(1)和Count(列)的区别及执行方式【图】

在SQL Server中Count(*)或者Count(1)或者Count([列])或许是最常用的聚合函数。很多人其实对这三者之间是区分不清的。本文会阐述这三者的作用，关系以及背后的原理。往常我经常会看到一些所谓的优化建议不使用Count(* )而是使用Count（1），从而可以提升性能，给出的理由是Count( *)会带来全表扫描。而实际上如何写Count并没有区别。 Count(1)和Count(*)实际上的意思是，评估Count（）中的表达式是否为NULL，如果为NULL则不...

http://www.cndba.cn/account/article/details/106【代码】

1 故事开始首先剧透一下后门木马：Linux.BackDoor.Gates.5http://forum.antichat.ru/threads/413337/ 首先是下午14点左右有几台服务器出现流量超高，平时只有几百M的流量，那时候发现流量上G了，达到这个量第一感觉就是遭受了DDOS流量攻击，那时候手上的服务器比较多，出现几台并没有放在眼里，觉得查查就可以出来结果。随便说一句为了达到最好的性能，我们这些服务器都没有开防火墙（包括硬件及iptables），也就是服务器一直处...

"HybridDB · 性能优化 · Count Distinct的几种实现方式” 读后感

本文系统来源：http://www.cnblogs.com/clevermasm/p/6713626.html

sql count中加条件【代码】

一般的，我们会在where, 或者 having中加条件，count中只是某个字段今天看到另外一种写法，不知道性能怎么样 select count( case when xxx>10 and yyy<99 then bbb else null end) cm1,count( case when xxx>20 and yyy<1 then ccc else null end) cm2from xxxx基本原理是使用了数据库count(null)时返回的是0 count(非null)返回是1 @Flink SQL

结队编程-WordCount【图】

合作者： 201631062201，201631062202 代码地址： https://gitee.com/ZMLJZ/codes/3os7pwfqz58unil9c1xag30#WordCount.java 作业链接： https://edu.cnblogs.com/campus/xnsy/2018Systemanalysisanddesign/homework/2188 代码审核及合并回观我们的第一次项目，我们都并没自审我们的代码，也没有做很严谨的测试。结对项目中我们相互对对方的代码进行了审核，张明磊同学认为奂欣同学的代码，将所有的任务都放在了主函数里...

CountDownLatch 和 CyclicBarrier【代码】

CountDownLatch 每次当线程调用countDownLatch.countDown()方法时，会对计数器减1，减到0，countDownLatch.await()放行public class CountDownLatchTest {public static void main(String[] args) {CountDownLatch count = new CountDownLatch(7);for (int i=0; i < 7; i++){final int tempInt = i;new Thread(()->{System.out.println("线程"+tempInt+"执行");count.countDown();},String.valueOf(i)).start();}try {count.await(...

【SAS ADVANCE】通过COUNT函数实现counting values及HAVING子句【代码】

一、 COUNT函数在实际统计应用中，需要计算观测值出现的次数，这项功能可以通过COUNT函数来实现，它有下面三种形式和功能：form you used返回值例子COUNT(*)整个表或组的行数 select count(*) as CountCOUNT(column)当参数中所选定的列没有缺失值时，输出表或者组中该变量的行数 select count(jobcode) as CountCOUNT(DISTINCT column)该列中distinct values的行数 select count(distinct jobcode) as Count 【备注】：...

WordCount结对编程【图】

合作者：201631062602，201631062114 代码地址：一、PSP表格PSP2.1PSP阶段预估耗时（分钟）实际耗时（分钟）Planning计划 20 30Estimate估计这个任务需要多少时间 20 30Development开发 670 1155Analysis需求分析 (包括学习新技术) 120 100Design Spec生成设计文档 0 0Design Review设计复审 (和同事审核设计文档) 0 0Coding Standard代码规范 (为目前的开发制定合适的规范) 20 30Design具体设计 50 115Coding具体编码 300 660C...

hud 3336 count the string (KMP)【代码】【图】

这道题本来想对了，可是因为hdu对pascal语言的限制是我认为自己想错了，结果一看题解发现自己对了……题意：给以字符串计算出以前i个字符为前缀的字符中在主串中出现的次数和如： num(abab)=num(a)+num(ab)+num(aba)+num(abab)=2+2+1+1=6; 题解：next[i]记录的是长度为i 不为自身的最大首尾重复子串长度 num[i]记录长度为next[i]的前缀所重复出现的次数附上代码：const mo=10007; var sum,next:array[0....

fail-fast和modcount【代码】

Arraylist,HashMap,HashSet等容器持有的的fail-fast迭代器，具体实现原理和modcount域有关. Lets looks at following code 01 publicclass FailFastIteratorTest { 02 03 publicstaticvoid main(String[] args) { 04 05 final List<String> list = new ArrayList<String>(); 06 list.add("a"); 07 list.add("b"); 08 list.add("c"); 09 10 Iterator<String> it = list.iterator(); 11 12 ...

make words counter for image with the help of paddlehub model - [camera support]【代码】

说明接着上篇，实现拍摄统计功能。https://www.cnblogs.com/lightsong/p/14592798.html 功能明细：实时展示摄像头内容实时统计统计结果在展示视频中显示技术依赖上篇是基于linux环境，由于需要添加实时展示功能，需要切换到windows。 OCR模块依赖https://paddlehub.readthedocs.io/zh_CN/develop/quick_experience/cmd_quick_run.html需要安装 shapely 和 pyclipper 库。# 下载待测试的图片 $ wget https://paddlehub.bj.bcebos....

首页 / 更多教程 / sql 重写ipCount

sql 重写ipCount

内容导读

内容图文

内容总结

内容备注

内容手机端

【sql 重写ipCount】教程文章相关的互联网学习教程文章

第二次作业（WordCount）【图】

CountDownLatch demo与源码【代码】【图】

sql 语句中count()有条件的时候为什么要加上or null【代码】

sql 重写ipCount【代码】

Selectcount(*)、Count(1)和Count(列)的区别及执行方式【图】

http://www.cndba.cn/account/article/details/106【代码】

"HybridDB · 性能优化 · Count Distinct的几种实现方式” 读后感

sql count中加条件【代码】

结队编程-WordCount【图】

CountDownLatch 和 CyclicBarrier【代码】

【SAS ADVANCE】通过COUNT函数实现counting values及HAVING子句【代码】

WordCount结对编程【图】

hud 3336 count the string (KMP)【代码】【图】

fail-fast和modcount【代码】

make words counter for image with the help of paddlehub model - [camera support]【代码】

更多教程 - 最新教程

更多教程 - 最热教程