首页 / PYTHON / python – 使用相似性函数来聚类scikit-learn

python – 使用相似性函数来聚类scikit-learn

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python – 使用相似性函数来聚类scikit-learn，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1534字，纯文字阅读大概需要3分钟。

内容图文

我使用函数来计算一对文档之间的相似性,并且想要使用这种相似性度量来执行聚类.
代码到目前为止

Sim=np.zeros((n, n)) # create a numpy arrary  
i=0  
j=0       
for i in range(0,n):      
   for j in range(i,n):  
    if i==j:  
        Sim[i][j]=1
     else:    
         Sim[i][j]=simfunction(list_doc[i],list_doc[j]) # calculate similarity between documents i and j using simfunction
Sim=Sim+ Sim.T - np.diag(Sim.diagonal()) # complete the symmetric matrix

AggClusterDistObj=AgglomerativeClustering(n_clusters=num_cluster,linkage='average',affinity="precomputed") 
Res_Labels=AggClusterDistObj.fit_predict(Sim)

我担心的是,我在这里使用了相似度函数,我认为根据文档它应该是一个不相似矩阵,我怎样才能将它改为不相似矩阵.
还有什么是更有效的方法来做到这一点.

解决方法:

>请正确格式化代码,因为缩进在Python中很重要.
>如果可能,请保持代码完整(您将导入numpy省略为np).
>由于范围始终从零开始,因此可以省略它并写入范围(n).
> numpy中的索引像[i,j,k,…]一样工作.
因此,您实际上想要编写Sim [i,j],而不是Sim [i] [j],因为否则您会执行两个操作：首先获取整个行切片然后索引列.另一种方法是将上三角形的元素复制到下三角形

Sim = np.identity(n) # diagonal with ones (100 percent similarity)

for i in range(n):      
    for j in range(i+1, n):    # +1 skips the diagonal 
        Sim[i, j]= simfunction(list_doc[i], list_doc[j])

# Expand the matrix (copy triangle)
tril = np.tril_indices_from(Sim, -1) # take lower & upper triangle's indices
triu = np.triu_indices_from(Sim, 1)  # (without diagonal)
Sim[tril] = Sim[triu]

>假设你真的在范围(0,1)内有相似性将你的相似性矩阵转换成距离矩阵,你可以随便做

dm = 1 – Sim

这个操作将被numpy矢量化

内容总结

以上是互联网集市为您收集整理的python – 使用相似性函数来聚类scikit-learn全部内容，希望文章能够帮你解决python – 使用相似性函数来聚类scikit-learn所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/724301.html

来源：【匿名】

【上一篇】Python：延长列表中的元素【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python – 使用相似性函数来聚类scikit-learn】教程文章相关的互联网学习教程文章

Python函数语法里的中括号和逗号是什么意思【代码】

查阅Python函数用法时，经常会给出这样的示例：Pool([processes[, initializer[, initargs[, maxtasksperchild[, context]]]]])函数里面有中括号和逗号，查阅资料得知：中括号是可选参数，逗号是参数之间的分隔符比如： processes 被中括号扩住，表示使用的工作进程的数量，是一个可选参数，若processes是None，默认适用os.cpu_count()返回的数量后面也可以用逗号分割一个可选参数maxtasksperchildPool(processes=4，maxtasksperc...

Python eval()函数【代码】

本文内容 1、eval()函数介绍 2、eval()应用一、eval()函数介绍eval(source[, globals[, locals]])　　功能：将字符串str当成有效的表达式来求值并返回计算结果　　参数：　　　　source：一个Python表达式或函数compile()返回的代码对象　　　　globals：可选。必须是dictionary　　　　locals：可选。任意map对象二、eval()应用不传入传入globals 、localsdata1 = ‘1‘ ret1 = eval(data1) print(ret1, type(ret1)) ...

spark 常用函数介绍（python）

原文引自：https://www.cnblogs.com/yxpblog/p/5269314.html在开始之前，我先介绍一下，RDD是什么？ RDD是Spark中的抽象数据结构类型，任何数据在Spark中都被表示为RDD。从编程的角度来看，RDD可以简单看成是一个数组。和普通数组的区别是，RDD中的数据是分区存储的，这样不同分区的数据就可以分布在不同的机器上，同时可以被并行处理。因此，Spark应用程序所做的无非是把需要处理的数据转换为RDD，然后对RDD进行一系列的变换...

python接口自动化测试二十：函数写接口测试【代码】【图】

# coding:utf-8import requestsimport refrom bs4 import BeautifulSoup# s = requests.session() # 全局的sdef get_token(s): ‘‘‘ fuction: 获取token args: s 参数 -》s = requests.session() :return anti_token ->{‘X-Anit-Forge-Token‘: ‘xx‘, ‘X-Anit-Forge-Code‘: ‘38515842‘} ‘‘‘ # 局部的s没定义，从外部传入s url = ‘https://passport.lagou.com/login/login.html‘ h1 = { ...

python字符串内置函数【代码】

1、字符串定义：它是一个有序的字符的集合，用于存储和表示基本的文本信息，‘’或“”或‘’‘ ’‘’中间包含的内容称之为字符串特性：1.只能存放一个值2.不可变3.按照从左到右的顺序定义字符集合，下标从0开始顺序访问，有序补充：　　1.字符串的单引号和双引号都无法取消特殊字符的含义，如果想让引号内所有字符均取消特殊意义，在引号前面加r，如name＝r‘l\thf‘　　2.unicode字符串与r连用必需在r前面，如name＝ur‘l\thf‘...

python六十课——高阶函数之map【代码】

1.高阶函数：特点：函数的形参位置必须接受一个函数对象分类学习：1).map(fn,lsd1,[lsd2...])：参数一：fn --> 函数对象参数二：lsd1 --> 序列对象(字符串、列表、range...)功能：将fn函数作用于lsd1中的每一个元素上,将每次执行的结果存入到一个map对象中返回；【注意】得到的这个map对象是一个迭代器对象需求：lt = [‘1‘,‘2‘,‘3‘,‘4‘,‘5‘] --> [1,2,3,4,5]map(int,lt)：执行过程如下：1).lt --> 取出第一个元素：‘1‘...

我是如何开始去了解Python函数式编程--Python函数式编程初涉【代码】【图】

Python函数式编程1. 开始我们会了解什么是函数式编程：函数：function 函数式：functional，一种编程范式函数式编程特点：把计算视为函数而非指令，贴近计算纯函数式编程：不需要变量，没有副作用，测试简单，支持高阶函数，代码简洁Python支持的函数式编程特点：不是纯函数式编程：允许有变量支持高阶函数：函数也可以作为变量传入支持闭包：有了闭包就能返回函数有限度的支持匿名函数2. 高阶函数变量可以指向函数，函数名...

Python封装函数：实现删除一个list里面的重复,且元素顺序要与原list顺序对应【图】

封装函数：实现删除一个list里面的重复,且元素顺序要与原list顺序对应代码：def info(l):l1 = l[:]for i in range(len(l)):v = l.count(l[i])if l1.count(l[i]) > 1:for j in range(1, v):l1.remove(l[i])return l1print(info([1, 2, 3, 4, 2, 3, 6, 2]))思想：统计相同元素出现的次数，然后删除到1原文：http://blog.51cto.com/13241097/2114105

Python写一个批量生成账号的函数【代码】

批量生成账户信息，产生的账户由@sina.com结尾，长度由用户输入，产生多少条也由用户输入，用户名不能重复，用户名必须由大写字母、小写字母和数字组成。 1def Users(num,len): # num产生多少条信息，len账号的长度 2‘‘‘ 3 用交集来判断是否包含大小写字母4 :param num: 生成几条数据5 :param len: 账号的长度6 :return:7‘‘‘ 8 results = [] # 存放结果的数组 9 uppers = set(string.ascii_uppercase) #...

Python学习笔记__2.4章递归函数

# 这是学习廖雪峰老师python教程的学习笔记在函数内部，可以调用其他函数。如果一个函数在内部调用自身本身，这个函数就是递归函数。使用递归函数写一个阶乘函数：def fact(n): if n==1: return 1 return n * fact(n - 1)计算过程：===> fact(5)===>5 * fact(4)===>5 * (4 * fact(3))===>5 * (4 * (3 * fact(2)))===>5 * (4 * (3 * (2 * fact(1))))===>5 * (4 * (3 * (2 * 1)))===>5 * (4 * (3 * 2))===>5 * (4 * ...

流畅的Python第五章，一等函数笔记(未完，准备从一章开始看)。【代码】

Python中又一个名称叫一等对象，满足以下条件的程序实体：1、在运行时创建2、能赋值给变量或数据结构中的元素3、能作为参数传给函数4、能作为函数的返回结果所以Python中，正数、字符串、字典与函数都是一等对象。5.1把函数当做对象:把函数当做对象，通过简单的__doc__可以输出函数的说明。In [55]: def demo(a,b): ...: ‘‘‘返回a,b‘‘‘ ...: return a,b ...: ...

python函数【代码】

collatz序列def collatz(number):if number%2==0:return number//2if number%2==1:return 3*number+1 try: c=input("请输入一个数：")c=int(c) except:print("error!") print(collatz(c)) 原文：https://www.cnblogs.com/hainabaichuan/p/11816251.html

python--004--函数(其他内置函数)【代码】

其它内置函数1）ord() 与chr相反print(chr(97)) print(ord(‘a‘))output： a 972）powprint(pow(3,3)) # 相当于3**3print(pow(3,3,2)) # 相当于3**3%2output： 27 13）repr --打印4）reversed()l = [1,2,3,4] print(list(reversed(l))) print(l) output: [4, 3, 2, 1] [1, 2, 3, 4]5) round()print(round(3.5)) # 四舍五入output： 46）set(‘hello‘) # 集合7) slice（）切片l = ‘hello‘# print(l[3:5]) # 硬编码 ...

Python正则表达式-常用函数的基本使用【代码】

常用函数有re.match()、re.search() 、re.sub()、compile()、findall()、finditer()、split() re.match() 匹配字符串开头，常用来判断数据是否满足我的正则要求。成功返回一个match对象，不成功返回空。>>> import re >>> rc = re.compile(r"www.+") >>> rc.match(‘www.com wxw.cn‘) <re.Match object; span=(0, 14), match=‘www.com wxw.cn‘> >>> rc.match(‘wxw.cn www.com‘) >>> re.search() 匹配整个字符串，判断数据时候...

从函数内函数定义看python的函数实现

一、问题在C/C++中，函数的定义本质上是在编译阶段完成，而函数调用是由链接完成。但是对于python这种语言，函数的定义和调用都是由解释器在运行时完成，或者说，解释器在执行函数定义的时候，同样是生成了虚拟机指令，这个指令通常可以理解为MAKE_FUNCTION这个虚拟机指令，这个指令生成的则是一个PyFunctionObject对象。对应的，在函数调用的时候执行的是CALL_FUNCTION，这个指令需要生成一个PyFrameObject对象。二、CALL_FUNCTIO...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / python – 使用相似性函数来聚类scikit-learn

python – 使用相似性函数来聚类scikit-learn

内容导读

内容图文

内容总结

内容备注

内容手机端

【python – 使用相似性函数来聚类scikit-learn】教程文章相关的互联网学习教程文章

Python函数语法里的中括号和逗号是什么意思【代码】

Python eval()函数【代码】

spark 常用函数介绍（python）

python接口自动化测试二十：函数写接口测试【代码】【图】

python字符串内置函数【代码】

python六十课——高阶函数之map【代码】

我是如何开始去了解Python函数式编程--Python函数式编程初涉【代码】【图】

Python封装函数：实现删除一个list里面的重复,且元素顺序要与原list顺序对应【图】

Python写一个批量生成账号的函数【代码】

Python学习笔记__2.4章递归函数

流畅的Python第五章，一等函数笔记(未完，准备从一章开始看)。【代码】

python函数【代码】

python--004--函数(其他内置函数)【代码】

Python正则表达式-常用函数的基本使用【代码】

从函数内函数定义看python的函数实现

PYTHON - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程