首页 / JAVA / java – Stanford NLP – 处理文件列表时OpenIE内存不足

java – Stanford NLP – 处理文件列表时OpenIE内存不足

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了java – Stanford NLP – 处理文件列表时OpenIE内存不足，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3670字，纯文字阅读大概需要6分钟。

内容图文

我正在尝试使用Stanford CoreNLP中的OpenIE工具从多个文件中提取信息,当几个文件传递给输入时,它会产生内存不足错误,而不是只传递一个.

All files have been queued; awaiting termination...
java.lang.OutOfMemoryError: GC overhead limit exceeded
at edu.stanford.nlp.graph.DirectedMultiGraph.outgoingEdgeIterator(DirectedMultiGraph.java:508)
at edu.stanford.nlp.semgraph.SemanticGraph.outgoingEdgeIterator(SemanticGraph.java:165)
at edu.stanford.nlp.semgraph.semgrex.GraphRelation$GOVERNER$1.advance(GraphRelation.java:267)
at edu.stanford.nlp.semgraph.semgrex.GraphRelation$SearchNodeIterator.initialize(GraphRelation.java:1102)
at edu.stanford.nlp.semgraph.semgrex.GraphRelation$SearchNodeIterator.<init>(GraphRelation.java:1083)
at edu.stanford.nlp.semgraph.semgrex.GraphRelation$GOVERNER$1.<init>(GraphRelation.java:257)
at edu.stanford.nlp.semgraph.semgrex.GraphRelation$GOVERNER.searchNodeIterator(GraphRelation.java:257)
at edu.stanford.nlp.semgraph.semgrex.NodePattern$NodeMatcher.resetChildIter(NodePattern.java:320)
at edu.stanford.nlp.semgraph.semgrex.CoordinationPattern$CoordinationMatcher.matches(CoordinationPattern.java:211)
at edu.stanford.nlp.semgraph.semgrex.NodePattern$NodeMatcher.matchChild(NodePattern.java:514)
at edu.stanford.nlp.semgraph.semgrex.NodePattern$NodeMatcher.matches(NodePattern.java:542)
at edu.stanford.nlp.naturalli.RelationTripleSegmenter.segmentVerb(RelationTripleSegmenter.java:541)
at edu.stanford.nlp.naturalli.RelationTripleSegmenter.segment(RelationTripleSegmenter.java:850)
at edu.stanford.nlp.naturalli.OpenIE.relationInFragment(OpenIE.java:354)
at edu.stanford.nlp.naturalli.OpenIE.lambda$relationsInFragments$2(OpenIE.java:366)
at edu.stanford.nlp.naturalli.OpenIE$$Lambda$76/1438896944.apply(Unknown Source)
at java.util.stream.ReferencePipeline$3$1.accept(ReferencePipeline.java:193)
at java.util.HashMap$KeySpliterator.forEachRemaining(HashMap.java:1540)
at java.util.stream.AbstractPipeline.copyInto(AbstractPipeline.java:481)
at java.util.stream.AbstractPipeline.wrapAndCopyInto(AbstractPipeline.java:471)
at java.util.stream.ReduceOps$ReduceOp.evaluateSequential(ReduceOps.java:708)
at java.util.stream.AbstractPipeline.evaluate(AbstractPipeline.java:234)
at java.util.stream.ReferencePipeline.collect(ReferencePipeline.java:499)
at edu.stanford.nlp.naturalli.OpenIE.relationsInFragments(OpenIE.java:366)
at edu.stanford.nlp.naturalli.OpenIE.annotateSentence(OpenIE.java:486)
at edu.stanford.nlp.naturalli.OpenIE.lambda$annotate$3(OpenIE.java:554)
at edu.stanford.nlp.naturalli.OpenIE$$Lambda$25/606198361.accept(Unknown Source)
at java.util.ArrayList.forEach(ArrayList.java:1249)
at edu.stanford.nlp.naturalli.OpenIE.annotate(OpenIE.java:554)
at edu.stanford.nlp.pipeline.AnnotationPipeline.annotate(AnnotationPipeline.java:71)
at edu.stanford.nlp.pipeline.StanfordCoreNLP.annotate(StanfordCoreNLP.java:499)
at edu.stanford.nlp.naturalli.OpenIE.processDocument(OpenIE.java:630)
DONE processing files. 1 exceptions encountered.

我使用此调用通过输入传递文件：

java -mx3g -cp stanford-corenlp-3.6.0.jar:stanford-corenlp-3.6.0-models.jar:CoreNLP-to-HTML.xsl:slf4j-api.jar:slf4j-simple.jar edu.stanford.nlp.naturalli.OpenIE file1 file2 file3 etc.

我尝试使用-mx3g和其他变体来增加内存,虽然处理文件的数量增加,但并不多(例如从5到7).每个文件都是正确处理的,所以我排除了一个带有大句子或多行的文件.

有没有我不考虑的选项,一些OpenIE或Java标志,我可以用来强制转储到输出的每个文件之间的输出,清理或垃圾收集？

先感谢您

解决方法:

从上面的评论：我怀疑这是一个太多并行和内存太少的问题. OpenIE有点内存不足,尤其是长句,因此并行运行多个文件会占用相当多的内存.

一个简单的解决方法是通过设置-threads 1标志来强制程序运行单线程.如果可能的话,增加内存也应该有所帮助.

内容总结

以上是互联网集市为您收集整理的java – Stanford NLP – 处理文件列表时OpenIE内存不足全部内容，希望文章能够帮你解决java – Stanford NLP – 处理文件列表时OpenIE内存不足所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/955060.html

来源：【匿名】

【上一篇】java不能在linux下工作.为什么？【下一篇】JAVA/JSP学习系列之五

更多 ►

【java – Stanford NLP – 处理文件列表时OpenIE内存不足】教程文章相关的互联网学习教程文章

java虚拟机：JVM内存模型【图】

一、JVM内存模型图解JVM 运行时数据区 (JVM Runtime Area) 其实就是指 JVM 在运行期间，其对JVM内存空间的划分和分配。网上找到两幅图如下所示（个人认为第二个图Native Method Stack应该画在Java Thead模块中）：二、各数据区域介绍1、栈区栈分为java虚拟机栈和本地方法栈重点是Java虚拟机栈，它是线程私有的，生命周期与线程相同。每个方法执行都会创建一个栈帧，用于存放局部变量表，操作栈，动态链接，方法出口等。每个方法...

java内存分配

关于Java内存分配，很多问题都模模糊糊，不能全面贯通理解。今查阅资料，欲求深入挖掘，彻底理清java内存分配脉络，只因水平有限，没达到预期效果，仅以此文对所研究到之处作以记录，为以后学习提供参考，避免重头再来。一、Java内存分配1、 Java有几种存储区域？* 寄存器 -- 在CPU内部，开发人员不能通过代码来控制寄存器的分配，由编译器来管理* 栈 -- 在Windows下, 栈是向低地址扩展的数据结构，是一块连续的内存的区域...

JAVA中栈内存和堆内存

Java把内存划分成两种：一种是栈内存，一种是堆内存。在函数中定义的一些基本类型的变量和对象的引用变量都在函数的栈内存中分配。当在一段代码块定义一个变量时，Java就在栈中为这个变量分配内存空间，当超过变量的作用域后，Java会自动释放掉为该变量所分配的内存空间，该内存空间可以立即被另作他用。堆内存用来存放由new创建的对象和数组。在堆中分配的内存，由Java虚拟机的自动垃圾回收器来管理。在堆中产...

java中String内存的分配（转自：http://jingyan.baidu.com/article/8275fc869a070346a03cf6f4.html）【图】

物理的内存是线性结构，并不存在拥有不同功能的不同区域。编译器（或者JVM)为了更高效地处理数据，会用不同的算法把内存分为各种区域，不同的区域拥有各自的特性，Java中，内存可以分为栈，堆，静态域和常量池等。（可能有不同的叫法，但逻辑是一致的）2不同内存区域的功能和特点：栈区：存放局部变量（变量名，对象的引用等）特点：内存随着函数的调用而开辟，随着函数调用结束而释放。堆区：存放对象（也就是new出来的东西）特点...

三种初始化和java内存的简单分析【代码】

简单说明一下java的内存分析堆：存放new的对象和数组；包括其中的值可以被所有的线程共享，不会被别的对象引用栈：存放基本变量类型引用对象的变量（会存放这个引用在堆里面的具体地址）静态初始化：//静态初始化 : 声明创建+赋值int[] nums = {1,2,3,4,5,6,80,90,100};System.out.println(nums[8]); 动态初始化：//动态初始化 : 包含默认初始化int[] a = new int[10];a[0] = 100;a[1] = 100;?System.out.println(a[1]);System.o...

java虚拟机之内存模型

1. 概述对于从事 C、C++ 程序开发的人员来说，在内存管理领域，他们既是拥有最高权力的「皇帝」又是从事基础工作的「劳动人民」 --- 既拥有每个对象的「所有权」，又担负着每一个对象生命开始到终结的维护责任。但是对于 java 程序员来说，在虚拟机自动内存管理机制的帮助下，不需要再为每一个 new 操作写配对的 delete/free 代码，不容易出现在内存泄漏和内存溢出问题，由虚拟机管理内存这一切看起来都很美好。不过，也正是因为 j...

如何设置Java虚拟机内存以适应大程序的装载【代码】【图】

Java虚拟机对于运行时的程序所占内存是有限制的，当我们的项目或者程序很大时，往往会照成内存溢出。举个例子：publicclass SmallTest1 {publicstaticvoid main(String[] args) {byte[] array = newbyte[1024*1024*500];}}当定义这样一个500MB的数组时，就会造成JVM内存溢出：而Java虚拟机默认的程序运行能得到的内存大小是随系统的，由Java的api体系结构中，点击Java：后找到 “-Xmxn”这一项：所以默认大小是根据系统设置的，那...

JAVA - 技术教程分类

Java 教程 Java 简介 Java 开发环境配置 Java 基础语法 Java 对象和类 Java 基本数据类型 Java 变量类型 Java 修饰符 Java 运算符 Java 循环结构 Java 条件语句 Java switch case Java Number & Math 类 Java Character 类 Java String 类 Java StringBuffer Java 数组 Java 日期时间 Java 方法 Java Stream、File、IO Java Scanner 类 Java 异常处理 Java 继承 Java Override/Overload Java 多态 Java 抽象类 Java 封装 Java 接口 Java 枚举 Java 包(package) Java 数据结构 Java 集合框架 Java ArrayList Java LinkedList Java HashSet Java HashMap Java Iterator Java Object Java 泛型 Java 序列化 Java 网络编程 Java 多线程编程 Java Applet 基础 Java 文档注释 Java 实例 Java 8 新特性 Java MySQL 连接 Java 9 新特性 Java 测验 java 全部

JAVA - 最热教程

Java在运行项目时候，点击右键的弹框，...nacos配置中心超时问题：java.net.Conn...Java的设计模式（7）— 生产者-消费者模...基于DOM4j和POI实现的XML文件转换为XLS...如何在Java中创建一些变量类型别名使用java8的Stream统计字符串数组中每一...idea插件篇之java内存分析工具(JProfil...cannot cast 'java.lang.Integer' to '...java – Bootstrap.properties中Spring...Java8利用stream流实现数字排序和中文排...

首页 / JAVA / java – Stanford NLP – 处理文件列表时OpenIE内存不足

java – Stanford NLP – 处理文件列表时OpenIE内存不足

内容导读

内容图文

内容总结

内容备注

内容手机端

【java – Stanford NLP – 处理文件列表时OpenIE内存不足】教程文章相关的互联网学习教程文章

java虚拟机：JVM内存模型【图】

java内存分配

JAVA中栈内存和堆内存

java中String内存的分配（转自：http://jingyan.baidu.com/article/8275fc869a070346a03cf6f4.html）【图】

三种初始化和java内存的简单分析【代码】

java虚拟机之内存模型

如何设置Java虚拟机内存以适应大程序的装载【代码】【图】

JavaScript垃圾回收（一）——内存分配【代码】

Java内存区域【图】

JAVA 垃圾收集器与内存分配策略【图】

Java内存模型（JMM）中的happens-before【代码】【图】

Java原理领悟-JMM（java内存模型认知）【代码】

Java数组在内存中是如何存放的【代码】【图】

【转】深入理解Java内存模型（六）——final【代码】

Java中内存泄露及垃圾回收机制

JAVA - 相关标签

IE - 相关标签

内存 - 相关标签

JAVA - 技术教程分类

JAVA - 最新教程

JAVA - 最热教程