java – Liferay门户网站中的文档处理
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了java – Liferay门户网站中的文档处理,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1577字,纯文字阅读大概需要3分钟。
内容图文
过去两年我一直在使用Liferay,但我从未需要任何广泛的文档管理.
现在我有一个用户上传文档的portlet(MS office OLE2文档,ODS文档,PDF等),我必须使用所有可用的元数据来保存它们.
我知道如果不使用Liferay我会如何做到这一点,我可能会使用Apache解决方案与Apache Tika(UpdateRichDocuments和ExtractingRequestHandler)或Apache Jackrabbit一起使用Apache Tika(org.apache.jackrabbit.extractor.*).
问题是,如果我查看Liferay的主干,有一些关键类:
从DLLocalServiceImpl直接使用的Hooks(JCRHook,FileSystemHook,CMISHook,s3Hook)直接
另一个替代方案是使用DLAppLocalServiceImpl,它使用DLRepositoryLocalServiceImpl,文件也通过Hooks持久存储到存储库中,但是在那里完成了很多其他工作.
> Liferay中没有jackrabbit-text-extractors库,所以我想如果我想从PDF,DOC,ODS文档中提取元数据,我会很难…因为DL服务层不接受额外的性能
>我想我必须避免使用DL服务和JCR钩子并直接访问Jackrabbit ……但是我会失去兼容性并且可能会迁移我的存储库等.
可以请任何人合作这个吗?谢谢
解决方法:
SOLR用于索引,Jackrabbit用于文档存储.在代码中管理Liferay文档库非常简单,只需查看DL * LocalServiceUtil类,即DLFolderLocalServiceUtil和DLFileLocalServiceUtil.默认情况下,Liferay只是在硬盘驱动器上创建一个匹配的文件夹/文件结构(名称已更改),因此您只需要编写代码或使用Jackrabbit,因为Liferay允许启动/下载和查看开箱即用通过控制面板和各种portlet.
我没有将LifeRabbit与Liferay一起使用,但是一旦配置好,所有内容都应该在封面下进行管理,你不必在前端担心它.
当你说“所有元数据都可用”时,我不确定保留什么,但除了重命名文件以便跟踪它之外,不应该有任何其他更改.通过上传每种类型的文件并检查LIFERAY / data / document_library目录和子目录中的条目,可以快速轻松地进行测试.如果使用Jackrabbit,这将是不同的.
内容总结
以上是互联网集市为您收集整理的java – Liferay门户网站中的文档处理全部内容,希望文章能够帮你解决java – Liferay门户网站中的文档处理所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。