山东大学舆情分析系统算法模块开发日志 2021.04.04
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了山东大学舆情分析系统算法模块开发日志 2021.04.04,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1759字,纯文字阅读大概需要3分钟。
内容图文
![山东大学舆情分析系统算法模块开发日志 2021.04.04](/upload/InfoBanner/zyjiaocheng/595/736c8b801845422699683bdd6bbec2cc.jpg)
算法模块开发日志 2021.04.04
算法模块
- 优化了保留词、停用词、无关词、分词工具的加载方式,分词速度得到提高
- 增加了保留词、无关词词库的内容,使分词结果更加准确
- 增加了如下功能:
- 获取出现频率前十的热词
- 获取某个热词当天及前三十天的热词频度
- 获取某个热词当月及前十二月的热词频度
- 获取某个热词当年及前十年的热词频度
- 获取某个热词数据来源分布等方法
GitHub地址:https://github.com/STK425/Algorithm
系统框架
初步的系统框架设计。
主程序(SDU_POAS.py):
import Crawler_Algorithm as CA
import Web_Monitor as WM
def main():
#CA.Main_Loop()
WM.Web_Listener()
if __name__ == '__main__':
main()
爬虫、算法部分(Crawler_Algorithm.py):
import time
import Database as db
def Main_Loop():
i = int(input())
while i != 0:
res = Web_Crawler()
Algorithm(res)
time.sleep(5)#60 * 60
i = int(input())
#爬虫模块接口
def crawl(url):
print("crawling")
res = []
return res
def Web_Crawler():
url_set = db.get_url()
for item in url_set:
crawl(item)
res = []
return res
#算法模块接口
def Algorithm(data_set):
print("algorithm")
网页监听部分(Web_Monitor.py):
import Crawler_Algorithm as CA
def Get_url():
print("url")
def Login(account, password):
if account == "123" and password == "123":
return True
else:
return False
def Web_Listener():
ac = input("账号:")
pw = input("密码:")
if Login(ac, pw):
print("功能代号:\n0:退出\t11:启动主程序\t2指定url")#关闭程序、管理url、管理热词……
i = int(input("请输入功能代号"))
while i != 0:
if i == 1:
CA.Main_Loop()
elif i == 2:
Get_url()
i = int(input())
else:
print("登录失败")
数据库部分(Database.py):
#import pymysql
def get_url():
return ["https://www.baidu.com"]
def get_user():
print("get_user")
def get_KW():
print("get_KW")
def get_info():
print("get_info")
def set_url():
print("set_url")
def set_user():
print("set_user")
def set_KW():
print("set_KW")
def set_info():
print("set_info")
内容总结
以上是互联网集市为您收集整理的山东大学舆情分析系统算法模块开发日志 2021.04.04全部内容,希望文章能够帮你解决山东大学舆情分析系统算法模块开发日志 2021.04.04所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。