首页 / POSTGRCSQL / 我应该在PostgreSQL中为ACIDity做数学吗？

我应该在PostgreSQL中为ACIDity做数学吗？

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了我应该在PostgreSQL中为ACIDity做数学吗？，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含5621字，纯文字阅读大概需要9分钟。

内容图文

这是我关于数据库管理堆栈交换的第一个问题.如果不是很好的方式,请善待..

我想知道我正在处理我的数据库的方式,以便尽可能地将其作为ACID.

我正在使用Flask Framework(Python)和PostgreSQL(9.4)数据库处理Web应用程序.我使用SQLAlchemy作为ORM.

我正在对我的对冲基金处理的股票进行财务分析.
我的工作分为3部分：

>每天更新数据库
>做动物数学
>寻找最好的结果
>在网络应用上展示结果

这是我的数据库：

安全表(活动列仅表示是否应更新库存)：

 id |   ticker       | active 
----+----------------+--------
  1 | 3993 HK Equity | t      
  2 | A2A IM Equity  | t      
  3 | AA UN Equity   | f      
  4 | AA/ LN Equity  | f      
  5 | AAL LN Equity  | t      
  6 | AALB NA Equity | t

估价表

 security_id |    date    | px_close |  px_open |  px_high |  px_low | volume 
-------------+------------+----------+----------+----------+---------+--------
          42 | 2012-11-06 |   44.757 |   45.099 |   45.336 |  43.918 | 157295 
          42 | 2012-11-07 |   45.099 |   44.791 |   45.099 |  44.226 | 162671 
          42 | 2012-11-08 |   44.245 |   45.051 |    45.08 |  44.241 |  56763 
          42 | 2012-11-09 |   43.994 |   44.307 |   44.672 |  43.771 | 123424 
          43 | 2012-11-06 |  143.994 |  144.255 |  144.601 | 143.785 |  54598 
          43 | 2012-11-07 |  143.885 |  143.629 |  144.108 | 143.524 |  39380 
          43 | 2012-11-08 |  144.392 |  144.056 |  144.928 | 143.866 |  60509 
          43 | 2012-11-09 |  144.008 |  144.563 |   144.61 | 143.913 |  62784

回归表(我有很多其他类似这样的表,例如polynomial_regression,learning_clustering,multiple_regression等,但它是用于示例)：

 security_id | driver_id | security_field | driver_field | lag |     percentile   |      percentage    |      1w_change     |        r2
-------------+-----------+----------------+--------------+-----+------------------+--------------------+--------------------+-------------------
       10260 |       622 | px_open        | px_low       |   0 | 2.39085239085239 |  0.233283156908672 |  -1.65479076267458 |  0.76137019793836
       10260 |       622 | px_open        | best_eps     |   0 | 25.8333333333333 |  0.070876900435926 |   4.62480252764613 | 0.593456515505473
       10260 |       622 | px_high        | px_close     |   0 | 2.18295218295218 |  0.211301222947739 |  -7.67181960128018 | 0.756561105159073
       10260 |       622 | px_high        | px_open      |   0 | 3.01455301455301 |  0.173091398167856 |  -2.06843453731421 | 0.755248026072118
       10260 |       622 | px_high        | px_high      |   0 |  2.5987525987526 |  0.189682461742673 |  -10.5755212601686 | 0.748422363395702
       10260 |       622 | px_high        | px_low       |   0 |  2.5987525987526 |  0.206663840524837 |  -3.72904823112292 | 0.758691421914131
       10260 |       622 | px_high        | best_eps     |   0 | 26.7857142857143 | 0.0642618785351929 |  0.600880162491535 | 0.586932757156747
       10260 |       622 | px_low         | px_close     |   0 | 2.18295218295218 |  0.241074941757577 |  -3.72991088758724 | 0.758602680862882
       10260 |       622 | px_low         | px_open      |   0 | 3.01455301455301 |  0.193588738372212 | -0.616152379637857 | 0.753488068588711
       10260 |       622 | px_low         | px_high      |   0 | 2.80665280665281 |   0.21139288442443 |  -4.97343018089906 | 0.743185969928886

在数据库上完成的主要操作是通过Flask应用程序完成的,但并非总是如此.这就是为什么我希望我的数据库尽可能“强大”(我的意思是ACID).更重要的是,我显然更信任Flask的Postgres.

每天凌晨3点更新我的数据库.插入前一天的新值,并且从时间开始(和其他股票,例如刚刚分红后的股票等)更新新的活跃股票.

然后,2小时后,更新完成后,Flask脚本将成对计算所有新回归,并插入结果.
问题是在更新值和更新回归之间,数据库不处于“稳定”状态：已插入新值,但尚未存在相应的回归.

您是否认为我应该将我的所有数学分析从Python翻译成SQL,并创建触发器,只要插入新值,就会启动它？

>我的问题是,与其他语言相比,我在处理统计数据和数学时不知道SQL的’速度’.我知道基本函数(相关性,R ^ 2,…)已经在SQL中实现了,但是我使用了更多’高级'(我的意思是’复杂’这里……)函数(即使我还没有表示它)这里).
>如果您认为这不是一个好主意,您是否可以使用其他技巧来强调数据库的“良好行为”,尽管使用外部工具作为Python应用程序？

非常感谢你的建议,
爱德华

解决方法:

欢迎来到DBA Stack Exchange！

My problem is that I don’t know the ‘speed’ of SQL when it deals with
stats and maths, compared to other language. I know that basic
functions (correlation, R^2, …) are already implemented in SQL, but
I am using far more ‘advanced’ (I mean ‘complex’ here..) functions
(even if I have not represented it here).

根据经验,对于大型数据集(数百万行)的基本聚合(分组,连接,求和),SQL的性能会更好.我建议你在这里利用SQL的优势使用混合方法.尽可能使用基本聚合准备数据,但将更高级别的数学和分析逻辑留在Python中.

Would you think I should translate all my mathematical analysis from
Python to SQL, and create Triggers launching it whenever a new value
is inserted?

没有.

如前所述,您可以执行基本的聚合函数,但我希望您会发现这很乏味,如果不是完全不可能将更复杂的统计函数从Python等功能丰富的语言建模为SQL等约束语言.这是一个探索这个概念的decent article.即使我们成功地将Python函数转换为SQL,我们的成功也将高度依赖于数据库是否经过优化以提供插入时这些计算所需的所有数据输入的基于集合的表示.

The thing is that between the update of the values, and the update of
the regressions, the database is not in a ‘stable’ state: new values
have been inserted, but the corresponding regressions doesn’t exist
yet.

让我们确定我们不会以潜在的性能成本,以及与增加的代码复杂性相关的可靠成本,以教条的方式推广数据库ACIDity.我理解ACIDity的重要性,但从你的描述来看,这听起来像是一个分析工作流程.我们有一个3AM的批量数据加载,随后在SQL之外进行分析,然后重新插入数据库.

总结一下..YEs,SQL在大型数据集的基本聚合上表现更好,但更高级别的统计分析最好留给Python.我不确定为了ACIDity而将Python函数转换为SQL触发器的风险是值得的.

附：我知道这是对你的问题的迟到答案,所以让我们知道你最终决定实施的是什么！

内容总结

以上是互联网集市为您收集整理的我应该在PostgreSQL中为ACIDity做数学吗？全部内容，希望文章能够帮你解决我应该在PostgreSQL中为ACIDity做数学吗？所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/896019.html

来源：【匿名】

【上一篇】postgresql – 将函数参数添加到SQL查询WHERE子句中【下一篇】PDO扩展连接PostgreSQL对象关系数据库步骤详解

更多 ►

【我应该在PostgreSQL中为ACIDity做数学吗？】教程文章相关的互联网学习教程文章

PostgreSQL代码分析，查询优化部分，pull_ands()和pull_ors()【图】

PostgreSQL代码分析，查询优化部分。这里把规范谓词表达式的部分就整理完了，阅读的顺序例如以下：一、PostgreSQL代码分析，查询优化部分，canonicalize_qual二、PostgreSQL代码分析，查询优化部分，pull_ands()和pull_ors()三、PostgreSQL代码分析，查询优化部分，process_duplicate_ors*************************************************************************************************************************************...

科学地增加postgresql最大连接数【代码】

PG配置文件路径/etc/postgresql/9.3/main/postgresql.conf首先如何查看最大连接数This SQL will help youselect max_conn,used,res_for_super,max_conn-used-res_for_super res_for_normal from (select count(*) used from pg_stat_activity) t1,(select setting::int res_for_super from pg_settings where name=$$superuser_reserved_connections$$) t2,(select setting::int max_conn from pg_settings where name=$$max_conn...

postgresql 10 安装【代码】【图】

windows 安装第一步：下载https://www.enterprisedb.com/download-postgresql-binaries将解压后的文件去掉一层放入 E:\Program Files，程序目录为 E:\Program Files\pgsql第二步：解压压缩包，配置环境变量新建数据目录 E:\postgresql\11\pgsql\data （这是数据库的数据存储文件夹）在 E:\Program Files\pgsql 新建一个名为env.vbs的文件on error resume next set sysenv=CreateObject("WScript.Shell").Environment("system")...

PostgreSQL统计每天的记录数量,没有记录就为0或返回null【代码】【图】

1. 需求统计下面事件类型的数量，没有此类型没有数据的返回为null，前端显示为0，请写出PostgreSQL的sql SQL语句是：select t.event_code as eventCode,t.event_name as eventName,s.eventNum from event_type t LEFTJOIN (select s.parent_codeas eventCode,count(id) as eventNumfrom article s where1=1groupby s.parent_code orderby eventNum desc) s on s.eventCode=t.event_code where t.parent_code=‘0‘显示结果：...

PostgreSQL学习手册(目录)

原文地址：http://www.cnblogs.com/stephen-liu74/archive/2012/06/08/2315679.html 事实上之前有很长一段时间都在纠结是否有必要好好学习它，但是始终都没有一个很好的理由说服自己。甚至是直到这个项目最终决定选用PostgreSQL时，我都没有真正意识到学习它的价值，当时只是想反正和其它数据库差不多，能用就行了。然而有一天晚上，自己也不知道为什么，躺在床上开始回想整个项目的实施过程，想着想着就想到了数据库选型这一问...

PostgreSQL备机checkpoint【代码】

数据库异常关闭时，数据库关闭时来不及或者没机会做checkpoint，则需要从上一个一致性检查的开始恢复。 ? ? PostgreSQL备机checkpoint是不能产生checkpoint WAL的，因为如果写这样类型的checkpoint的话，就会将接收的WAL打乱，那么日志将混乱，回放会出问题。? ? 那么问题来了，备机支持checkpoint吗？他的checkpoint怎么做的？? ? PostgreSQL为了缩短恢复时间，备机上也支持checkpoint，即CreateRestartPoint。但是其pg_control文...

构建基于CentOS 7.6 的PostgreSQL 11.6 镜像【代码】

案例说明： 1）CentOS 7.6的基础镜像上创建PostgreSQL 11.6镜像。2）创建PostgreSQL 11.6 镜像的Dockerfile。3）下载PostgreSQL 11.6的源码包和Dockerfile存放在相同的目录下 1、启动docker服务[root@node1 soft]# systemctl start docker[root@node1 soft]# systemctl status docker ● docker.service - Docker Application Container EngineLoaded: loaded (/usr/lib/systemd/system/docker.service; disabled; vendor pr...

PostgreSQL服务端监听设置及client连接方法

背景介绍： PostgreSQL服务端执行在RedHat Linux上,IP为：192.168.230.128 client安装在Windows XP上， IP为：192.168.230.1配置方法： 1. 改动服务端/opt/postgresql/data/postgresql.conf文件,将#listen_address=‘localhost‘改成listen_address=‘*‘ 2. 改动/opt/postgresql/data/gp_hba.conf文件在当中添加client的ip，例如以下,注意最后一行：# TYPE DATABASE USER CIDR-ADDRESS METHOD# "local" i...

java web中向postgreSQL插入当前时间【代码】

方式1 常用插入方式Timestamp currentTime= new Timestamp(System.currentTimeMillis()); String sql = "INSERTINTO message(date_create) VALUES (" + "‘" + currentTime + "‘" + ");";方式2 使用占位符Timestamp currentTime= new Timestamp(System.currentTimeMillis()); String sql = "INSERTINTO message( date_create) VALUES (?);"; PreparedStatement pst = conn.prepareStatement(sql,Statement.RETURN_GENERATE...

PostgreSQL 9.5.4数据库快速INSERT大量数据研究【代码】

PostgreSQL 9.5.4数据库快速INSERT大量数据研究背景在一些应用场景中，需要向Abase数据库中快速装入大量的数据，比如数据库迁移，SQL日志分析等。在PG上快速插入数据有几种方案，每种方案的效率怎么样？如何调优能加快的数据装载？场景设定SQL日志分析是一个采集JDBC日志、分析SQL、发送分析结果工具。在分析阶段，需要解析大量的JDBC日志，并把解析后的结构化结果装入数据库供后续处理。以分析阶段为实验场景，以解析JDBC日志(多个...

PostgreSQL Replication之第三章理解即时恢复（2）

3.2 归档事务日志看过图片之后，我们可以看看如何使这些东西进入工作状态。当谈到及时归档时，您需要做的第一件事是归档XLOG。PostgreSQL通过postgresql.conf提供了所有与归档相关的选项。让我们一步一步地看，要启动归档需要在postgresql.conf中做什么：1. 首先，您应该把archive_mode设置为 on。2. 第二步，您应该配置您的归档命令。归档命令是一个简单的带有两个参数的shell命令：1. %p: 这是一个表示应该被归档的的XLOG的占位符...

linux postgresql 离线安装记录

由于服务器无法连接外网，通过yum指令来安装PostgreSQL的可能性是零，所以需要离线安装操作。下载离线 rpm 包：https://yum.postgresql.org/rpmchart/由于几个rpm彼此之间的依赖关系，所以我安装的先后顺序是：rpm -ivh example.rpm1. postgresql11-libs-11.8-1PGDG.rhel7.x86_64.rpm2. postgresql11-11.8-1PGDG.rhel7.x86_64.rpm3. postgresql11-server-11.8-1PGDG.rhel7.x86_64.rpm4. postgresql11-contrib-11.8-1PGDG.rhel7.x86...

PostgreSQL编译安装【代码】

获取源码略编译安装对于性能型的软件，我们采用编译的方式进行安装。安装依赖yum install -y systemtap-sdt-devel perl-ExtUtils-Embed pam-devel libxml2-devel libxslt-devel python-devel编译./configure --prefix=/opt/pgsql-9.3.2 --with-perl --with-python --with-openssl --with-pam --without-ldap --with-libxml --with-libxslt --enable-thread-safety --with-wal-blocksize=16 --with-blocksize=16 --enable-dtrace -...

PostgreSQL之Buffer Cache【代码】【图】

缓冲区高速缓存（Buffer Cache）位于服务器的共享内存中，并且所有进程均可访问。在读取或更新数据时，进程将页面读入缓存。当页面位于缓存中时，我们在RAM中使用它并保存数据到磁盘。当一个进程需要读取一个页面时，它首先尝试通过哈希表在Buffer Cache中找到它，如果在Buffer Cache中找不到所需的页面。在这种情况下，需要将页面从磁盘读取到某个缓冲区中。 PostgreSQL有一个扩展，使我们能够查看缓冲区高速缓存的内部。安装扩...

postgresql数据迁移

postgresql从库故障准备新库1，创建用户[root@localhost home]# userdel postgres[root@localhost home]# groupdel postgresmkdir /home/mydbchown -R postgres:postgres /home/mydb2，解压安装包[root@localhost home]## tar -xvf postgres/postgresql-8.1.4.tarcd postgres/postgresql-8.1.4编译安装： ./configure --prefix=/usr/local/pgsql -localstatedir=/home/mydb $ ./configure --prefix=/usr/local/pgsql --with-pgco...

首页 / POSTGRCSQL / 我应该在PostgreSQL中为ACIDity做数学吗？

我应该在PostgreSQL中为ACIDity做数学吗？

内容导读

内容图文

内容总结

内容备注

内容手机端

【我应该在PostgreSQL中为ACIDity做数学吗？】教程文章相关的互联网学习教程文章

POSTGRESQL - 相关标签

POSTGRCSQL - 技术教程分类

POSTGRCSQL - 最新教程

POSTGRCSQL - 最热教程