AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 133138
Accepted
kafe
kafe
Asked: 2016-03-24 04:36:26 +0800 CST2016-03-24 04:36:26 +0800 CST 2016-03-24 04:36:26 +0800 CST

T-SQL 中的 Theil-Sen 估计函数

  • 772

有没有人有用 T-SQL 编写的Theil-Sen 回归函数?

我找到了一个用 Perl 编写的,但我无法将其重新编码为 SQL。

sql-server functions
  • 3 3 个回答
  • 293 Views

3 个回答

  • Voted
  1. Best Answer
    kafe
    2016-04-12T03:54:31+08:002016-04-12T03:54:31+08:00

    当我说我无法将其重新编码为 SQL 时,我是在撒谎。我只是太懒了。这是带有使用示例的代码。

    该代码基于TheiSen perl 库,使用QuickMedian。让我们定义一个新的表类型,以便轻松地将我们的数据传递给过程。

    CREATE TYPE dbo.TheilSenInputDataTableType AS TABLE 
    (
        ID INT IDENTITY(1,1),
        x REAL, 
        y REAL
    )
    

    请注意 ID 列,这在这里很重要,因为我们的解决方案使用 CROSS APPLY 语句来正确解释 TheilSen.pm 中的内部循环。

    my ($x1,$x2,$y1,$y2);
    foreach my $i(0 .. $n-2){
        $y1 = $y->[$i];
        $x1 = $x->[$i];
        foreach my $j($i+1 .. $n-1){
            $y2 = $y->[$j];
            $x2 = $x->[$j];
    

    我们还需要一种新的数据类型来存储实型值数组。

    CREATE TYPE [dbo].[RealArray] AS TABLE(
        [val] [real] NULL
    )
    

    这是f_QuickMedian函数,返回给定数组的中值。这归功于 Itzik Ben-Gan。

    CREATE FUNCTION [dbo].[f_QuickMedian](@RealArray RealArray READONLY)
    RETURNS REAL
    AS
    BEGIN
        DECLARE @Median REAL;
        DECLARE @QMedian REAL;
    
        SELECT @Median = AVG(1.0 * val)
        FROM
        (
            SELECT o.val, rn = ROW_NUMBER() OVER (ORDER BY o.val), c.c
            FROM @RealArray AS o
            CROSS JOIN (SELECT c = COUNT(*) FROM @RealArray) AS c
        ) AS x
        WHERE rn IN ((c + 1)/2, (c + 2)/2);
    
        SELECT TOP 1 @QMedian = val FROM @RealArray
        ORDER BY ABS(val - @Median) ASC, val DESC
    
        RETURN @QMedian
    END
    

    和p_TheilSen估计器:

    CREATE PROCEDURE [dbo].[p_TheilSen](
          @TheilSenInput TheilSenInputDataTableType READONLY
        , @m Real OUTPUT
        , @c Real OUTPUT
    )
    AS
    BEGIN
        DECLARE 
            @m_arr RealArray
          , @c_arr RealArray;       
    
        INSERT INTO @m_arr
            SELECT m
            FROM 
            (
                SELECT  
                    t1.x as x1
                    , t1.y as y1
                    , t2o.x as x2
                    , t2o.y as y2
                    , t2o.y-t1.y as [y2 - y1]
                    , t2o.x-t1.x as [x2 - x1]
                    , CASE WHEN (t2o.x <> t1.x) THEN  CAST((t2o.y-t1.y) AS Real)/(t2o.x-t1.x) ELSE NULL END AS [($y2-$y1)/($x2-$x1)]
                    , CASE WHEN t1.y = t2o.y THEN 0
                      ELSE
                        CASE WHEN t1.x = t2o.x THEN NULL
                            ELSE 
                            -- push @M, ($y2-$y1)/($x2-$x1);
                            CAST((t2o.y-t1.y) AS Real)/(t2o.x-t1.x)
                        END
                      END as m
                FROM @TheilSenInput t1
                CROSS APPLY
                        (
                        SELECT  t2.x, t2.y
                        FROM    @TheilSenInput t2
                        WHERE   t2.ID > t1.ID
                         ) t2o
            ) t
            WHERE m IS NOT NULL 
    
        SELECT @m = dbo.f_QuickMedian(@m_arr)
    
        INSERT INTO @c_arr
            SELECT y - (@m * x)
                FROM @TheilSenInput
    
        SELECT @c = dbo.f_QuickMedian(@c_arr)
    
    END
    

    例子:

    DECLARE 
          @in TheilSenInputDataTableType
        , @m Real
        , @c Real
    
    INSERT INTO @in(x,y) VALUES (10.79,118.99)
    INSERT INTO @in(x,y) VALUES (10.8,120.76)
    INSERT INTO @in(x,y) VALUES (10.86,122.71)
    INSERT INTO @in(x,y) VALUES (10.93,125.48)
    INSERT INTO @in(x,y) VALUES (10.99,127.31)
    INSERT INTO @in(x,y) VALUES (10.96,130.06)
    INSERT INTO @in(x,y) VALUES (10.98,132.41)
    INSERT INTO @in(x,y) VALUES (11.03,135.89)
    INSERT INTO @in(x,y) VALUES (11.08,139.02)
    INSERT INTO @in(x,y) VALUES (11.1,140.25)
    INSERT INTO @in(x,y) VALUES (11.19,145.61)
    INSERT INTO @in(x,y) VALUES (11.25,153.45)
    INSERT INTO @in(x,y) VALUES (11.4,158.03)
    INSERT INTO @in(x,y) VALUES (11.61,162.72)
    INSERT INTO @in(x,y) VALUES (11.69,167.67)
    INSERT INTO @in(x,y) VALUES (11.91,172.86)
    INSERT INTO @in(x,y) VALUES (12.07,177.52)
    INSERT INTO @in(x,y) VALUES (12.32,182.09)
    
    
    EXEC p_TheilSen @in, @m = @m OUTPUT, @c = @c OUTPUT
    
    SELECT @m
    SELECT @c
    

    退货:

    m = 52.7079
    c = -448.4853
    

    只是为了比较,perl 版本为同一数据集返回以下值:

    m = 52.7078651685394
    c = -448.484943820225
    

    我使用 TheilSen 估算器来计算文件系统的 DaysToFill 指标。享受!

    • 9
  2. Vérace
    2016-03-24T06:46:13+08:002016-03-24T06:46:13+08:00

    我还检查了一般的 T-SQL、Oracle 和服务器(太复杂,无法用纯 SQL 编写)。

    但是,您可能对此感兴趣(Python 的科学/统计包)。该算法也在那里和 Python 中实现。与 Perl 不同,Python 是一种人类至少有一定机会能够理解的语言。

    你的问题引起了我的兴趣,我四处寻找。有包含此算法的 C 和 C++ 库 - 它也可以在一些 R 包中使用。@srutzky 的帖子看起来也很有趣。

    +1 一个有趣的问题 BTW - 欢迎来到论坛 :-)

    • 1
  3. Solomon Rutzky
    2016-03-24T08:10:14+08:002016-03-24T08:10:14+08:00

    这很可能非常适合在 SQLCLR 中执行某些操作,类似于以下问题/答案(也在 DBA.SE 上):

    是否有最长公共子串问题的 SQL Server 实现?

    等我以后有空的时候,我会看看这有多可行。

    • 1

相关问题

  • SQL Server - 使用聚集索引时如何存储数据页

  • 我需要为每种类型的查询使用单独的索引,还是一个多列索引可以工作?

  • 什么时候应该使用唯一约束而不是唯一索引?

  • 死锁的主要原因是什么,可以预防吗?

  • 如何确定是否需要或需要索引

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve