高效的算法来计算排序数组的绝对绝对和的中位数

用户名

我试图想出一个快速算法计算量b[i]= med |y_i+y_j|, 1<=j!=i<=n时,y_1,...,y_n已经排序(所以b[]是相同长度的向量y[])。我将假设的所有元素y[]都是唯一的,并且n是偶数。

因此,下面的代码计算的b[i]naive(O(n**2))方式:(为了方便起见,我在R中编写了此代码,但我与语言无关)

n<-30
a_fast<-b_slow<-rep(NA,n)
y<-sort(rnorm(n,100,1))
z<-y
for(i in 1:n){
    b_slow[i]<-median(abs(y[-i]+y[i]))
}   

我在下面有一个临时的提议,建议在中进行O(n)但是,仅当y[]包含正数时,它才有效

我的问题是:当同时y[]包含正数和负数时,如何更改快速算法以使其也起作用这有可能吗?

编辑:

和(暂定)O(n)方式下面的代码(为方便起见,我在R中编写了此代码,但是我与语言无关)

tryA<-floor(1+(n-1)/2+1)
tryB<-floor(1+(n-1)/2)
medA<-y[tryA]
medB<-y[tryB]
for(i in 1:(tryA-1)){
        a_fast[i]<-medA+y[i]
}
for(i in tryA:n){
        a_fast[i]<-medB+y[i]
}

简单的例子:

简单的说明性示例。如果我们有一个长度为4的向量

-3, -1, 2, 4

然后,例如对于i = 1,这3个绝对成对和为

  4 1 1

他们的中位数是1。

然后,例如对于i = 2,这3个绝对成对和为

  4 1 3

他们的中位数是3。

这是一个更长的正负两个例子y[]

 -1.27 -0.69 -0.56 -0.45 -0.23  0.07  0.13  0.46  1.56  1.72

这是我的新方法b_slow[](这是地面数值,以幼稚的方式计算):

1.20 0.92 1.00 1.01 0.79 0.53 0.56 0.53 1.33 1.49

但是现在,我的新产品a_fast[]不再匹配:

 -1.20 -0.62 -0.49 -0.38 -0.16 -0.16 -0.10  0.23  1.33  1.49

编辑:

这是我对弗朗西斯解决方案的实现(到目前为止,我们有两个排序数组,其中位数很容易计算)。我在R中这样做是为了保持问题的实质。

但是,我似乎缺少索引的校正因子(下面的代码中的ww),因此下面的代码有时会有点偏离。这是因为在上面的定义中,我们计算了n-1个观测值(i!= j)的中位数。

 n<-100
 y<-rnorm(n)
 y<-sort(y)

 b<-rep(NA,n)
 #Naive --O(n**2)-- approch:
 for(i in 1:n){
     b[i]<-median(abs(y[-i]+y[i]))
 }

 k<-rep(NA,n)
 i<-1
 k[i]<-min(na.omit(c(which(y+y[i]>0)[1],n))) #binary search: O(log(n)) -- 
 for(i in 2:n){                  #O(n)
     k_prov<-k[i-1]
     while(y[k_prov]+y[i]>0 && k_prov>0)     k_prov<-k_prov-1
     k[i]<-max(k_prov+1,1)
     #for(i in 1:n){ should give the same result.
     #   k[i]<-which(y+y[i]>0)[1]
     #}
 }

 i<-sample(1:n,1)
 x1<--y[1:(k[i]-1)]-y[i]
 x2<-y[i]+y[n:k[i]]
 x3<-c(x1,x2)
 plot(x3)
 ww<-ifelse(i<k[i] & i>n/2,n/2+1,n/2)
 sort(x3)[ww]  #this can be computed efficiently: O(log(n))
 b[i]          #this is the O(n**2) result.
弗朗西斯

这是O(Nxln(N)xln(N))解决方案:

对于我来说:

1)找到项目k,例如j<k <=> y[j]+y[i]<0(二分法,O(ln(N)))

k分隔两个排序的列表:一个在-y [i]上方,另一个在-y [i]下方,应将其符号更改为abs(y [i] + y [j])。现在,我们正在寻找这些列表的中位数。

从这里开始,这只是找到重复n次的两个排序列表的中位数的问题

2)让我们选择这些列表中的最大值(M = abs(y [1] -y [i])或M = abs(y [size] -y [i]))和最小值(m在k左右),然后重新启动二分法(O(ln(N))。让我们开始选择中间(M + m)/ 2 ...在任何阶段,让我们选择中间...

3)这种二分法的阶段:第一个列表中有多少项y [j] + y [i]高于(M + m)/ 2?再次二分法... O(ln(N))。在第二个列表中,有多少项-y [j] -y [i]高于(M + m)/ 2?你猜怎么了 ?二分法...将这两个数字相加。如果大于(size-1)/ 2,则m =(M + m)/ 2。否则,M =(M + m)/ 2。

4)如果m = M停止! b[i]=m;

我想有人会提供更好的解决方案...

编辑:我应该感谢@ user189035他链接到O(ln(n + m))算法来计算两个排序列表的中位数。如何在两个排序数组的并集中找到第k个最小元素?

再见

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

高效的算法来计算排序数组的pariwise绝对和的中位数

来自分类Dev

了解两个排序数组中位数的算法

来自分类Dev

如何计算未排序数据集的中位数

来自分类Dev

寻找对确定排序数组中位数的过程的改进

来自分类Dev

两个等长排序数组的中位数

来自分类Dev

Pyspark-使用groupby计算中位数绝对百分比误差

来自分类Dev

查找两个排序数组的中位数的时间复杂度

来自分类Dev

使用二分搜索定理的两个排序数组的中位数

来自分类Dev

两个排序数组的中位数:终止条件失败

来自分类Dev

算法约简(中位数,快速排序)

来自分类Dev

快速排序算法-中位数三

来自分类Dev

添加每行具有中位数绝对偏差(MAD)的列

来自分类Dev

使用选择排序查找数组的中位数

来自分类Dev

使用中位数对数组进行排序

来自分类Dev

查找两个排序数组的中位数。可以消除一些不平等检查吗?

来自分类Dev

中位数算法中常数5来自何处?

来自分类Dev

未排序数组中的算法比较

来自分类Dev

如何仅考虑特定行来计算分组的中位数

来自分类Dev

我可以优化`caret`中的中位数相对绝对误差吗?

来自分类Dev

排序数组和对象

来自分类Dev

分组和排序数组

来自分类Dev

排序数组和哈希

来自分类Dev

搜索和排序数组

来自分类Dev

填充和排序数组

来自分类Dev

按行的中位数对2D numpy数组排序

来自分类Dev

使用STL算法计算绝对值的总和

来自分类Dev

查找数组的中位数

来自分类Dev

查找数组的中位数

来自分类Dev

2 d数组中的双中位数计算