Merge pull request #121 from juliangehring/faster-sort

juliangehring · web-flow · commit 7f5a722904bf · 2021-05-08T10:49:05.000+02:00
Improve sorting in p-values adjustment methods
diff --git a/NEWS.md b/NEWS.md
@@ -4,6 +4,7 @@
 
 ### Changes
 
+- Improve the reordering strategy of p-values in adjustment methods. This change saves one sorting step for all adjustment methods that require sorted p-values. As a result, the performance for these methods is significantly improved.
 - Pin `Documenter` to v0.19 for building of the documentation (#104)
 
 
diff --git a/src/pval-adjustment.jl b/src/pval-adjustment.jl
@@ -153,11 +153,11 @@ function adjust(pValues::PValues{T}, n::Integer, method::BenjaminiHochberg) wher
     if k <= 1
         return pValues
     end
-    sortedOrder, originalOrder = reorder(pValues)
+    sortedOrder = sortperm(pValues)
     pAdjusted = pValues[sortedOrder]
     pAdjusted .*= n ./ (1:k)
     stepup!(pAdjusted)
-    pAdjusted = clamp.(pAdjusted[originalOrder], 0, 1)
+    pAdjusted[sortedOrder] = clamp.(pAdjusted, 0, 1)
     return pAdjusted
 end
 
@@ -262,11 +262,11 @@ function adjust(pValues::PValues{T}, n::Integer, method::BenjaminiYekutieli) whe
     if k <= 1
         return pValues
     end
-    sortedOrder, originalOrder = reorder(pValues)
+    sortedOrder = sortperm(pValues)
     pAdjusted = pValues[sortedOrder]
     pAdjusted .*= harmonic_number(n) .* n ./ (1:k)
     stepup!(pAdjusted)
-    pAdjusted = clamp.(pAdjusted[originalOrder], 0, 1)
+    pAdjusted[sortedOrder] = clamp.(pAdjusted, 0, 1)
     return pAdjusted
 end
 
@@ -315,14 +315,14 @@ function adjust(pValues::PValues{T}, n::Integer, method::BenjaminiLiu) where T <
     if n <= 1
         return pValues
     end
-    sortedOrder, originalOrder = reorder(pValues)
+    sortedOrder = sortperm(pValues)
     pAdjusted = pValues[sortedOrder]
     # a bit more involved because cutoffs at significance α have the form:
     # P_(i) <= 1- [1 - min(1, m/(m-i+1)α)]^{1/(m-i+1)}
     s = n .- (1:k) .+ 1
     pAdjusted = (1 .- (1 .- pAdjusted).^s) .* s ./ n
     stepdown!(pAdjusted)
-    pAdjusted = clamp.(pAdjusted[originalOrder], 0, 1)
+    pAdjusted[sortedOrder] = clamp.(pAdjusted, 0, 1)
     return pAdjusted
 end
 
@@ -370,11 +370,11 @@ function adjust(pValues::PValues{T}, n::Integer, method::Hochberg) where T <: Ab
     if k <= 1
         return pValues
     end
-    sortedOrder, originalOrder = reorder(pValues)
+    sortedOrder = sortperm(pValues)
     pAdjusted = pValues[sortedOrder]
     pAdjusted .*= (n .- (1:k) .+ 1)
     stepup!(pAdjusted)
-    pAdjusted = clamp.(pAdjusted[originalOrder], 0, 1)
+    pAdjusted[sortedOrder] = clamp.(pAdjusted, 0, 1)
     return pAdjusted
 end
 
@@ -422,11 +422,11 @@ function adjust(pValues::PValues{T}, n::Integer, method::Holm) where T <: Abstra
     if n <= 1
         return pValues
     end
-    sortedOrder, originalOrder = reorder(pValues)
+    sortedOrder = sortperm(pValues)
     pAdjusted = pValues[sortedOrder]
     pAdjusted .*= (n .- (1:k) .+ 1)
     stepdown!(pAdjusted)
-    pAdjusted = clamp.(pAdjusted[originalOrder], 0, 1)
+    pAdjusted[sortedOrder] = clamp.(pAdjusted, 0, 1)
     return pAdjusted
 end
 
@@ -474,7 +474,7 @@ function adjust(pValues::PValues{T}, n::Integer, method::Hommel) where T <: Abst
     if k <= 1
         return pValues
     end
-    sortedOrder, originalOrder = reorder(pValues)
+    sortedOrder = sortperm(pValues)
     pAdjusted = vcat(pValues[sortedOrder], fill(one(T), n - k))
     lower = n * minimum(pAdjusted ./ (1:n))
     q = fill(lower, n)
@@ -487,7 +487,9 @@ function adjust(pValues::PValues{T}, n::Integer, method::Hommel) where T <: Abst
         q[idx_right] .= q[n - j + 1]
         pa .= max.(pa, q)
     end
-    pAdjusted = max.(pa[originalOrder], pValues)
+    pa = pa[1:k]
+    pa[sortedOrder] = pa
+    pAdjusted = max.(pa, pValues)
     return pAdjusted
 end
 
@@ -578,12 +580,12 @@ adjust(pValues::PValues{T}, method::ForwardStop) where T <: AbstractFloat = adju
 function adjust(pValues::PValues{T}, n::Integer, method::ForwardStop) where T <: AbstractFloat
     k = length(pValues)
     check_number_tests(k, n)
-    sortedOrder, originalOrder = reorder(pValues)
+    sortedOrder = sortperm(pValues)
     logsums = -cumsum(log.(1 .- pValues[sortedOrder]))
     logsums ./= (1:k)
     stepup!(logsums)
-    pAdjusted = clamp.(logsums[originalOrder], 0, 1)
-    return pAdjusted
+    logsums[sortedOrder] = clamp.(logsums, 0, 1)
+    return logsums
 end
 
 
@@ -628,7 +630,7 @@ function adjust(pValues::PValues{T}, method::BarberCandes) where T <: AbstractFl
         return fill(1 / n, size(pValues))
     end
 
-    sorted_indexes, original_order = reorder(pValues)
+    sorted_indexes = sortperm(pValues)
     estimated_fdrs = pValues[sorted_indexes]
 
     Rt = 1 # current number of discoveries
@@ -655,7 +657,8 @@ function adjust(pValues::PValues{T}, method::BarberCandes) where T <: AbstractFl
     end
 
     stepup!(estimated_fdrs)
-    pAdjusted = clamp.(estimated_fdrs[original_order], 0, 1)
+    pAdjusted = clamp.(estimated_fdrs, 0, 1)
+    pAdjusted[sorted_indexes] = pAdjusted
     return pAdjusted
 end
 
diff --git a/src/utils.jl b/src/utils.jl
@@ -1,12 +1,5 @@
 ## utility functions ##
 
-function reorder(values::AbstractVector{T}) where T <: Real
-    newOrder = sortperm(values)
-    oldOrder = sortperm(newOrder)
-    return newOrder, oldOrder
-end
-
-
 function sort_if_needed(x; kws...)
     if issorted(x; kws...)
         return x
diff --git a/test/test-pval-adjustment.jl b/test/test-pval-adjustment.jl
@@ -137,18 +137,18 @@ using Test
         # inefficient implementation for testing
         function barber_candes_brute_force(pValues::AbstractVector{T}) where T <: AbstractFloat
             n = length(pValues)
-            sorted_indexes, original_order = MultipleTesting.reorder(pValues)
-            sorted_pValues = pValues[sorted_indexes]
+            sorted_indexes = sortperm(pValues)
+            pAdjusted = pValues[sorted_indexes]
             estimated_fdrs = fill(1.0, size(pValues))
-            for (i, pv) in enumerate(sorted_pValues)
+            for (i, pv) in enumerate(pAdjusted)
                 if pv >= 0.5
                     break
                 else
                     estimated_fdrs[i] = (sum((1 .- pValues) .<= pv) + 1) / i
                 end
             end
             MultipleTesting.stepup!(estimated_fdrs)
-            pAdjusted = clamp.(estimated_fdrs[original_order], 0, 1)
+            pAdjusted[sorted_indexes] = clamp.(estimated_fdrs, 0, 1)
             return pAdjusted
         end
 
diff --git a/test/test-utils.jl b/test/test-utils.jl
@@ -43,12 +43,16 @@ using Test
     end
 
 
-    @testset "reorder" begin
+    @testset "sorted and original ordering" begin
 
         x = [1, 5, 4, 2, 4, 3]
-        no, oo = MultipleTesting.reorder(x)
-        @test x[no] == sort(x)
-        @test x[no][oo] == x
+        new_order = sortperm(x)
+        y = x[new_order]
+        z = copy(y)
+        z[new_order] = y
+
+        @test y == sort(x)
+        @test z == x
 
     end
 

Original file line number	Diff line number	Diff line change
`@@ -4,6 +4,7 @@`
`4`	`4`
`5`	`5`	`### Changes`
`6`	`6`
	`7`	`+- Improve the reordering strategy of p-values in adjustment methods. This change saves one sorting step for all adjustment methods that require sorted p-values. As a result, the performance for these methods is significantly improved.`
`7`	`8`	- Pin `Documenter` to v0.19 for building of the documentation (#104)
`8`	`9`
`9`	`10`