Branch data Line data Source code
1 : : /* Platform-independent deterministic sort function.
2 : : Copyright (C) 2018-2025 Free Software Foundation, Inc.
3 : : Contributed by Alexander Monakov.
4 : :
5 : : This file is part of GCC.
6 : :
7 : : GCC is free software; you can redistribute it and/or modify it
8 : : under the terms of the GNU General Public License as published by the
9 : : Free Software Foundation; either version 3, or (at your option) any
10 : : later version.
11 : :
12 : : GCC is distributed in the hope that it will be useful, but WITHOUT
13 : : ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
14 : : FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
15 : : for more details.
16 : :
17 : : You should have received a copy of the GNU General Public License
18 : : along with GCC; see the file COPYING3. If not see
19 : : <http://www.gnu.org/licenses/>. */
20 : :
21 : : /* This implements a sort function suitable for GCC use cases:
22 : : - signature-compatible to C qsort, but relaxed contract:
23 : : - may apply the comparator to elements in a temporary buffer
24 : : - may abort on allocation failure
25 : : - deterministic (but not necessarily stable)
26 : : - fast, especially for common cases (0-5 elements of size 8 or 4)
27 : :
28 : : The implementation uses sorting networks for up to 5 elements and
29 : : a merge sort on top of that. Neither stage has branches depending on
30 : : comparator result, trading extra arithmetic for branch mispredictions. */
31 : :
32 : : #ifdef GENERATOR_FILE
33 : : #include "bconfig.h"
34 : : #else
35 : : #include "config.h"
36 : : #endif
37 : :
38 : : #include "system.h"
39 : :
40 : : #ifdef __GNUC__
41 : : #define noinline __attribute__ ((__noinline__))
42 : : #else
43 : : #define noinline
44 : : #endif
45 : :
46 : : /* C-style qsort comparator function type. */
47 : : typedef int cmp_fn (const void *, const void *);
48 : :
49 : : /* Structure holding read-mostly (read-only in netsort) context. */
50 : : struct sort_ctx
51 : : {
52 : : cmp_fn *cmp; // pointer to comparator
53 : : char *out; // output buffer
54 : : size_t n; // number of elements
55 : : size_t size; // element size
56 : : size_t nlim; // limit for using sorting networks
57 : : };
58 : :
59 : : /* Like sort_ctx, but for use with qsort_r-style comparators. Several
60 : : functions in this file are templates that work with either context type. */
61 : : struct sort_r_ctx
62 : : {
63 : : void *data;
64 : : sort_r_cmp_fn *cmp_;
65 : : char *out;
66 : : size_t n;
67 : : size_t size;
68 : : size_t nlim;
69 : 60246229 : int cmp (const void *a, const void *b)
70 : : {
71 : 20130080 : return cmp_ (a, b, data);
72 : : }
73 : : };
74 : :
75 : : /* Helper for netsort. Permute, possibly in-place, 2 or 3 elements,
76 : : placing E0 to C->OUT, E1 to C->OUT + C->SIZE, and so on. */
77 : : template<typename sort_ctx>
78 : : static void
79 : 168473337 : reorder23 (sort_ctx *c, char *e0, char *e1, char *e2)
80 : : {
81 : : #define REORDER_23(TYPE, STRIDE, OFFSET) \
82 : : do { \
83 : : TYPE t0, t1; \
84 : : memcpy (&t0, e0 + OFFSET, sizeof (TYPE)); \
85 : : memcpy (&t1, e1 + OFFSET, sizeof (TYPE)); \
86 : : char *out = c->out + OFFSET; \
87 : : if (LIKELY (c->n == 3)) \
88 : : memmove (out + 2*STRIDE, e2 + OFFSET, sizeof (TYPE));\
89 : : memcpy (out, &t0, sizeof (TYPE)); out += STRIDE; \
90 : : memcpy (out, &t1, sizeof (TYPE)); \
91 : : } while (0)
92 : :
93 : 168473337 : if (LIKELY (c->size == sizeof (size_t)))
94 : 150925154 : REORDER_23 (size_t, sizeof (size_t), 0);
95 : 17548183 : else if (LIKELY (c->size == sizeof (int)))
96 : 6793549 : REORDER_23 (int, sizeof (int), 0);
97 : : else
98 : : {
99 : : size_t offset = 0, step = sizeof (size_t);
100 : 48101416 : for (; offset + step <= c->size; offset += step)
101 : 37346782 : REORDER_23 (size_t, c->size, offset);
102 : 11923398 : for (; offset < c->size; offset++)
103 : 1168764 : REORDER_23 (char, c->size, offset);
104 : : }
105 : 168473337 : }
106 : :
107 : : /* Like reorder23, but permute 4 or 5 elements. */
108 : : template<typename sort_ctx>
109 : : static void
110 : 155622249 : reorder45 (sort_ctx *c, char *e0, char *e1, char *e2, char *e3, char *e4)
111 : : {
112 : : #define REORDER_45(TYPE, STRIDE, OFFSET) \
113 : : do { \
114 : : TYPE t0, t1, t2, t3; \
115 : : memcpy (&t0, e0 + OFFSET, sizeof (TYPE)); \
116 : : memcpy (&t1, e1 + OFFSET, sizeof (TYPE)); \
117 : : memcpy (&t2, e2 + OFFSET, sizeof (TYPE)); \
118 : : memcpy (&t3, e3 + OFFSET, sizeof (TYPE)); \
119 : : char *out = c->out + OFFSET; \
120 : : if (LIKELY (c->n == 5)) \
121 : : memmove (out + 4*STRIDE, e4 + OFFSET, sizeof (TYPE));\
122 : : memcpy (out, &t0, sizeof (TYPE)); out += STRIDE; \
123 : : memcpy (out, &t1, sizeof (TYPE)); out += STRIDE; \
124 : : memcpy (out, &t2, sizeof (TYPE)); out += STRIDE; \
125 : : memcpy (out, &t3, sizeof (TYPE)); \
126 : : } while (0)
127 : :
128 : 155622249 : if (LIKELY (c->size == sizeof (size_t)))
129 : 143098732 : REORDER_45 (size_t, sizeof (size_t), 0);
130 : 12523517 : else if (LIKELY (c->size == sizeof (int)))
131 : 8442071 : REORDER_45 (int, sizeof (int), 0);
132 : : else
133 : : {
134 : : size_t offset = 0, step = sizeof (size_t);
135 : 18393974 : for (; offset + step <= c->size; offset += step)
136 : 14312528 : REORDER_45 (size_t, c->size, offset);
137 : 4923810 : for (; offset < c->size; offset++)
138 : 842364 : REORDER_45 (char, c->size, offset);
139 : : }
140 : 155622249 : }
141 : :
142 : : /* Helper for netsort. Invoke comparator CMP on E0 and E1.
143 : : Return E0^E1 if E0 compares less than E1, zero otherwise.
144 : : This is noinline to avoid code growth and confine invocation
145 : : to a single call site, assisting indirect branch prediction. */
146 : : template<typename sort_ctx>
147 : : noinline static intptr_t
148 : 1424227222 : cmp1 (char *e0, char *e1, sort_ctx *c)
149 : : {
150 : 1424227222 : intptr_t x = (intptr_t)e0 ^ (intptr_t)e1;
151 : 1424227222 : return x & (c->cmp (e0, e1) >> 31);
152 : : }
153 : :
154 : : /* Apply a sorting network to 2 to 5 elements from IN, placing them into C->OUT.
155 : : IN may be equal to C->OUT, in which case elements are sorted in place. */
156 : : template<typename sort_ctx>
157 : : static void
158 : 324095586 : netsort (char *in, sort_ctx *c)
159 : : {
160 : : #define CMP(e0, e1) \
161 : : do { \
162 : : intptr_t x = cmp1 (e1, e0, c); \
163 : : e0 = (char *)((intptr_t)e0 ^ x); \
164 : : e1 = (char *)((intptr_t)e1 ^ x); \
165 : : } while (0)
166 : :
167 : 324095586 : char *e0 = in, *e1 = e0 + c->size, *e2 = e1 + c->size;
168 : 324095586 : CMP (e0, e1);
169 : 324095586 : if (LIKELY (c->n == 3))
170 : : {
171 : 127997676 : CMP (e1, e2);
172 : 127997676 : CMP (e0, e1);
173 : : }
174 : 324095586 : if (c->n <= 3)
175 : 168473337 : return reorder23 (c, e0, e1, e2);
176 : 155622249 : char *e3 = e2 + c->size, *e4 = e3 + c->size;
177 : 155622249 : if (LIKELY (c->n == 5))
178 : : {
179 : 55411822 : CMP (e3, e4);
180 : 55411822 : CMP (e2, e4);
181 : : }
182 : 155622249 : CMP (e2, e3);
183 : 155622249 : if (LIKELY (c->n == 5))
184 : : {
185 : 55411822 : CMP (e0, e3);
186 : 55411822 : CMP (e1, e4);
187 : : }
188 : 155622249 : CMP (e0, e2);
189 : 155622249 : CMP (e1, e3);
190 : 155622249 : CMP (e1, e2);
191 : 155622249 : reorder45 (c, e0, e1, e2, e3, e4);
192 : : }
193 : :
194 : : /* Execute merge sort on N elements from IN, placing them into OUT,
195 : : using TMP as temporary storage if IN is equal to OUT.
196 : : This is a stable sort if netsort is used only for 2 or 3 elements. */
197 : : template<typename sort_ctx>
198 : : static void
199 : 498421862 : mergesort (char *in, sort_ctx *c, size_t n, char *out, char *tmp)
200 : : {
201 : 498421862 : if (LIKELY (n <= c->nlim))
202 : : {
203 : 324095586 : c->out = out;
204 : 324095586 : c->n = n;
205 : 324095586 : return netsort (in, c);
206 : : }
207 : 174326276 : size_t nl = n / 2, nr = n - nl, sz = nl * c->size;
208 : 174326276 : char *mid = in + sz, *r = out + sz, *l = in == out ? tmp : in;
209 : : /* Sort the right half, outputting to right half of OUT. */
210 : 174326276 : mergesort (mid, c, nr, r, tmp);
211 : : /* Sort the left half, leaving left half of OUT free. */
212 : 174326276 : mergesort (in, c, nl, l, mid);
213 : : /* Merge sorted halves given by L, R to [OUT, END). */
214 : : #define MERGE_ELTSIZE(SIZE) \
215 : : do { \
216 : : intptr_t mr = c->cmp (r, l) >> 31; \
217 : : intptr_t lr = (intptr_t)l ^ (intptr_t)r; \
218 : : lr = (intptr_t)l ^ (lr & mr); \
219 : : out = (char *)memcpy (out, (char *)lr, SIZE); \
220 : : out += SIZE; \
221 : : r += mr & SIZE; \
222 : : if (r == out) return; \
223 : : l += ~mr & SIZE; \
224 : : } while (r != end)
225 : :
226 : 174326276 : if (LIKELY (c->cmp (r, l + (r - out) - c->size) < 0))
227 : : {
228 : 117188079 : char *end = out + n * c->size;
229 : 117188079 : if (sizeof (size_t) == 8 && LIKELY (c->size == 8))
230 : 2070564574 : MERGE_ELTSIZE (8);
231 : 9257657 : else if (LIKELY (c->size == 4))
232 : 123372625 : MERGE_ELTSIZE (4);
233 : : else
234 : 60083813 : MERGE_ELTSIZE (c->size);
235 : : }
236 : 109328258 : memcpy (out, l, r - out);
237 : : }
238 : :
239 : : #if CHECKING_P
240 : : /* Don't complain about cast from void* to function pointer. */
241 : : #pragma GCC diagnostic push
242 : : #pragma GCC diagnostic ignored "-Wconditionally-supported"
243 : :
244 : : /* Adapter for using two-argument comparators in functions expecting the
245 : : three-argument sort_r_cmp_fn type. */
246 : : static int
247 : 23378294763 : cmp2to3 (const void *a, const void *b, void *c)
248 : : {
249 : 23378294763 : return ((cmp_fn *)c) (a, b);
250 : : }
251 : : #endif
252 : :
253 : : /* Replacement for C qsort. */
254 : : void
255 : 168622455 : gcc_qsort (void *vbase, size_t n, size_t size, cmp_fn *cmp)
256 : : {
257 : 168622455 : if (n < 2)
258 : 25128908 : return;
259 : 143493547 : size_t nlim = 5;
260 : 143493547 : bool stable = (ssize_t) size < 0;
261 : 143493547 : if (stable)
262 : 33128 : nlim = 3, size = ~size;
263 : 143493547 : char *base = (char *)vbase;
264 : 143493547 : sort_ctx c = {cmp, base, n, size, nlim};
265 : 143493547 : long long scratch[32];
266 : 143493547 : size_t bufsz = (n / 2) * size;
267 : 143493547 : void *buf = bufsz <= sizeof scratch ? scratch : xmalloc (bufsz);
268 : 143493547 : mergesort (base, &c, n, base, (char *)buf);
269 : 143493547 : if (buf != scratch)
270 : 1695454 : free (buf);
271 : : #if CHECKING_P
272 : 143493547 : qsort_chk (vbase, n, size, cmp2to3, (void*)cmp);
273 : 143493547 : #pragma GCC diagnostic pop
274 : : #endif
275 : : }
276 : :
277 : : /* Substitute for Glibc qsort_r. */
278 : : void
279 : 8926369 : gcc_sort_r (void *vbase, size_t n, size_t size, sort_r_cmp_fn *cmp, void *data)
280 : : {
281 : 8926369 : if (n < 2)
282 : 2650606 : return;
283 : 6275763 : size_t nlim = 5;
284 : 6275763 : bool stable = (ssize_t) size < 0;
285 : 6275763 : if (stable)
286 : 6552 : nlim = 3, size = ~size;
287 : 6275763 : char *base = (char *)vbase;
288 : 6275763 : sort_r_ctx c = {data, cmp, base, n, size, nlim};
289 : 6275763 : long long scratch[32];
290 : 6275763 : size_t bufsz = (n / 2) * size;
291 : 6275763 : void *buf = bufsz <= sizeof scratch ? scratch : xmalloc (bufsz);
292 : 6275763 : mergesort (base, &c, n, base, (char *)buf);
293 : 6275763 : if (buf != scratch)
294 : 16466 : free (buf);
295 : : #if CHECKING_P
296 : 6275763 : qsort_chk (vbase, n, size, cmp, data);
297 : : #endif
298 : : }
299 : :
300 : : /* Stable sort, signature-compatible to C qsort. */
301 : : void
302 : 35185 : gcc_stablesort (void *vbase, size_t n, size_t size, cmp_fn *cmp)
303 : : {
304 : 35185 : gcc_qsort (vbase, n, ~size, cmp);
305 : 35185 : }
306 : :
307 : : /* Stable sort, signature-compatible to Glibc qsort_r. */
308 : : void
309 : 6552 : gcc_stablesort_r (void *vbase, size_t n, size_t size, sort_r_cmp_fn *cmp,
310 : : void *data)
311 : : {
312 : 6552 : gcc_sort_r (vbase, n, ~size, cmp, data);
313 : 6552 : }
|