Branch data Line data Source code
1 : : /* Assign reload pseudos.
2 : : Copyright (C) 2010-2024 Free Software Foundation, Inc.
3 : : Contributed by Vladimir Makarov <vmakarov@redhat.com>.
4 : :
5 : : This file is part of GCC.
6 : :
7 : : GCC is free software; you can redistribute it and/or modify it under
8 : : the terms of the GNU General Public License as published by the Free
9 : : Software Foundation; either version 3, or (at your option) any later
10 : : version.
11 : :
12 : : GCC is distributed in the hope that it will be useful, but WITHOUT ANY
13 : : WARRANTY; without even the implied warranty of MERCHANTABILITY or
14 : : FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
15 : : for more details.
16 : :
17 : : You should have received a copy of the GNU General Public License
18 : : along with GCC; see the file COPYING3. If not see
19 : : <http://www.gnu.org/licenses/>. */
20 : :
21 : :
22 : : /* This file's main objective is to assign hard registers to reload
23 : : pseudos. It also tries to allocate hard registers to other
24 : : pseudos, but at a lower priority than the reload pseudos. The pass
25 : : does not transform the RTL.
26 : :
27 : : We must allocate a hard register to every reload pseudo. We try to
28 : : increase the chances of finding a viable allocation by assigning
29 : : the pseudos in order of fewest available hard registers first. If
30 : : we still fail to find a hard register, we spill other (non-reload)
31 : : pseudos in order to make room.
32 : :
33 : : find_hard_regno_for finds hard registers for allocation without
34 : : spilling. spill_for does the same with spilling. Both functions
35 : : use a cost model to determine the most profitable choice of hard
36 : : and spill registers.
37 : :
38 : : Once we have finished allocating reload pseudos, we also try to
39 : : assign registers to other (non-reload) pseudos. This is useful if
40 : : hard registers were freed up by the spilling just described.
41 : :
42 : : We try to assign hard registers by collecting pseudos into threads.
43 : : These threads contain reload and inheritance pseudos that are
44 : : connected by copies (move insns). Doing this improves the chances
45 : : of pseudos in the thread getting the same hard register and, as a
46 : : result, of allowing some move insns to be deleted.
47 : :
48 : : When we assign a hard register to a pseudo, we decrease the cost of
49 : : using the same hard register for pseudos that are connected by
50 : : copies.
51 : :
52 : : If two hard registers have the same frequency-derived cost, we
53 : : prefer hard registers with higher priorities. The mapping of
54 : : registers to priorities is controlled by the register_priority
55 : : target hook. For example, x86-64 has a few register priorities:
56 : : hard registers with and without REX prefixes have different
57 : : priorities. This permits us to generate smaller code as insns
58 : : without REX prefixes are shorter.
59 : :
60 : : If a few hard registers are still equally good for the assignment,
61 : : we choose the least used hard register. It is called leveling and
62 : : may be profitable for some targets.
63 : :
64 : : Only insns with changed allocation pseudos are processed on the
65 : : next constraint pass.
66 : :
67 : : The pseudo live-ranges are used to find conflicting pseudos.
68 : :
69 : : For understanding the code, it is important to keep in mind that
70 : : inheritance, split, and reload pseudos created since last
71 : : constraint pass have regno >= lra_constraint_new_regno_start.
72 : : Inheritance and split pseudos created on any pass are in the
73 : : corresponding bitmaps. Inheritance and split pseudos since the
74 : : last constraint pass have also the corresponding non-negative
75 : : restore_regno. */
76 : :
77 : : #include "config.h"
78 : : #include "system.h"
79 : : #include "coretypes.h"
80 : : #include "backend.h"
81 : : #include "target.h"
82 : : #include "rtl.h"
83 : : #include "tree.h"
84 : : #include "predict.h"
85 : : #include "df.h"
86 : : #include "memmodel.h"
87 : : #include "tm_p.h"
88 : : #include "insn-config.h"
89 : : #include "regs.h"
90 : : #include "ira.h"
91 : : #include "recog.h"
92 : : #include "rtl-error.h"
93 : : #include "sparseset.h"
94 : : #include "lra.h"
95 : : #include "lra-int.h"
96 : : #include "function-abi.h"
97 : :
98 : : /* Current iteration number of the pass and current iteration number
99 : : of the pass after the latest spill pass when any former reload
100 : : pseudo was spilled. */
101 : : int lra_assignment_iter;
102 : : int lra_assignment_iter_after_spill;
103 : :
104 : : /* Flag of spilling former reload pseudos on this pass. */
105 : : static bool former_reload_pseudo_spill_p;
106 : :
107 : : /* Array containing corresponding values of function
108 : : lra_get_allocno_class. It is used to speed up the code. */
109 : : static enum reg_class *regno_allocno_class_array;
110 : :
111 : : /* Array containing lengths of pseudo live ranges. It is used to
112 : : speed up the code. */
113 : : static int *regno_live_length;
114 : :
115 : : /* Information about the thread to which a pseudo belongs. Threads are
116 : : a set of connected reload and inheritance pseudos with the same set of
117 : : available hard registers. Lone registers belong to their own threads. */
118 : : struct regno_assign_info
119 : : {
120 : : /* First/next pseudo of the same thread. */
121 : : int first, next;
122 : : /* Frequency of the thread (execution frequency of only reload
123 : : pseudos in the thread when the thread contains a reload pseudo).
124 : : Defined only for the first thread pseudo. */
125 : : int freq;
126 : : };
127 : :
128 : : /* Map regno to the corresponding regno assignment info. */
129 : : static struct regno_assign_info *regno_assign_info;
130 : :
131 : : /* All inherited, subreg or optional pseudos created before last spill
132 : : sub-pass. Such pseudos are permitted to get memory instead of hard
133 : : regs. */
134 : : static bitmap_head non_reload_pseudos;
135 : :
136 : : /* Process a pseudo copy with execution frequency COPY_FREQ connecting
137 : : REGNO1 and REGNO2 to form threads. */
138 : : static void
139 : 1629986 : process_copy_to_form_thread (int regno1, int regno2, int copy_freq)
140 : : {
141 : 1629986 : int last, regno1_first, regno2_first;
142 : :
143 : 1629986 : lra_assert (regno1 >= lra_constraint_new_regno_start
144 : : && regno2 >= lra_constraint_new_regno_start);
145 : 1629986 : regno1_first = regno_assign_info[regno1].first;
146 : 1629986 : regno2_first = regno_assign_info[regno2].first;
147 : 1629986 : if (regno1_first != regno2_first)
148 : : {
149 : 2720581 : for (last = regno2_first;
150 : 4350567 : regno_assign_info[last].next >= 0;
151 : 2720581 : last = regno_assign_info[last].next)
152 : 2720581 : regno_assign_info[last].first = regno1_first;
153 : 1629986 : regno_assign_info[last].first = regno1_first;
154 : 1629986 : regno_assign_info[last].next = regno_assign_info[regno1_first].next;
155 : 1629986 : regno_assign_info[regno1_first].next = regno2_first;
156 : 1629986 : regno_assign_info[regno1_first].freq
157 : 1629986 : += regno_assign_info[regno2_first].freq;
158 : : }
159 : 1629986 : regno_assign_info[regno1_first].freq -= 2 * copy_freq;
160 : 1629986 : lra_assert (regno_assign_info[regno1_first].freq >= 0);
161 : 1629986 : }
162 : :
163 : : /* Initialize REGNO_ASSIGN_INFO and form threads. */
164 : : static void
165 : 1483830 : init_regno_assign_info (void)
166 : : {
167 : 1483830 : int i, regno1, regno2, max_regno = max_reg_num ();
168 : 1483830 : lra_copy_t cp;
169 : :
170 : 1483830 : regno_assign_info = XNEWVEC (struct regno_assign_info, max_regno);
171 : 96023157 : for (i = FIRST_PSEUDO_REGISTER; i < max_regno; i++)
172 : : {
173 : 94539327 : regno_assign_info[i].first = i;
174 : 94539327 : regno_assign_info[i].next = -1;
175 : 94539327 : regno_assign_info[i].freq = lra_reg_info[i].freq;
176 : : }
177 : : /* Form the threads. */
178 : 4331735 : for (i = 0; (cp = lra_get_copy (i)) != NULL; i++)
179 : 2847905 : if ((regno1 = cp->regno1) >= lra_constraint_new_regno_start
180 : 2847905 : && (regno2 = cp->regno2) >= lra_constraint_new_regno_start
181 : 2847905 : && reg_renumber[regno1] < 0 && lra_reg_info[regno1].nrefs != 0
182 : 1663125 : && reg_renumber[regno2] < 0 && lra_reg_info[regno2].nrefs != 0
183 : 2847905 : && (ira_class_hard_regs_num[regno_allocno_class_array[regno1]]
184 : 1662735 : == ira_class_hard_regs_num[regno_allocno_class_array[regno2]]))
185 : 1629986 : process_copy_to_form_thread (regno1, regno2, cp->freq);
186 : 1483830 : }
187 : :
188 : : /* Free REGNO_ASSIGN_INFO. */
189 : : static void
190 : 1483830 : finish_regno_assign_info (void)
191 : : {
192 : 1483830 : free (regno_assign_info);
193 : 0 : }
194 : :
195 : : /* The function is used to sort *reload* and *inheritance* pseudos to
196 : : try to assign them hard registers. We put pseudos from the same
197 : : thread always nearby. */
198 : : static int
199 : 249471868 : reload_pseudo_compare_func (const void *v1p, const void *v2p)
200 : : {
201 : 249471868 : int r1 = *(const int *) v1p, r2 = *(const int *) v2p;
202 : 249471868 : enum reg_class cl1 = regno_allocno_class_array[r1];
203 : 249471868 : enum reg_class cl2 = regno_allocno_class_array[r2];
204 : 249471868 : int diff;
205 : :
206 : 249471868 : lra_assert (r1 >= lra_constraint_new_regno_start
207 : : && r2 >= lra_constraint_new_regno_start);
208 : :
209 : : /* Prefer to assign reload registers with smaller classes first to
210 : : guarantee assignment to all reload registers. */
211 : 249471868 : if ((diff = (ira_class_hard_regs_num[cl1]
212 : 249471868 : - ira_class_hard_regs_num[cl2])) != 0)
213 : : return diff;
214 : : /* Allocate bigger pseudos first to avoid register file
215 : : fragmentation. */
216 : 233953113 : if ((diff
217 : 233953113 : = (ira_reg_class_max_nregs[cl2][lra_reg_info[r2].biggest_mode]
218 : 233953113 : - ira_reg_class_max_nregs[cl1][lra_reg_info[r1].biggest_mode])) != 0)
219 : : return diff;
220 : 231856649 : if ((diff = (regno_assign_info[regno_assign_info[r2].first].freq
221 : 231856649 : - regno_assign_info[regno_assign_info[r1].first].freq)) != 0)
222 : : return diff;
223 : : /* Put pseudos from the thread nearby. */
224 : 131863721 : if ((diff = regno_assign_info[r1].first - regno_assign_info[r2].first) != 0)
225 : : return diff;
226 : : /* Prefer pseudos with longer live ranges. It sets up better
227 : : prefered hard registers for the thread pseudos and decreases
228 : : register-register moves between the thread pseudos. */
229 : 18618504 : if ((diff = regno_live_length[r2] - regno_live_length[r1]) != 0)
230 : : return diff;
231 : : /* If regs are equally good, sort by their numbers, so that the
232 : : results of qsort leave nothing to chance. */
233 : 8947498 : return r1 - r2;
234 : : }
235 : :
236 : : /* The function is used to sort *non-reload* pseudos to try to assign
237 : : them hard registers. The order calculation is simpler than in the
238 : : previous function and based on the pseudo frequency usage. */
239 : : static int
240 : 1048259427 : pseudo_compare_func (const void *v1p, const void *v2p)
241 : : {
242 : 1048259427 : int r1 = *(const int *) v1p, r2 = *(const int *) v2p;
243 : 1048259427 : int diff;
244 : :
245 : : /* Assign hard reg to static chain pointer first pseudo when
246 : : non-local goto is used. */
247 : 1048259427 : if ((diff = (non_spilled_static_chain_regno_p (r2)
248 : 1048259427 : - non_spilled_static_chain_regno_p (r1))) != 0)
249 : : return diff;
250 : :
251 : : /* Prefer to assign more frequently used registers first. */
252 : 1048255265 : if ((diff = lra_reg_info[r2].freq - lra_reg_info[r1].freq) != 0)
253 : : return diff;
254 : :
255 : : /* If regs are equally good, sort by their numbers, so that the
256 : : results of qsort leave nothing to chance. */
257 : 633587787 : return r1 - r2;
258 : : }
259 : :
260 : : /* Arrays of size LRA_LIVE_MAX_POINT mapping a program point to the
261 : : pseudo live ranges with given start point. We insert only live
262 : : ranges of pseudos interesting for assignment purposes. They are
263 : : reload pseudos and pseudos assigned to hard registers. */
264 : : static lra_live_range_t *start_point_ranges;
265 : :
266 : : /* Used as a flag that a live range is not inserted in the start point
267 : : chain. */
268 : : static struct lra_live_range not_in_chain_mark;
269 : :
270 : : /* Create and set up START_POINT_RANGES. */
271 : : static void
272 : 1483830 : create_live_range_start_chains (void)
273 : : {
274 : 1483830 : int i, max_regno;
275 : 1483830 : lra_live_range_t r;
276 : :
277 : 1483830 : start_point_ranges = XCNEWVEC (lra_live_range_t, lra_live_max_point);
278 : 1483830 : max_regno = max_reg_num ();
279 : 97506987 : for (i = FIRST_PSEUDO_REGISTER; i < max_regno; i++)
280 : 94539327 : if (i >= lra_constraint_new_regno_start || reg_renumber[i] >= 0)
281 : : {
282 : 101275681 : for (r = lra_reg_info[i].live_ranges; r != NULL; r = r->next)
283 : : {
284 : 54031906 : r->start_next = start_point_ranges[r->start];
285 : 54031906 : start_point_ranges[r->start] = r;
286 : : }
287 : : }
288 : : else
289 : : {
290 : 50066635 : for (r = lra_reg_info[i].live_ranges; r != NULL; r = r->next)
291 : 2771083 : r->start_next = ¬_in_chain_mark;
292 : : }
293 : 1483830 : }
294 : :
295 : : /* Insert live ranges of pseudo REGNO into start chains if they are
296 : : not there yet. */
297 : : static void
298 : 461048181 : insert_in_live_range_start_chain (int regno)
299 : : {
300 : 461048181 : lra_live_range_t r = lra_reg_info[regno].live_ranges;
301 : :
302 : 461048181 : if (r->start_next != ¬_in_chain_mark)
303 : : return;
304 : 394574 : for (; r != NULL; r = r->next)
305 : : {
306 : 252093 : r->start_next = start_point_ranges[r->start];
307 : 252093 : start_point_ranges[r->start] = r;
308 : : }
309 : : }
310 : :
311 : : /* Free START_POINT_RANGES. */
312 : : static void
313 : 1483830 : finish_live_range_start_chains (void)
314 : : {
315 : 1483830 : gcc_assert (start_point_ranges != NULL);
316 : 1483830 : free (start_point_ranges);
317 : 1483830 : start_point_ranges = NULL;
318 : 1483830 : }
319 : :
320 : : /* Map: program point -> bitmap of all pseudos living at the point and
321 : : assigned to hard registers. */
322 : : static bitmap_head *live_hard_reg_pseudos;
323 : : static bitmap_obstack live_hard_reg_pseudos_bitmap_obstack;
324 : :
325 : : /* reg_renumber corresponding to pseudos marked in
326 : : live_hard_reg_pseudos. reg_renumber might be not matched to
327 : : live_hard_reg_pseudos but live_pseudos_reg_renumber always reflects
328 : : live_hard_reg_pseudos. */
329 : : static int *live_pseudos_reg_renumber;
330 : :
331 : : /* Sparseset used to calculate living hard reg pseudos for some program
332 : : point range. */
333 : : static sparseset live_range_hard_reg_pseudos;
334 : :
335 : : /* Sparseset used to calculate living reload/inheritance pseudos for
336 : : some program point range. */
337 : : static sparseset live_range_reload_inheritance_pseudos;
338 : :
339 : : /* Allocate and initialize the data about living pseudos at program
340 : : points. */
341 : : static void
342 : 1483830 : init_lives (void)
343 : : {
344 : 1483830 : int i, max_regno = max_reg_num ();
345 : :
346 : 1483830 : live_range_hard_reg_pseudos = sparseset_alloc (max_regno);
347 : 1483830 : live_range_reload_inheritance_pseudos = sparseset_alloc (max_regno);
348 : 1483830 : live_hard_reg_pseudos = XNEWVEC (bitmap_head, lra_live_max_point);
349 : 1483830 : bitmap_obstack_initialize (&live_hard_reg_pseudos_bitmap_obstack);
350 : 86047452 : for (i = 0; i < lra_live_max_point; i++)
351 : 83079792 : bitmap_initialize (&live_hard_reg_pseudos[i],
352 : : &live_hard_reg_pseudos_bitmap_obstack);
353 : 1483830 : live_pseudos_reg_renumber = XNEWVEC (int, max_regno);
354 : 232535517 : for (i = 0; i < max_regno; i++)
355 : 231051687 : live_pseudos_reg_renumber[i] = -1;
356 : 1483830 : }
357 : :
358 : : /* Free the data about living pseudos at program points. */
359 : : static void
360 : 1483830 : finish_lives (void)
361 : : {
362 : 1483830 : sparseset_free (live_range_hard_reg_pseudos);
363 : 1483830 : sparseset_free (live_range_reload_inheritance_pseudos);
364 : 1483830 : free (live_hard_reg_pseudos);
365 : 1483830 : bitmap_obstack_release (&live_hard_reg_pseudos_bitmap_obstack);
366 : 1483830 : free (live_pseudos_reg_renumber);
367 : 1483830 : }
368 : :
369 : : /* Update the LIVE_HARD_REG_PSEUDOS and LIVE_PSEUDOS_REG_RENUMBER
370 : : entries for pseudo REGNO. Assume that the register has been
371 : : spilled if FREE_P, otherwise assume that it has been assigned
372 : : reg_renumber[REGNO] (if >= 0). We also insert the pseudo live
373 : : ranges in the start chains when it is assumed to be assigned to a
374 : : hard register because we use the chains of pseudos assigned to hard
375 : : registers during allocation. */
376 : : static void
377 : 45909210 : update_lives (int regno, bool free_p)
378 : : {
379 : 45909210 : int p;
380 : 45909210 : lra_live_range_t r;
381 : :
382 : 45909210 : if (reg_renumber[regno] < 0)
383 : : return;
384 : 45909210 : live_pseudos_reg_renumber[regno] = free_p ? -1 : reg_renumber[regno];
385 : 100257527 : for (r = lra_reg_info[regno].live_ranges; r != NULL; r = r->next)
386 : : {
387 : 568333982 : for (p = r->start; p <= r->finish; p++)
388 : 513985665 : if (free_p)
389 : 58528609 : bitmap_clear_bit (&live_hard_reg_pseudos[p], regno);
390 : : else
391 : : {
392 : 455457056 : bitmap_set_bit (&live_hard_reg_pseudos[p], regno);
393 : 455457056 : insert_in_live_range_start_chain (regno);
394 : : }
395 : : }
396 : : }
397 : :
398 : : /* Sparseset used to calculate reload pseudos conflicting with a given
399 : : pseudo when we are trying to find a hard register for the given
400 : : pseudo. */
401 : : static sparseset conflict_reload_and_inheritance_pseudos;
402 : :
403 : : /* Map: program point -> bitmap of all reload and inheritance pseudos
404 : : living at the point. */
405 : : static bitmap_head *live_reload_and_inheritance_pseudos;
406 : : static bitmap_obstack live_reload_and_inheritance_pseudos_bitmap_obstack;
407 : :
408 : : /* Allocate and initialize data about living reload pseudos at any
409 : : given program point. */
410 : : static void
411 : 1483830 : init_live_reload_and_inheritance_pseudos (void)
412 : : {
413 : 1483830 : int i, p, max_regno = max_reg_num ();
414 : 1483830 : lra_live_range_t r;
415 : :
416 : 1483830 : conflict_reload_and_inheritance_pseudos = sparseset_alloc (max_regno);
417 : 1483830 : live_reload_and_inheritance_pseudos = XNEWVEC (bitmap_head, lra_live_max_point);
418 : 1483830 : bitmap_obstack_initialize (&live_reload_and_inheritance_pseudos_bitmap_obstack);
419 : 86047452 : for (p = 0; p < lra_live_max_point; p++)
420 : 83079792 : bitmap_initialize (&live_reload_and_inheritance_pseudos[p],
421 : : &live_reload_and_inheritance_pseudos_bitmap_obstack);
422 : 13322206 : for (i = lra_constraint_new_regno_start; i < max_regno; i++)
423 : : {
424 : 23141933 : for (r = lra_reg_info[i].live_ranges; r != NULL; r = r->next)
425 : 1004324028 : for (p = r->start; p <= r->finish; p++)
426 : 993020471 : bitmap_set_bit (&live_reload_and_inheritance_pseudos[p], i);
427 : : }
428 : 1483830 : }
429 : :
430 : : /* Finalize data about living reload pseudos at any given program
431 : : point. */
432 : : static void
433 : 1483830 : finish_live_reload_and_inheritance_pseudos (void)
434 : : {
435 : 1483830 : sparseset_free (conflict_reload_and_inheritance_pseudos);
436 : 1483830 : free (live_reload_and_inheritance_pseudos);
437 : 1483830 : bitmap_obstack_release (&live_reload_and_inheritance_pseudos_bitmap_obstack);
438 : 1483830 : }
439 : :
440 : : /* The value used to check that cost of given hard reg is really
441 : : defined currently. */
442 : : static int curr_hard_regno_costs_check = 0;
443 : : /* Array used to check that cost of the corresponding hard reg (the
444 : : array element index) is really defined currently. */
445 : : static int hard_regno_costs_check[FIRST_PSEUDO_REGISTER];
446 : : /* The current costs of allocation of hard regs. Defined only if the
447 : : value of the corresponding element of the previous array is equal to
448 : : CURR_HARD_REGNO_COSTS_CHECK. */
449 : : static int hard_regno_costs[FIRST_PSEUDO_REGISTER];
450 : :
451 : : /* Adjust cost of HARD_REGNO by INCR. Reset the cost first if it is
452 : : not defined yet. */
453 : : static inline void
454 : 378501336 : adjust_hard_regno_cost (int hard_regno, int incr)
455 : : {
456 : 378501336 : if (hard_regno_costs_check[hard_regno] != curr_hard_regno_costs_check)
457 : 12429507 : hard_regno_costs[hard_regno] = 0;
458 : 378501336 : hard_regno_costs_check[hard_regno] = curr_hard_regno_costs_check;
459 : 378501336 : hard_regno_costs[hard_regno] += incr;
460 : 378501336 : }
461 : :
462 : : /* Try to find a free hard register for pseudo REGNO. Return the
463 : : hard register on success and set *COST to the cost of using
464 : : that register. (If several registers have equal cost, the one with
465 : : the highest priority wins.) Return -1 on failure.
466 : :
467 : : If FIRST_P, return the first available hard reg ignoring other
468 : : criteria, e.g. allocation cost. This approach results in less hard
469 : : reg pool fragmentation and permit to allocate hard regs to reload
470 : : pseudos in complicated situations where pseudo sizes are different.
471 : :
472 : : If TRY_ONLY_HARD_REGNO >= 0, consider only that hard register,
473 : : otherwise consider all hard registers in REGNO's class.
474 : :
475 : : If REGNO_SET is not empty, only hard registers from the set are
476 : : considered. */
477 : : static int
478 : 13999684 : find_hard_regno_for_1 (int regno, int *cost, int try_only_hard_regno,
479 : : bool first_p, HARD_REG_SET regno_set)
480 : : {
481 : 13999684 : HARD_REG_SET conflict_set;
482 : 13999684 : int best_cost = INT_MAX, best_priority = INT_MIN, best_usage = INT_MAX;
483 : 13999684 : lra_live_range_t r;
484 : 13999684 : int p, i, j, rclass_size, best_hard_regno, priority, hard_regno;
485 : 13999684 : int hr, conflict_hr, nregs;
486 : 13999684 : machine_mode biggest_mode;
487 : 13999684 : unsigned int k, conflict_regno;
488 : 13999684 : poly_int64 offset;
489 : 13999684 : int val, biggest_nregs, nregs_diff;
490 : 13999684 : enum reg_class rclass;
491 : 13999684 : bitmap_iterator bi;
492 : 13999684 : bool *rclass_intersect_p;
493 : 13999684 : HARD_REG_SET impossible_start_hard_regs, available_regs;
494 : :
495 : 27999368 : if (hard_reg_set_empty_p (regno_set))
496 : 13715158 : conflict_set = lra_no_alloc_regs;
497 : : else
498 : 284526 : conflict_set = ~regno_set | lra_no_alloc_regs;
499 : 13999684 : rclass = regno_allocno_class_array[regno];
500 : 13999684 : rclass_intersect_p = ira_reg_classes_intersect_p[rclass];
501 : 13999684 : curr_hard_regno_costs_check++;
502 : 13999684 : sparseset_clear (conflict_reload_and_inheritance_pseudos);
503 : 13999684 : sparseset_clear (live_range_hard_reg_pseudos);
504 : 13999684 : conflict_set |= lra_reg_info[regno].conflict_hard_regs;
505 : 13999684 : biggest_mode = lra_reg_info[regno].biggest_mode;
506 : 29843347 : for (r = lra_reg_info[regno].live_ranges; r != NULL; r = r->next)
507 : : {
508 : 129700149 : EXECUTE_IF_SET_IN_BITMAP (&live_hard_reg_pseudos[r->start], 0, k, bi)
509 : 113856486 : if (rclass_intersect_p[regno_allocno_class_array[k]])
510 : 101910193 : sparseset_set_bit (live_range_hard_reg_pseudos, k);
511 : 845696331 : EXECUTE_IF_SET_IN_BITMAP (&live_reload_and_inheritance_pseudos[r->start],
512 : : 0, k, bi)
513 : 829852668 : if (lra_reg_info[k].preferred_hard_regno1 >= 0
514 : 419331334 : && live_pseudos_reg_renumber[k] < 0
515 : 416436911 : && rclass_intersect_p[regno_allocno_class_array[k]])
516 : 413922100 : sparseset_set_bit (conflict_reload_and_inheritance_pseudos, k);
517 : 2818205436 : for (p = r->start + 1; p <= r->finish; p++)
518 : : {
519 : 2802361773 : lra_live_range_t r2;
520 : :
521 : 2802361773 : for (r2 = start_point_ranges[p];
522 : 4775354991 : r2 != NULL;
523 : 1972993218 : r2 = r2->start_next)
524 : : {
525 : 1972993218 : if (live_pseudos_reg_renumber[r2->regno] < 0
526 : 630597981 : && r2->regno >= lra_constraint_new_regno_start
527 : 629773429 : && lra_reg_info[r2->regno].preferred_hard_regno1 >= 0
528 : 361220825 : && rclass_intersect_p[regno_allocno_class_array[r2->regno]])
529 : 354414887 : sparseset_set_bit (conflict_reload_and_inheritance_pseudos,
530 : : r2->regno);
531 : 1618578331 : else if (live_pseudos_reg_renumber[r2->regno] >= 0
532 : 1342395237 : && rclass_intersect_p
533 : 1342395237 : [regno_allocno_class_array[r2->regno]])
534 : 1238443113 : sparseset_set_bit (live_range_hard_reg_pseudos, r2->regno);
535 : : }
536 : : }
537 : : }
538 : 13999684 : if ((hard_regno = lra_reg_info[regno].preferred_hard_regno1) >= 0)
539 : : {
540 : 5618858 : adjust_hard_regno_cost
541 : 5618858 : (hard_regno, -lra_reg_info[regno].preferred_hard_regno_profit1);
542 : 5618858 : if ((hard_regno = lra_reg_info[regno].preferred_hard_regno2) >= 0)
543 : 1735258 : adjust_hard_regno_cost
544 : 1735258 : (hard_regno, -lra_reg_info[regno].preferred_hard_regno_profit2);
545 : : }
546 : : #ifdef STACK_REGS
547 : 13999684 : if (lra_reg_info[regno].no_stack_p)
548 : 499743 : for (i = FIRST_STACK_REG; i <= LAST_STACK_REG; i++)
549 : 444216 : SET_HARD_REG_BIT (conflict_set, i);
550 : : #endif
551 : 13999684 : sparseset_clear_bit (conflict_reload_and_inheritance_pseudos, regno);
552 : 13999684 : val = lra_reg_info[regno].val;
553 : 13999684 : offset = lra_reg_info[regno].offset;
554 : 13999684 : impossible_start_hard_regs = lra_reg_info[regno].exclude_start_hard_regs;
555 : 199177325 : EXECUTE_IF_SET_IN_SPARSESET (live_range_hard_reg_pseudos, conflict_regno)
556 : : {
557 : 189705558 : conflict_hr = live_pseudos_reg_renumber[conflict_regno];
558 : 189705558 : if (lra_reg_val_equal_p (conflict_regno, val, offset))
559 : : {
560 : 922357 : conflict_hr = live_pseudos_reg_renumber[conflict_regno];
561 : 922357 : nregs = hard_regno_nregs (conflict_hr,
562 : 922357 : lra_reg_info[conflict_regno].biggest_mode);
563 : : /* Remember about multi-register pseudos. For example, 2
564 : : hard register pseudos can start on the same hard register
565 : : but cannot start on HR and HR+1/HR-1. */
566 : 928416 : for (hr = conflict_hr + 1;
567 : 928416 : hr < FIRST_PSEUDO_REGISTER && hr < conflict_hr + nregs;
568 : : hr++)
569 : 6059 : SET_HARD_REG_BIT (impossible_start_hard_regs, hr);
570 : 926875 : for (hr = conflict_hr - 1;
571 : 926875 : hr >= 0 && (int) end_hard_regno (biggest_mode, hr) > conflict_hr;
572 : : hr--)
573 : 4518 : SET_HARD_REG_BIT (impossible_start_hard_regs, hr);
574 : : }
575 : : else
576 : : {
577 : 188783201 : machine_mode biggest_conflict_mode
578 : 188783201 : = lra_reg_info[conflict_regno].biggest_mode;
579 : 188783201 : int biggest_conflict_nregs
580 : 188783201 : = hard_regno_nregs (conflict_hr, biggest_conflict_mode);
581 : :
582 : 188783201 : nregs_diff
583 : 188783201 : = (biggest_conflict_nregs
584 : 188783201 : - hard_regno_nregs (conflict_hr,
585 : 188783201 : PSEUDO_REGNO_MODE (conflict_regno)));
586 : 188783201 : add_to_hard_reg_set (&conflict_set,
587 : : biggest_conflict_mode,
588 : : conflict_hr
589 : : - (WORDS_BIG_ENDIAN ? nregs_diff : 0));
590 : 377566402 : if (hard_reg_set_subset_p (reg_class_contents[rclass],
591 : : conflict_set))
592 : : return -1;
593 : : }
594 : : }
595 : 197750654 : EXECUTE_IF_SET_IN_SPARSESET (conflict_reload_and_inheritance_pseudos,
596 : : conflict_regno)
597 : 376557774 : if (!lra_reg_val_equal_p (conflict_regno, val, offset))
598 : : {
599 : 188020599 : lra_assert (live_pseudos_reg_renumber[conflict_regno] < 0);
600 : 188020599 : if ((hard_regno
601 : 188020599 : = lra_reg_info[conflict_regno].preferred_hard_regno1) >= 0)
602 : : {
603 : 188020599 : adjust_hard_regno_cost
604 : 188020599 : (hard_regno,
605 : : lra_reg_info[conflict_regno].preferred_hard_regno_profit1);
606 : 188020599 : if ((hard_regno
607 : 188020599 : = lra_reg_info[conflict_regno].preferred_hard_regno2) >= 0)
608 : 183126621 : adjust_hard_regno_cost
609 : 183126621 : (hard_regno,
610 : : lra_reg_info[conflict_regno].preferred_hard_regno_profit2);
611 : : }
612 : : }
613 : : /* Make sure that all registers in a multi-word pseudo belong to the
614 : : required class. */
615 : 9471767 : conflict_set |= ~reg_class_contents[rclass];
616 : 9471767 : lra_assert (rclass != NO_REGS);
617 : 9471767 : rclass_size = ira_class_hard_regs_num[rclass];
618 : 9471767 : best_hard_regno = -1;
619 : 9471767 : hard_regno = ira_class_hard_regs[rclass][0];
620 : 9471767 : biggest_nregs = hard_regno_nregs (hard_regno, biggest_mode);
621 : 9471767 : nregs_diff = (biggest_nregs
622 : 9471767 : - hard_regno_nregs (hard_regno, PSEUDO_REGNO_MODE (regno)));
623 : 9471767 : available_regs = reg_class_contents[rclass] & ~lra_no_alloc_regs;
624 : 122680679 : for (i = 0; i < rclass_size; i++)
625 : : {
626 : 113284529 : if (try_only_hard_regno >= 0)
627 : : hard_regno = try_only_hard_regno;
628 : : else
629 : 113209155 : hard_regno = ira_class_hard_regs[rclass][i];
630 : 113284529 : if (! overlaps_hard_reg_set_p (conflict_set,
631 : 113284529 : PSEUDO_REGNO_MODE (regno), hard_regno)
632 : 59103121 : && targetm.hard_regno_mode_ok (hard_regno, PSEUDO_REGNO_MODE (regno))
633 : : /* We cannot use prohibited_class_mode_regs for all classes
634 : : because it is not defined for all classes. */
635 : 58954172 : && (ira_allocno_class_translate[rclass] != rclass
636 : 21847255 : || ! TEST_HARD_REG_BIT (ira_prohibited_class_mode_regs
637 : 21847255 : [rclass][biggest_mode],
638 : : hard_regno))
639 : 58953959 : && ! TEST_HARD_REG_BIT (impossible_start_hard_regs, hard_regno)
640 : 172236912 : && (nregs_diff == 0
641 : 4613 : || (WORDS_BIG_ENDIAN
642 : : ? (hard_regno - nregs_diff >= 0
643 : : && TEST_HARD_REG_BIT (available_regs,
644 : : hard_regno - nregs_diff))
645 : 4613 : : TEST_HARD_REG_BIT (available_regs,
646 : 4613 : hard_regno + nregs_diff))))
647 : : {
648 : 58951948 : if (hard_regno_costs_check[hard_regno]
649 : 58951948 : != curr_hard_regno_costs_check)
650 : : {
651 : 53431098 : hard_regno_costs_check[hard_regno] = curr_hard_regno_costs_check;
652 : 53431098 : hard_regno_costs[hard_regno] = 0;
653 : : }
654 : 60109158 : for (j = 0;
655 : 119061106 : j < hard_regno_nregs (hard_regno, PSEUDO_REGNO_MODE (regno));
656 : : j++)
657 : 60109158 : if (! crtl->abi->clobbers_full_reg_p (hard_regno + j)
658 : 60109158 : && ! df_regs_ever_live_p (hard_regno + j))
659 : : /* It needs save restore. */
660 : 14800576 : hard_regno_costs[hard_regno]
661 : 7400288 : += (2
662 : 20742861 : * REG_FREQ_FROM_BB (ENTRY_BLOCK_PTR_FOR_FN (cfun)->next_bb)
663 : 19778000 : + 1);
664 : 58951948 : priority = targetm.register_priority (hard_regno);
665 : 49675651 : if (best_hard_regno < 0 || hard_regno_costs[hard_regno] < best_cost
666 : 106804055 : || (hard_regno_costs[hard_regno] == best_cost
667 : 25297405 : && (priority > best_priority
668 : 25160063 : || (targetm.register_usage_leveling_p ()
669 : 25160063 : && priority == best_priority
670 : 6278788 : && best_usage > lra_hard_reg_usage[hard_regno]))))
671 : : {
672 : 13745047 : best_hard_regno = hard_regno;
673 : 13745047 : best_cost = hard_regno_costs[hard_regno];
674 : 13745047 : best_priority = priority;
675 : 13745047 : best_usage = lra_hard_reg_usage[hard_regno];
676 : : }
677 : : }
678 : 113284529 : if (try_only_hard_regno >= 0 || (first_p && best_hard_regno >= 0))
679 : : break;
680 : : }
681 : 9471767 : if (best_hard_regno >= 0)
682 : 9276297 : *cost = best_cost - lra_reg_info[regno].freq;
683 : : return best_hard_regno;
684 : : }
685 : :
686 : : /* A wrapper for find_hard_regno_for_1 (see comments for that function
687 : : description). This function tries to find a hard register for
688 : : preferred class first if it is worth. */
689 : : static int
690 : 13718827 : find_hard_regno_for (int regno, int *cost, int try_only_hard_regno, bool first_p)
691 : : {
692 : 13718827 : int hard_regno;
693 : 13718827 : HARD_REG_SET regno_set;
694 : :
695 : : /* Only original pseudos can have a different preferred class. */
696 : 13718827 : if (try_only_hard_regno < 0 && regno < lra_new_regno_start)
697 : : {
698 : 1225956 : enum reg_class pref_class = reg_preferred_class (regno);
699 : :
700 : 1225956 : if (regno_allocno_class_array[regno] != pref_class)
701 : : {
702 : 569052 : hard_regno = find_hard_regno_for_1 (regno, cost, -1, first_p,
703 : 284526 : reg_class_contents[pref_class]);
704 : 284526 : if (hard_regno >= 0)
705 : : return hard_regno;
706 : : }
707 : : }
708 : 13715158 : CLEAR_HARD_REG_SET (regno_set);
709 : 13715158 : return find_hard_regno_for_1 (regno, cost, try_only_hard_regno, first_p,
710 : 13715158 : regno_set);
711 : : }
712 : :
713 : : /* Current value used for checking elements in
714 : : update_hard_regno_preference_check. */
715 : : static int curr_update_hard_regno_preference_check;
716 : : /* If an element value is equal to the above variable value, then the
717 : : corresponding regno has been processed for preference
718 : : propagation. */
719 : : static int *update_hard_regno_preference_check;
720 : :
721 : : /* Update the preference for using HARD_REGNO for pseudos that are
722 : : connected directly or indirectly with REGNO. Apply divisor DIV
723 : : to any preference adjustments.
724 : :
725 : : The more indirectly a pseudo is connected, the smaller its effect
726 : : should be. We therefore increase DIV on each "hop". */
727 : : static void
728 : 9504518 : update_hard_regno_preference (int regno, int hard_regno, int div)
729 : : {
730 : 9504518 : int another_regno, cost;
731 : 9504518 : lra_copy_t cp, next_cp;
732 : :
733 : : /* Search depth 5 seems to be enough. */
734 : 9504518 : if (div > (1 << 5))
735 : : return;
736 : 17379245 : for (cp = lra_reg_info[regno].copies; cp != NULL; cp = next_cp)
737 : : {
738 : 7955325 : if (cp->regno1 == regno)
739 : : {
740 : 3645792 : next_cp = cp->regno1_next;
741 : 3645792 : another_regno = cp->regno2;
742 : : }
743 : 4309533 : else if (cp->regno2 == regno)
744 : : {
745 : 4309533 : next_cp = cp->regno2_next;
746 : 4309533 : another_regno = cp->regno1;
747 : : }
748 : : else
749 : 0 : gcc_unreachable ();
750 : 7955325 : if (reg_renumber[another_regno] < 0
751 : 4280836 : && (update_hard_regno_preference_check[another_regno]
752 : 4280836 : != curr_update_hard_regno_preference_check))
753 : : {
754 : 2972173 : update_hard_regno_preference_check[another_regno]
755 : 2972173 : = curr_update_hard_regno_preference_check;
756 : 2972173 : cost = cp->freq < div ? 1 : cp->freq / div;
757 : 2972173 : lra_setup_reload_pseudo_preferenced_hard_reg
758 : 2972173 : (another_regno, hard_regno, cost);
759 : 2972173 : update_hard_regno_preference (another_regno, hard_regno, div * 2);
760 : : }
761 : : }
762 : : }
763 : :
764 : : /* Return prefix title for pseudo REGNO. */
765 : : static const char *
766 : 126 : pseudo_prefix_title (int regno)
767 : : {
768 : 126 : return
769 : 126 : (regno < lra_constraint_new_regno_start ? ""
770 : 119 : : bitmap_bit_p (&lra_inheritance_pseudos, regno) ? "inheritance "
771 : 114 : : bitmap_bit_p (&lra_split_regs, regno) ? "split "
772 : 114 : : bitmap_bit_p (&lra_optional_reload_pseudos, regno) ? "optional reload "
773 : 108 : : bitmap_bit_p (&lra_subreg_reload_pseudos, regno) ? "subreg reload "
774 : 126 : : "reload ");
775 : : }
776 : :
777 : : /* Update REG_RENUMBER and other pseudo preferences by assignment of
778 : : HARD_REGNO to pseudo REGNO and print about it if PRINT_P. */
779 : : void
780 : 6654047 : lra_setup_reg_renumber (int regno, int hard_regno, bool print_p)
781 : : {
782 : 6654047 : int i, hr;
783 : :
784 : : /* We cannot just reassign hard register. */
785 : 6654047 : lra_assert (hard_regno < 0 || reg_renumber[regno] < 0);
786 : 121702 : if ((hr = hard_regno) < 0)
787 : 121702 : hr = reg_renumber[regno];
788 : 6654047 : reg_renumber[regno] = hard_regno;
789 : 6654047 : lra_assert (hr >= 0);
790 : 13502004 : for (i = 0; i < hard_regno_nregs (hr, PSEUDO_REGNO_MODE (regno)); i++)
791 : 6847957 : if (hard_regno < 0)
792 : 129542 : lra_hard_reg_usage[hr + i] -= lra_reg_info[regno].freq;
793 : : else
794 : 6718415 : lra_hard_reg_usage[hr + i] += lra_reg_info[regno].freq;
795 : 6654047 : if (print_p && lra_dump_file != NULL)
796 : 252 : fprintf (lra_dump_file, " Assign %d to %sr%d (freq=%d)\n",
797 : 126 : reg_renumber[regno], pseudo_prefix_title (regno),
798 : 126 : regno, lra_reg_info[regno].freq);
799 : 6654047 : if (hard_regno >= 0)
800 : : {
801 : 6532345 : curr_update_hard_regno_preference_check++;
802 : 6532345 : update_hard_regno_preference (regno, hard_regno, 1);
803 : : }
804 : 6654047 : }
805 : :
806 : : /* Pseudos which occur in insns containing a particular pseudo. */
807 : : static bitmap_head insn_conflict_pseudos;
808 : :
809 : : /* Bitmaps used to contain spill pseudos for given pseudo hard regno
810 : : and best spill pseudos for given pseudo (and best hard regno). */
811 : : static bitmap_head spill_pseudos_bitmap, best_spill_pseudos_bitmap;
812 : :
813 : : /* Current pseudo check for validity of elements in
814 : : TRY_HARD_REG_PSEUDOS. */
815 : : static int curr_pseudo_check;
816 : : /* Array used for validity of elements in TRY_HARD_REG_PSEUDOS. */
817 : : static int try_hard_reg_pseudos_check[FIRST_PSEUDO_REGISTER];
818 : : /* Pseudos who hold given hard register at the considered points. */
819 : : static bitmap_head try_hard_reg_pseudos[FIRST_PSEUDO_REGISTER];
820 : :
821 : : /* Set up try_hard_reg_pseudos for given program point P and class
822 : : RCLASS. Those are pseudos living at P and assigned to a hard
823 : : register of RCLASS. In other words, those are pseudos which can be
824 : : spilled to assign a hard register of RCLASS to a pseudo living at
825 : : P. */
826 : : static void
827 : 100607 : setup_try_hard_regno_pseudos (int p, enum reg_class rclass)
828 : : {
829 : 100607 : int i, hard_regno;
830 : 100607 : machine_mode mode;
831 : 100607 : unsigned int spill_regno;
832 : 100607 : bitmap_iterator bi;
833 : :
834 : : /* Find what pseudos could be spilled. */
835 : 839817 : EXECUTE_IF_SET_IN_BITMAP (&live_hard_reg_pseudos[p], 0, spill_regno, bi)
836 : : {
837 : 739210 : mode = PSEUDO_REGNO_MODE (spill_regno);
838 : 739210 : hard_regno = live_pseudos_reg_renumber[spill_regno];
839 : 739210 : if (overlaps_hard_reg_set_p (reg_class_contents[rclass],
840 : : mode, hard_regno))
841 : : {
842 : 1113070 : for (i = hard_regno_nregs (hard_regno, mode) - 1; i >= 0; i--)
843 : : {
844 : 563867 : if (try_hard_reg_pseudos_check[hard_regno + i]
845 : 563867 : != curr_pseudo_check)
846 : : {
847 : 267447 : try_hard_reg_pseudos_check[hard_regno + i]
848 : 267447 : = curr_pseudo_check;
849 : 267447 : bitmap_clear (&try_hard_reg_pseudos[hard_regno + i]);
850 : : }
851 : 563867 : bitmap_set_bit (&try_hard_reg_pseudos[hard_regno + i],
852 : : spill_regno);
853 : : }
854 : : }
855 : : }
856 : 100607 : }
857 : :
858 : : /* Assign temporarily HARD_REGNO to pseudo REGNO. Temporary
859 : : assignment means that we might undo the data change. */
860 : : static void
861 : 1899626 : assign_temporarily (int regno, int hard_regno)
862 : : {
863 : 1899626 : int p;
864 : 1899626 : lra_live_range_t r;
865 : :
866 : 3821738 : for (r = lra_reg_info[regno].live_ranges; r != NULL; r = r->next)
867 : : {
868 : 13104362 : for (p = r->start; p <= r->finish; p++)
869 : 11182250 : if (hard_regno < 0)
870 : 5591125 : bitmap_clear_bit (&live_hard_reg_pseudos[p], regno);
871 : : else
872 : : {
873 : 5591125 : bitmap_set_bit (&live_hard_reg_pseudos[p], regno);
874 : 5591125 : insert_in_live_range_start_chain (regno);
875 : : }
876 : : }
877 : 1899626 : live_pseudos_reg_renumber[regno] = hard_regno;
878 : 1899626 : }
879 : :
880 : : /* Return true iff there is a reason why pseudo SPILL_REGNO should not
881 : : be spilled. */
882 : : static bool
883 : 271104 : must_not_spill_p (unsigned spill_regno)
884 : : {
885 : 271104 : if ((pic_offset_table_rtx != NULL
886 : 81369 : && spill_regno == REGNO (pic_offset_table_rtx))
887 : 346996 : || ((int) spill_regno >= lra_constraint_new_regno_start
888 : 24367 : && ! bitmap_bit_p (&lra_inheritance_pseudos, spill_regno)
889 : 10043 : && ! bitmap_bit_p (&lra_split_regs, spill_regno)
890 : 8065 : && ! bitmap_bit_p (&lra_subreg_reload_pseudos, spill_regno)
891 : 8065 : && ! bitmap_bit_p (&lra_optional_reload_pseudos, spill_regno)))
892 : 11708 : return true;
893 : : /* A reload pseudo that requires a singleton register class should
894 : : not be spilled.
895 : : FIXME: this mitigates the issue on certain i386 patterns, but
896 : : does not solve the general case where existing reloads fully
897 : : cover a limited register class. */
898 : 259396 : if (!bitmap_bit_p (&non_reload_pseudos, spill_regno)
899 : 241260 : && reg_class_size [reg_preferred_class (spill_regno)] == 1
900 : 276543 : && reg_alternate_class (spill_regno) == NO_REGS)
901 : : return true;
902 : : return false;
903 : : }
904 : :
905 : : /* Array used for sorting reload pseudos for subsequent allocation
906 : : after spilling some pseudo. */
907 : : static int *sorted_reload_pseudos;
908 : :
909 : : /* Spill some pseudos for a reload pseudo REGNO and return hard
910 : : register which should be used for pseudo after spilling. The
911 : : function adds spilled pseudos to SPILLED_PSEUDO_BITMAP. When we
912 : : choose hard register (and pseudos occupying the hard registers and
913 : : to be spilled), we take into account not only how REGNO will
914 : : benefit from the spills but also how other reload pseudos not yet
915 : : assigned to hard registers benefit from the spills too. In very
916 : : rare cases, the function can fail and return -1.
917 : :
918 : : If FIRST_P, return the first available hard reg ignoring other
919 : : criteria, e.g. allocation cost and cost of spilling non-reload
920 : : pseudos. This approach results in less hard reg pool fragmentation
921 : : and permit to allocate hard regs to reload pseudos in complicated
922 : : situations where pseudo sizes are different. */
923 : : static int
924 : 45173 : spill_for (int regno, bitmap spilled_pseudo_bitmap, bool first_p)
925 : : {
926 : 45173 : int i, j, n, p, hard_regno, best_hard_regno, cost, best_cost, rclass_size;
927 : 45173 : int reload_hard_regno, reload_cost;
928 : 45173 : bool static_p, best_static_p;
929 : 45173 : machine_mode mode;
930 : 45173 : enum reg_class rclass;
931 : 45173 : unsigned int spill_regno, reload_regno, uid;
932 : 45173 : int insn_pseudos_num, best_insn_pseudos_num;
933 : 45173 : int bad_spills_num, smallest_bad_spills_num;
934 : 45173 : lra_live_range_t r;
935 : 45173 : bitmap_iterator bi;
936 : :
937 : 45173 : rclass = regno_allocno_class_array[regno];
938 : 45173 : lra_assert (reg_renumber[regno] < 0 && rclass != NO_REGS);
939 : 45173 : bitmap_clear (&insn_conflict_pseudos);
940 : 45173 : bitmap_clear (&best_spill_pseudos_bitmap);
941 : 129347 : EXECUTE_IF_SET_IN_BITMAP (&lra_reg_info[regno].insn_bitmap, 0, uid, bi)
942 : : {
943 : 84174 : struct lra_insn_reg *ir;
944 : :
945 : 292093 : for (ir = lra_get_insn_regs (uid); ir != NULL; ir = ir->next)
946 : 207919 : if (ir->regno >= FIRST_PSEUDO_REGISTER)
947 : 202838 : bitmap_set_bit (&insn_conflict_pseudos, ir->regno);
948 : : }
949 : 45173 : best_hard_regno = -1;
950 : 45173 : best_cost = INT_MAX;
951 : 45173 : best_static_p = true;
952 : 45173 : best_insn_pseudos_num = INT_MAX;
953 : 45173 : smallest_bad_spills_num = INT_MAX;
954 : 45173 : rclass_size = ira_class_hard_regs_num[rclass];
955 : 45173 : mode = PSEUDO_REGNO_MODE (regno);
956 : : /* Invalidate try_hard_reg_pseudos elements. */
957 : 45173 : curr_pseudo_check++;
958 : 90745 : for (r = lra_reg_info[regno].live_ranges; r != NULL; r = r->next)
959 : 146179 : for (p = r->start; p <= r->finish; p++)
960 : 100607 : setup_try_hard_regno_pseudos (p, rclass);
961 : 329514 : for (i = 0; i < rclass_size; i++)
962 : : {
963 : 284341 : hard_regno = ira_class_hard_regs[rclass][i];
964 : 284341 : bitmap_clear (&spill_pseudos_bitmap);
965 : 580135 : for (j = hard_regno_nregs (hard_regno, mode) - 1; j >= 0; j--)
966 : : {
967 : 295794 : if (hard_regno + j >= FIRST_PSEUDO_REGISTER)
968 : : break;
969 : 295794 : if (try_hard_reg_pseudos_check[hard_regno + j] != curr_pseudo_check)
970 : 21962 : continue;
971 : 273832 : lra_assert (!bitmap_empty_p (&try_hard_reg_pseudos[hard_regno + j]));
972 : 273832 : bitmap_ior_into (&spill_pseudos_bitmap,
973 : 273832 : &try_hard_reg_pseudos[hard_regno + j]);
974 : : }
975 : : /* Spill pseudos. */
976 : 284341 : static_p = false;
977 : 543177 : EXECUTE_IF_SET_IN_BITMAP (&spill_pseudos_bitmap, 0, spill_regno, bi)
978 : 271104 : if (must_not_spill_p (spill_regno))
979 : 12268 : goto fail;
980 : 258836 : else if (non_spilled_static_chain_regno_p (spill_regno))
981 : 0 : static_p = true;
982 : 272073 : insn_pseudos_num = 0;
983 : 272073 : bad_spills_num = 0;
984 : 272073 : if (lra_dump_file != NULL)
985 : 0 : fprintf (lra_dump_file, " Trying %d:", hard_regno);
986 : 272073 : sparseset_clear (live_range_reload_inheritance_pseudos);
987 : 530744 : EXECUTE_IF_SET_IN_BITMAP (&spill_pseudos_bitmap, 0, spill_regno, bi)
988 : : {
989 : 258671 : if (bitmap_bit_p (&insn_conflict_pseudos, spill_regno))
990 : 43070 : insn_pseudos_num++;
991 : 258671 : if (spill_regno >= (unsigned int) lra_bad_spill_regno_start)
992 : 0 : bad_spills_num++;
993 : 258671 : for (r = lra_reg_info[spill_regno].live_ranges;
994 : 879502 : r != NULL;
995 : 620831 : r = r->next)
996 : : {
997 : 55616272 : for (p = r->start; p <= r->finish; p++)
998 : : {
999 : 54995441 : lra_live_range_t r2;
1000 : :
1001 : 54995441 : for (r2 = start_point_ranges[p];
1002 : 94711627 : r2 != NULL;
1003 : 39716186 : r2 = r2->start_next)
1004 : 39716186 : if (r2->regno >= lra_constraint_new_regno_start)
1005 : 23641822 : sparseset_set_bit (live_range_reload_inheritance_pseudos,
1006 : : r2->regno);
1007 : : }
1008 : : }
1009 : : }
1010 : 272073 : n = 0;
1011 : 272073 : if (sparseset_cardinality (live_range_reload_inheritance_pseudos)
1012 : 272073 : <= (unsigned)param_lra_max_considered_reload_pseudos)
1013 : 14128640 : EXECUTE_IF_SET_IN_SPARSESET (live_range_reload_inheritance_pseudos,
1014 : : reload_regno)
1015 : 6797228 : if ((int) reload_regno != regno
1016 : 6562169 : && (ira_reg_classes_intersect_p
1017 : 6562169 : [rclass][regno_allocno_class_array[reload_regno]])
1018 : 5814398 : && live_pseudos_reg_renumber[reload_regno] < 0
1019 : 10233766 : && find_hard_regno_for (reload_regno, &cost, -1, first_p) < 0)
1020 : 1566553 : sorted_reload_pseudos[n++] = reload_regno;
1021 : 530744 : EXECUTE_IF_SET_IN_BITMAP (&spill_pseudos_bitmap, 0, spill_regno, bi)
1022 : : {
1023 : 258671 : update_lives (spill_regno, true);
1024 : 258671 : if (lra_dump_file != NULL)
1025 : 0 : fprintf (lra_dump_file, " spill %d(freq=%d)",
1026 : 0 : spill_regno, lra_reg_info[spill_regno].freq);
1027 : : }
1028 : 272073 : hard_regno = find_hard_regno_for (regno, &cost, -1, first_p);
1029 : 272073 : if (hard_regno >= 0)
1030 : : {
1031 : 254249 : assign_temporarily (regno, hard_regno);
1032 : 254249 : qsort (sorted_reload_pseudos, n, sizeof (int),
1033 : : reload_pseudo_compare_func);
1034 : 2069309 : for (j = 0; j < n; j++)
1035 : : {
1036 : 1560811 : reload_regno = sorted_reload_pseudos[j];
1037 : 1560811 : lra_assert (live_pseudos_reg_renumber[reload_regno] < 0);
1038 : 3121622 : if ((reload_hard_regno
1039 : 1560811 : = find_hard_regno_for (reload_regno,
1040 : : &reload_cost, -1, first_p)) >= 0)
1041 : : {
1042 : 695564 : if (lra_dump_file != NULL)
1043 : 0 : fprintf (lra_dump_file, " assign %d(cost=%d)",
1044 : : reload_regno, reload_cost);
1045 : 695564 : assign_temporarily (reload_regno, reload_hard_regno);
1046 : 695564 : cost += reload_cost;
1047 : : }
1048 : : }
1049 : 511750 : EXECUTE_IF_SET_IN_BITMAP (&spill_pseudos_bitmap, 0, spill_regno, bi)
1050 : : {
1051 : 257501 : rtx_insn_list *x;
1052 : :
1053 : 257501 : cost += lra_reg_info[spill_regno].freq;
1054 : 257501 : if (ira_reg_equiv[spill_regno].memory != NULL
1055 : 249260 : || ira_reg_equiv[spill_regno].constant != NULL)
1056 : 9876 : for (x = ira_reg_equiv[spill_regno].init_insns;
1057 : 17745 : x != NULL;
1058 : 7869 : x = x->next ())
1059 : 23305 : cost -= REG_FREQ_FROM_BB (BLOCK_FOR_INSN (x->insn ()));
1060 : : }
1061 : : /* Avoid spilling static chain pointer pseudo when non-local
1062 : : goto is used. */
1063 : 254249 : if ((! static_p && best_static_p)
1064 : 209818 : || (static_p == best_static_p
1065 : 209818 : && (best_insn_pseudos_num > insn_pseudos_num
1066 : 202860 : || (best_insn_pseudos_num == insn_pseudos_num
1067 : 184448 : && (bad_spills_num < smallest_bad_spills_num
1068 : 184448 : || (bad_spills_num == smallest_bad_spills_num
1069 : 184448 : && best_cost > cost))))))
1070 : : {
1071 : 85286 : best_insn_pseudos_num = insn_pseudos_num;
1072 : 85286 : smallest_bad_spills_num = bad_spills_num;
1073 : 85286 : best_static_p = static_p;
1074 : 85286 : best_cost = cost;
1075 : 85286 : best_hard_regno = hard_regno;
1076 : 85286 : bitmap_copy (&best_spill_pseudos_bitmap, &spill_pseudos_bitmap);
1077 : 85286 : if (lra_dump_file != NULL)
1078 : 0 : fprintf (lra_dump_file,
1079 : : " Now best %d(cost=%d, bad_spills=%d, insn_pseudos=%d)\n",
1080 : : hard_regno, cost, bad_spills_num, insn_pseudos_num);
1081 : : }
1082 : 254249 : assign_temporarily (regno, -1);
1083 : 2069309 : for (j = 0; j < n; j++)
1084 : : {
1085 : 1560811 : reload_regno = sorted_reload_pseudos[j];
1086 : 1560811 : if (live_pseudos_reg_renumber[reload_regno] >= 0)
1087 : 695564 : assign_temporarily (reload_regno, -1);
1088 : : }
1089 : : }
1090 : 272073 : if (lra_dump_file != NULL)
1091 : 0 : fprintf (lra_dump_file, "\n");
1092 : : /* Restore the live hard reg pseudo info for spilled pseudos. */
1093 : 530744 : EXECUTE_IF_SET_IN_BITMAP (&spill_pseudos_bitmap, 0, spill_regno, bi)
1094 : 258671 : update_lives (spill_regno, false);
1095 : 272073 : fail:
1096 : 284341 : ;
1097 : : }
1098 : : /* Spill: */
1099 : 90052 : EXECUTE_IF_SET_IN_BITMAP (&best_spill_pseudos_bitmap, 0, spill_regno, bi)
1100 : : {
1101 : 44879 : if ((int) spill_regno >= lra_constraint_new_regno_start)
1102 : 4206 : former_reload_pseudo_spill_p = true;
1103 : 44879 : if (lra_dump_file != NULL)
1104 : 0 : fprintf (lra_dump_file, " Spill %sr%d(hr=%d, freq=%d) for r%d\n",
1105 : : pseudo_prefix_title (spill_regno),
1106 : 0 : spill_regno, reg_renumber[spill_regno],
1107 : 0 : lra_reg_info[spill_regno].freq, regno);
1108 : 44879 : update_lives (spill_regno, true);
1109 : 44879 : lra_setup_reg_renumber (spill_regno, -1, false);
1110 : : }
1111 : 45173 : bitmap_ior_into (spilled_pseudo_bitmap, &best_spill_pseudos_bitmap);
1112 : 45173 : return best_hard_regno;
1113 : : }
1114 : :
1115 : : /* Assign HARD_REGNO to REGNO. */
1116 : : static void
1117 : 6532331 : assign_hard_regno (int hard_regno, int regno)
1118 : : {
1119 : 6532331 : int i;
1120 : :
1121 : 6532331 : lra_assert (hard_regno >= 0);
1122 : 6532331 : lra_setup_reg_renumber (regno, hard_regno, true);
1123 : 6532331 : update_lives (regno, false);
1124 : 13252969 : for (i = 0;
1125 : 13252969 : i < hard_regno_nregs (hard_regno, lra_reg_info[regno].biggest_mode);
1126 : : i++)
1127 : 6720638 : df_set_regs_ever_live (hard_regno + i, true);
1128 : 6532331 : }
1129 : :
1130 : : /* Array used for sorting different pseudos. */
1131 : : static int *sorted_pseudos;
1132 : :
1133 : : /* The constraints pass is allowed to create equivalences between
1134 : : pseudos that make the current allocation "incorrect" (in the sense
1135 : : that pseudos are assigned to hard registers from their own conflict
1136 : : sets). The global variable check_and_force_assignment_correctness_p says
1137 : : whether this might have happened.
1138 : :
1139 : : Process pseudos assigned to hard registers (less frequently used
1140 : : first), spill if a conflict is found, and mark the spilled pseudos
1141 : : in SPILLED_PSEUDO_BITMAP. Set up LIVE_HARD_REG_PSEUDOS from
1142 : : pseudos, assigned to hard registers. */
1143 : : static void
1144 : 1483830 : setup_live_pseudos_and_spill_after_risky_transforms (bitmap
1145 : : spilled_pseudo_bitmap)
1146 : : {
1147 : 1483830 : int p, i, j, n, regno, hard_regno, biggest_nregs, nregs_diff;
1148 : 1483830 : unsigned int k, conflict_regno;
1149 : 1483830 : poly_int64 offset;
1150 : 1483830 : int val;
1151 : 1483830 : HARD_REG_SET conflict_set;
1152 : 1483830 : machine_mode mode, biggest_mode;
1153 : 1483830 : lra_live_range_t r;
1154 : 1483830 : bitmap_iterator bi;
1155 : 1483830 : int max_regno = max_reg_num ();
1156 : :
1157 : 1483830 : if (! check_and_force_assignment_correctness_p)
1158 : : {
1159 : 19198001 : for (i = FIRST_PSEUDO_REGISTER; i < max_regno; i++)
1160 : 19140350 : if (reg_renumber[i] >= 0 && lra_reg_info[i].nrefs > 0)
1161 : 9225902 : update_lives (i, false);
1162 : 57651 : return;
1163 : : }
1164 : 76825156 : for (n = 0, i = FIRST_PSEUDO_REGISTER; i < max_regno; i++)
1165 : 75398977 : if ((pic_offset_table_rtx == NULL_RTX
1166 : 7160255 : || i != (int) REGNO (pic_offset_table_rtx))
1167 : 82510217 : && (hard_regno = reg_renumber[i]) >= 0 && lra_reg_info[i].nrefs > 0)
1168 : : {
1169 : 29483563 : biggest_mode = lra_reg_info[i].biggest_mode;
1170 : 29483563 : biggest_nregs = hard_regno_nregs (hard_regno, biggest_mode);
1171 : 29483563 : nregs_diff = (biggest_nregs
1172 : 29483563 : - hard_regno_nregs (hard_regno, PSEUDO_REGNO_MODE (i)));
1173 : 29483563 : enum reg_class rclass = lra_get_allocno_class (i);
1174 : :
1175 : 29483563 : if ((WORDS_BIG_ENDIAN
1176 : : && (hard_regno - nregs_diff < 0
1177 : : || !TEST_HARD_REG_BIT (reg_class_contents[rclass],
1178 : : hard_regno - nregs_diff)))
1179 : : || (!WORDS_BIG_ENDIAN
1180 : 29483563 : && (hard_regno + nregs_diff >= FIRST_PSEUDO_REGISTER
1181 : 29483563 : || !TEST_HARD_REG_BIT (reg_class_contents[rclass],
1182 : : hard_regno + nregs_diff))))
1183 : : {
1184 : : /* Hard registers of paradoxical sub-registers are out of
1185 : : range of pseudo register class. Spill the pseudo. */
1186 : 0 : reg_renumber[i] = -1;
1187 : 0 : continue;
1188 : : }
1189 : 29483563 : sorted_pseudos[n++] = i;
1190 : : }
1191 : 1426179 : qsort (sorted_pseudos, n, sizeof (int), pseudo_compare_func);
1192 : 1426179 : if (pic_offset_table_rtx != NULL_RTX
1193 : 49015 : && (regno = REGNO (pic_offset_table_rtx)) >= FIRST_PSEUDO_REGISTER
1194 : 1475194 : && reg_renumber[regno] >= 0 && lra_reg_info[regno].nrefs > 0)
1195 : 42383 : sorted_pseudos[n++] = regno;
1196 : 30952125 : for (i = n - 1; i >= 0; i--)
1197 : : {
1198 : 29525946 : regno = sorted_pseudos[i];
1199 : 29525946 : hard_regno = reg_renumber[regno];
1200 : 29525946 : lra_assert (hard_regno >= 0);
1201 : 29525946 : mode = lra_reg_info[regno].biggest_mode;
1202 : 29525946 : sparseset_clear (live_range_hard_reg_pseudos);
1203 : 64099996 : for (r = lra_reg_info[regno].live_ranges; r != NULL; r = r->next)
1204 : : {
1205 : 77104311 : EXECUTE_IF_SET_IN_BITMAP (&live_hard_reg_pseudos[r->start], 0, k, bi)
1206 : 42530261 : sparseset_set_bit (live_range_hard_reg_pseudos, k);
1207 : 248803701 : for (p = r->start + 1; p <= r->finish; p++)
1208 : : {
1209 : 214229651 : lra_live_range_t r2;
1210 : :
1211 : 214229651 : for (r2 = start_point_ranges[p];
1212 : 327947382 : r2 != NULL;
1213 : 113717731 : r2 = r2->start_next)
1214 : 113717731 : if (live_pseudos_reg_renumber[r2->regno] >= 0)
1215 : 60045993 : sparseset_set_bit (live_range_hard_reg_pseudos, r2->regno);
1216 : : }
1217 : : }
1218 : 29525946 : conflict_set = lra_no_alloc_regs;
1219 : 29525946 : conflict_set |= lra_reg_info[regno].conflict_hard_regs;
1220 : 29525946 : val = lra_reg_info[regno].val;
1221 : 29525946 : offset = lra_reg_info[regno].offset;
1222 : 115192419 : EXECUTE_IF_SET_IN_SPARSESET (live_range_hard_reg_pseudos, conflict_regno)
1223 : 85666473 : if (!lra_reg_val_equal_p (conflict_regno, val, offset)
1224 : : /* If it is multi-register pseudos they should start on
1225 : : the same hard register. */
1226 : 86272 : || hard_regno != reg_renumber[conflict_regno])
1227 : : {
1228 : 85594441 : int conflict_hard_regno = reg_renumber[conflict_regno];
1229 : :
1230 : 85594441 : biggest_mode = lra_reg_info[conflict_regno].biggest_mode;
1231 : 85594441 : biggest_nregs = hard_regno_nregs (conflict_hard_regno,
1232 : : biggest_mode);
1233 : 85594441 : nregs_diff
1234 : 85594441 : = (biggest_nregs
1235 : 85594441 : - hard_regno_nregs (conflict_hard_regno,
1236 : 85594441 : PSEUDO_REGNO_MODE (conflict_regno)));
1237 : 85594441 : add_to_hard_reg_set (&conflict_set,
1238 : : biggest_mode,
1239 : : conflict_hard_regno
1240 : : - (WORDS_BIG_ENDIAN ? nregs_diff : 0));
1241 : : }
1242 : 29525946 : if (! overlaps_hard_reg_set_p (conflict_set, mode, hard_regno))
1243 : : {
1244 : 29511933 : update_lives (regno, false);
1245 : 29511933 : continue;
1246 : : }
1247 : 14013 : bitmap_set_bit (spilled_pseudo_bitmap, regno);
1248 : 14013 : for (j = 0;
1249 : 38377 : j < hard_regno_nregs (hard_regno, PSEUDO_REGNO_MODE (regno));
1250 : : j++)
1251 : 24364 : lra_hard_reg_usage[hard_regno + j] -= lra_reg_info[regno].freq;
1252 : 14013 : reg_renumber[regno] = -1;
1253 : 14013 : if (regno >= lra_constraint_new_regno_start)
1254 : 0 : former_reload_pseudo_spill_p = true;
1255 : 14013 : if (lra_dump_file != NULL)
1256 : 0 : fprintf (lra_dump_file, " Spill r%d after risky transformations\n",
1257 : : regno);
1258 : : }
1259 : : }
1260 : :
1261 : : /* Improve allocation by assigning the same hard regno of inheritance
1262 : : pseudos to the connected pseudos. We need this because inheritance
1263 : : pseudos are allocated after reload pseudos in the thread and when
1264 : : we assign a hard register to a reload pseudo we don't know yet that
1265 : : the connected inheritance pseudos can get the same hard register.
1266 : : Add pseudos with changed allocation to bitmap CHANGED_PSEUDOS. */
1267 : : static void
1268 : 1483830 : improve_inheritance (bitmap changed_pseudos)
1269 : : {
1270 : 1483830 : unsigned int k;
1271 : 1483830 : int regno, another_regno, hard_regno, another_hard_regno, cost, i, n;
1272 : 1483830 : lra_copy_t cp, next_cp;
1273 : 1483830 : bitmap_iterator bi;
1274 : :
1275 : 1483830 : if (lra_inheritance_iter > LRA_MAX_INHERITANCE_PASSES)
1276 : 2330 : return;
1277 : 1481500 : n = 0;
1278 : 3409300 : EXECUTE_IF_SET_IN_BITMAP (&lra_inheritance_pseudos, 0, k, bi)
1279 : 1927800 : if (reg_renumber[k] >= 0 && lra_reg_info[k].nrefs != 0)
1280 : 1348832 : sorted_pseudos[n++] = k;
1281 : 1481500 : qsort (sorted_pseudos, n, sizeof (int), pseudo_compare_func);
1282 : 4311832 : for (i = 0; i < n; i++)
1283 : : {
1284 : 1348832 : regno = sorted_pseudos[i];
1285 : 1348832 : hard_regno = reg_renumber[regno];
1286 : 1348832 : lra_assert (hard_regno >= 0);
1287 : 3854559 : for (cp = lra_reg_info[regno].copies; cp != NULL; cp = next_cp)
1288 : : {
1289 : 2505727 : if (cp->regno1 == regno)
1290 : : {
1291 : 442695 : next_cp = cp->regno1_next;
1292 : 442695 : another_regno = cp->regno2;
1293 : : }
1294 : 2063032 : else if (cp->regno2 == regno)
1295 : : {
1296 : 2063032 : next_cp = cp->regno2_next;
1297 : 2063032 : another_regno = cp->regno1;
1298 : : }
1299 : : else
1300 : 0 : gcc_unreachable ();
1301 : : /* Don't change reload pseudo allocation. It might have
1302 : : this allocation for a purpose and changing it can result
1303 : : in LRA cycling. */
1304 : 2505727 : if ((another_regno < lra_constraint_new_regno_start
1305 : 2505727 : || bitmap_bit_p (&lra_inheritance_pseudos, another_regno))
1306 : 909698 : && (another_hard_regno = reg_renumber[another_regno]) >= 0
1307 : 3308143 : && another_hard_regno != hard_regno)
1308 : : {
1309 : 75374 : if (lra_dump_file != NULL)
1310 : 0 : fprintf
1311 : 0 : (lra_dump_file,
1312 : : " Improving inheritance for %d(%d) and %d(%d)...\n",
1313 : : regno, hard_regno, another_regno, another_hard_regno);
1314 : 75374 : update_lives (another_regno, true);
1315 : 75374 : lra_setup_reg_renumber (another_regno, -1, false);
1316 : 75374 : if (hard_regno == find_hard_regno_for (another_regno, &cost,
1317 : : hard_regno, false))
1318 : 43973 : assign_hard_regno (hard_regno, another_regno);
1319 : : else
1320 : 31401 : assign_hard_regno (another_hard_regno, another_regno);
1321 : 75374 : bitmap_set_bit (changed_pseudos, another_regno);
1322 : : }
1323 : : }
1324 : : }
1325 : : }
1326 : :
1327 : :
1328 : : /* Bitmap finally containing all pseudos spilled on this assignment
1329 : : pass. */
1330 : : static bitmap_head all_spilled_pseudos;
1331 : : /* All pseudos whose allocation was changed. */
1332 : : static bitmap_head changed_pseudo_bitmap;
1333 : :
1334 : :
1335 : : /* Add to LIVE_RANGE_HARD_REG_PSEUDOS all pseudos conflicting with
1336 : : REGNO and whose hard regs can be assigned to REGNO. */
1337 : : static void
1338 : 373 : find_all_spills_for (int regno)
1339 : : {
1340 : 373 : int p;
1341 : 373 : lra_live_range_t r;
1342 : 373 : unsigned int k;
1343 : 373 : bitmap_iterator bi;
1344 : 373 : enum reg_class rclass;
1345 : 373 : bool *rclass_intersect_p;
1346 : :
1347 : 373 : rclass = regno_allocno_class_array[regno];
1348 : 373 : rclass_intersect_p = ira_reg_classes_intersect_p[rclass];
1349 : 933 : for (r = lra_reg_info[regno].live_ranges; r != NULL; r = r->next)
1350 : : {
1351 : 2149 : EXECUTE_IF_SET_IN_BITMAP (&live_hard_reg_pseudos[r->start], 0, k, bi)
1352 : 1589 : if (rclass_intersect_p[regno_allocno_class_array[k]])
1353 : 1525 : sparseset_set_bit (live_range_hard_reg_pseudos, k);
1354 : 1137 : for (p = r->start + 1; p <= r->finish; p++)
1355 : : {
1356 : 577 : lra_live_range_t r2;
1357 : :
1358 : 577 : for (r2 = start_point_ranges[p];
1359 : 1877 : r2 != NULL;
1360 : 1300 : r2 = r2->start_next)
1361 : : {
1362 : 1300 : if (live_pseudos_reg_renumber[r2->regno] >= 0
1363 : 1291 : && ! sparseset_bit_p (live_range_hard_reg_pseudos, r2->regno)
1364 : 2588 : && rclass_intersect_p[regno_allocno_class_array[r2->regno]])
1365 : 1287 : sparseset_set_bit (live_range_hard_reg_pseudos, r2->regno);
1366 : : }
1367 : : }
1368 : : }
1369 : 373 : }
1370 : :
1371 : : /* Assign hard registers to reload pseudos and other pseudos. Return
1372 : : true if we was not able to assign hard registers to all reload
1373 : : pseudos. */
1374 : : static bool
1375 : 1483830 : assign_by_spills (void)
1376 : : {
1377 : 1483830 : int i, n, nfails, iter, regno, regno2, hard_regno, cost;
1378 : 1483830 : rtx restore_rtx;
1379 : 1483830 : bitmap_head changed_insns, do_not_assign_nonreload_pseudos;
1380 : 1483830 : unsigned int u, conflict_regno;
1381 : 1483830 : bitmap_iterator bi;
1382 : 1483830 : bool reload_p, fails_p = false;
1383 : 1483830 : int max_regno = max_reg_num ();
1384 : :
1385 : 13322206 : for (n = 0, i = lra_constraint_new_regno_start; i < max_regno; i++)
1386 : 11838376 : if (reg_renumber[i] < 0 && lra_reg_info[i].nrefs != 0
1387 : 7681954 : && regno_allocno_class_array[i] != NO_REGS)
1388 : 6706982 : sorted_pseudos[n++] = i;
1389 : 1483830 : bitmap_initialize (&insn_conflict_pseudos, ®_obstack);
1390 : 1483830 : bitmap_initialize (&spill_pseudos_bitmap, ®_obstack);
1391 : 1483830 : bitmap_initialize (&best_spill_pseudos_bitmap, ®_obstack);
1392 : 1483830 : update_hard_regno_preference_check = XCNEWVEC (int, max_regno);
1393 : 1483830 : curr_update_hard_regno_preference_check = 0;
1394 : 1483830 : memset (try_hard_reg_pseudos_check, 0, sizeof (try_hard_reg_pseudos_check));
1395 : 137996190 : for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
1396 : 136512360 : bitmap_initialize (&try_hard_reg_pseudos[i], ®_obstack);
1397 : 1483830 : curr_pseudo_check = 0;
1398 : 1483830 : bitmap_initialize (&changed_insns, ®_obstack);
1399 : 1483830 : bitmap_initialize (&non_reload_pseudos, ®_obstack);
1400 : 1483830 : bitmap_ior (&non_reload_pseudos, &lra_inheritance_pseudos, &lra_split_regs);
1401 : 1483830 : bitmap_ior_into (&non_reload_pseudos, &lra_subreg_reload_pseudos);
1402 : 1483830 : bitmap_ior_into (&non_reload_pseudos, &lra_optional_reload_pseudos);
1403 : 1483830 : for (iter = 0; iter <= 1; iter++)
1404 : : {
1405 : 1484035 : qsort (sorted_pseudos, n, sizeof (int), reload_pseudo_compare_func);
1406 : 1484035 : nfails = 0;
1407 : 8192054 : for (i = 0; i < n; i++)
1408 : : {
1409 : 6708019 : regno = sorted_pseudos[i];
1410 : 6708019 : if (reg_renumber[regno] >= 0)
1411 : 338 : continue;
1412 : 6707681 : if (lra_dump_file != NULL)
1413 : 238 : fprintf (lra_dump_file, " Assigning to %d "
1414 : : "(cl=%s, orig=%d, freq=%d, tfirst=%d, tfreq=%d)...\n",
1415 : 119 : regno, reg_class_names[regno_allocno_class_array[regno]],
1416 : 119 : ORIGINAL_REGNO (regno_reg_rtx[regno]),
1417 : 119 : lra_reg_info[regno].freq, regno_assign_info[regno].first,
1418 : 119 : regno_assign_info[regno_assign_info[regno].first].freq);
1419 : 6707681 : hard_regno = find_hard_regno_for (regno, &cost, -1, iter == 1);
1420 : 6707681 : reload_p = ! bitmap_bit_p (&non_reload_pseudos, regno);
1421 : 6707681 : if (hard_regno < 0 && reload_p)
1422 : 45173 : hard_regno = spill_for (regno, &all_spilled_pseudos, iter == 1);
1423 : 6707681 : if (hard_regno < 0)
1424 : : {
1425 : 437000 : if (reload_p)
1426 : : {
1427 : : /* Put unassigned reload pseudo first in the array. */
1428 : 742 : regno2 = sorted_pseudos[nfails];
1429 : 742 : sorted_pseudos[nfails++] = regno;
1430 : 742 : sorted_pseudos[i] = regno2;
1431 : : }
1432 : : else
1433 : : {
1434 : : /* Consider all alternatives on the next constraint
1435 : : subpass. */
1436 : 436258 : bitmap_set_bit (&all_spilled_pseudos, regno);
1437 : : }
1438 : : }
1439 : : else
1440 : : {
1441 : : /* This register might have been spilled by the previous
1442 : : pass. Indicate that it is no longer spilled. */
1443 : 6270681 : bitmap_clear_bit (&all_spilled_pseudos, regno);
1444 : 6270681 : assign_hard_regno (hard_regno, regno);
1445 : 6270681 : if (! reload_p || regno_allocno_class_array[regno] == ALL_REGS)
1446 : : /* As non-reload pseudo assignment is changed we should
1447 : : reconsider insns referring for the pseudo. Do the same if a
1448 : : reload pseudo did not refine its class which can happens
1449 : : when the pseudo occurs only in reload insns. */
1450 : 1465528 : bitmap_set_bit (&changed_pseudo_bitmap, regno);
1451 : : }
1452 : : }
1453 : 1484035 : if (nfails == 0 || iter > 0)
1454 : : {
1455 : 1483830 : fails_p = nfails != 0;
1456 : 1483830 : break;
1457 : : }
1458 : : /* This is a very rare event. We cannot assign a hard register
1459 : : to reload pseudo because the hard register was assigned to
1460 : : another reload pseudo on a previous assignment pass. For x86
1461 : : example, on the 1st pass we assigned CX (although another
1462 : : hard register could be used for this) to reload pseudo in an
1463 : : insn, on the 2nd pass we need CX (and only this) hard
1464 : : register for a new reload pseudo in the same insn. Another
1465 : : possible situation may occur in assigning to multi-regs
1466 : : reload pseudos when hard regs pool is too fragmented even
1467 : : after spilling non-reload pseudos.
1468 : :
1469 : : We should do something radical here to succeed. Here we
1470 : : spill *all* conflicting pseudos and reassign them. */
1471 : 205 : if (lra_dump_file != NULL)
1472 : 0 : fprintf (lra_dump_file, " 2nd iter for reload pseudo assignments:\n");
1473 : 205 : sparseset_clear (live_range_hard_reg_pseudos);
1474 : 578 : for (i = 0; i < nfails; i++)
1475 : : {
1476 : 373 : if (lra_dump_file != NULL)
1477 : 0 : fprintf (lra_dump_file, " Reload r%d assignment failure\n",
1478 : 0 : sorted_pseudos[i]);
1479 : 373 : find_all_spills_for (sorted_pseudos[i]);
1480 : : }
1481 : 3103 : EXECUTE_IF_SET_IN_SPARSESET (live_range_hard_reg_pseudos, conflict_regno)
1482 : : {
1483 : 1449 : if ((int) conflict_regno >= lra_constraint_new_regno_start)
1484 : : {
1485 : 155 : sorted_pseudos[nfails++] = conflict_regno;
1486 : 155 : former_reload_pseudo_spill_p = true;
1487 : : }
1488 : : else
1489 : : /* It is better to do reloads before spilling as after the
1490 : : spill-subpass we will reload memory instead of pseudos
1491 : : and this will make reusing reload pseudos more
1492 : : complicated. Going directly to the spill pass in such
1493 : : case might result in worse code performance or even LRA
1494 : : cycling if we have few registers. */
1495 : 1294 : bitmap_set_bit (&all_spilled_pseudos, conflict_regno);
1496 : 1449 : if (lra_dump_file != NULL)
1497 : 0 : fprintf (lra_dump_file, " Spill %s r%d(hr=%d, freq=%d)\n",
1498 : : pseudo_prefix_title (conflict_regno), conflict_regno,
1499 : 0 : reg_renumber[conflict_regno],
1500 : 0 : lra_reg_info[conflict_regno].freq);
1501 : 1449 : update_lives (conflict_regno, true);
1502 : 1449 : lra_setup_reg_renumber (conflict_regno, -1, false);
1503 : : }
1504 : 205 : if (n < nfails)
1505 : : n = nfails;
1506 : : }
1507 : 1483830 : improve_inheritance (&changed_pseudo_bitmap);
1508 : 1483830 : bitmap_clear (&non_reload_pseudos);
1509 : 1483830 : bitmap_clear (&changed_insns);
1510 : 1483830 : if (! lra_simple_p)
1511 : : {
1512 : : /* We should not assign to original pseudos of inheritance
1513 : : pseudos or split pseudos if any its inheritance pseudo did
1514 : : not get hard register or any its split pseudo was not split
1515 : : because undo inheritance/split pass will extend live range of
1516 : : such inheritance or split pseudos. */
1517 : 1483824 : bitmap_initialize (&do_not_assign_nonreload_pseudos, ®_obstack);
1518 : 3572856 : EXECUTE_IF_SET_IN_BITMAP (&lra_inheritance_pseudos, 0, u, bi)
1519 : 2089032 : if ((restore_rtx = lra_reg_info[u].restore_rtx) != NULL_RTX
1520 : 1230786 : && REG_P (restore_rtx)
1521 : 1205223 : && reg_renumber[u] < 0
1522 : 2499255 : && bitmap_bit_p (&lra_inheritance_pseudos, u))
1523 : 410223 : bitmap_set_bit (&do_not_assign_nonreload_pseudos, REGNO (restore_rtx));
1524 : 2471437 : EXECUTE_IF_SET_IN_BITMAP (&lra_split_regs, 0, u, bi)
1525 : 987613 : if ((restore_rtx = lra_reg_info[u].restore_rtx) != NULL_RTX
1526 : 987613 : && reg_renumber[u] >= 0)
1527 : : {
1528 : 1007 : lra_assert (REG_P (restore_rtx));
1529 : 1007 : bitmap_set_bit (&do_not_assign_nonreload_pseudos, REGNO (restore_rtx));
1530 : : }
1531 : 95792888 : for (n = 0, i = FIRST_PSEUDO_REGISTER; i < max_regno; i++)
1532 : 94309064 : if (((i < lra_constraint_new_regno_start
1533 : 82474382 : && ! bitmap_bit_p (&do_not_assign_nonreload_pseudos, i))
1534 : 12116854 : || (bitmap_bit_p (&lra_inheritance_pseudos, i)
1535 : 2089032 : && lra_reg_info[i].restore_rtx != NULL_RTX)
1536 : 10886068 : || (bitmap_bit_p (&lra_split_regs, i)
1537 : 987613 : && lra_reg_info[i].restore_rtx != NULL_RTX)
1538 : 10199720 : || bitmap_bit_p (&lra_subreg_reload_pseudos, i)
1539 : 10199265 : || bitmap_bit_p (&lra_optional_reload_pseudos, i))
1540 : 85241038 : && reg_renumber[i] < 0 && lra_reg_info[i].nrefs != 0
1541 : 96698080 : && regno_allocno_class_array[i] != NO_REGS)
1542 : 1666350 : sorted_pseudos[n++] = i;
1543 : 1483824 : bitmap_clear (&do_not_assign_nonreload_pseudos);
1544 : 1483824 : if (n != 0 && lra_dump_file != NULL)
1545 : 8 : fprintf (lra_dump_file, " Reassigning non-reload pseudos\n");
1546 : 1483824 : qsort (sorted_pseudos, n, sizeof (int), pseudo_compare_func);
1547 : 3150174 : for (i = 0; i < n; i++)
1548 : : {
1549 : 1666350 : regno = sorted_pseudos[i];
1550 : 1666350 : hard_regno = find_hard_regno_for (regno, &cost, -1, false);
1551 : 1666350 : if (hard_regno >= 0)
1552 : : {
1553 : 186276 : assign_hard_regno (hard_regno, regno);
1554 : : /* We change allocation for non-reload pseudo on this
1555 : : iteration -- mark the pseudo for invalidation of used
1556 : : alternatives of insns containing the pseudo. */
1557 : 186276 : bitmap_set_bit (&changed_pseudo_bitmap, regno);
1558 : : }
1559 : : else
1560 : : {
1561 : 1480074 : enum reg_class rclass = lra_get_allocno_class (regno);
1562 : 1480074 : enum reg_class spill_class;
1563 : :
1564 : 2960148 : if (targetm.spill_class == NULL
1565 : 1480074 : || lra_reg_info[regno].restore_rtx == NULL_RTX
1566 : 423612 : || ! bitmap_bit_p (&lra_inheritance_pseudos, regno)
1567 : 1480074 : || (spill_class
1568 : 407047 : = ((enum reg_class)
1569 : 407047 : targetm.spill_class
1570 : 407047 : ((reg_class_t) rclass,
1571 : 407047 : PSEUDO_REGNO_MODE (regno)))) == NO_REGS)
1572 : 1480074 : continue;
1573 : 0 : regno_allocno_class_array[regno] = spill_class;
1574 : 0 : hard_regno = find_hard_regno_for (regno, &cost, -1, false);
1575 : 0 : if (hard_regno < 0)
1576 : 0 : regno_allocno_class_array[regno] = rclass;
1577 : : else
1578 : : {
1579 : 0 : setup_reg_classes
1580 : 0 : (regno, spill_class, spill_class, spill_class);
1581 : 0 : assign_hard_regno (hard_regno, regno);
1582 : 0 : bitmap_set_bit (&changed_pseudo_bitmap, regno);
1583 : : }
1584 : : }
1585 : : }
1586 : : }
1587 : 1483830 : free (update_hard_regno_preference_check);
1588 : 1483830 : bitmap_clear (&best_spill_pseudos_bitmap);
1589 : 1483830 : bitmap_clear (&spill_pseudos_bitmap);
1590 : 1483830 : bitmap_clear (&insn_conflict_pseudos);
1591 : 1483830 : return fails_p;
1592 : : }
1593 : :
1594 : : /* Entry function to assign hard registers to new reload pseudos
1595 : : starting with LRA_CONSTRAINT_NEW_REGNO_START (by possible spilling
1596 : : of old pseudos) and possibly to the old pseudos. The function adds
1597 : : what insns to process for the next constraint pass. Those are all
1598 : : insns who contains non-reload and non-inheritance pseudos with
1599 : : changed allocation.
1600 : :
1601 : : Return true if we did not spill any non-reload and non-inheritance
1602 : : pseudos. Set up FAILS_P if we failed to assign hard registers to
1603 : : all reload pseudos. */
1604 : : bool
1605 : 1483830 : lra_assign (bool &fails_p)
1606 : : {
1607 : 1483830 : int i;
1608 : 1483830 : unsigned int u;
1609 : 1483830 : bitmap_iterator bi;
1610 : 1483830 : bitmap_head insns_to_process;
1611 : 1483830 : bool no_spills_p;
1612 : 1483830 : int max_regno = max_reg_num ();
1613 : :
1614 : 1483830 : timevar_push (TV_LRA_ASSIGN);
1615 : 1483830 : lra_assignment_iter++;
1616 : 1483830 : if (lra_dump_file != NULL)
1617 : 97 : fprintf (lra_dump_file, "\n********** Assignment #%d: **********\n\n",
1618 : : lra_assignment_iter);
1619 : 1483830 : init_lives ();
1620 : 1483830 : sorted_pseudos = XNEWVEC (int, max_regno);
1621 : 1483830 : sorted_reload_pseudos = XNEWVEC (int, max_regno);
1622 : 1483830 : regno_allocno_class_array = XNEWVEC (enum reg_class, max_regno);
1623 : 1483830 : regno_live_length = XNEWVEC (int, max_regno);
1624 : 96023157 : for (i = FIRST_PSEUDO_REGISTER; i < max_regno; i++)
1625 : : {
1626 : 94539327 : int l;
1627 : 94539327 : lra_live_range_t r;
1628 : :
1629 : 94539327 : regno_allocno_class_array[i] = lra_get_allocno_class (i);
1630 : 151342316 : for (l = 0, r = lra_reg_info[i].live_ranges; r != NULL; r = r->next)
1631 : 56802989 : l += r->finish - r->start + 1;
1632 : 94539327 : regno_live_length[i] = l;
1633 : : }
1634 : 1483830 : former_reload_pseudo_spill_p = false;
1635 : 1483830 : init_regno_assign_info ();
1636 : 1483830 : bitmap_initialize (&all_spilled_pseudos, ®_obstack);
1637 : 1483830 : create_live_range_start_chains ();
1638 : 1483830 : setup_live_pseudos_and_spill_after_risky_transforms (&all_spilled_pseudos);
1639 : 1483830 : if (! lra_hard_reg_split_p && ! lra_asm_error_p && flag_checking)
1640 : : /* Check correctness of allocation but only when there are no hard reg
1641 : : splits and asm errors as in the case of errors explicit insns involving
1642 : : hard regs are added or the asm is removed and this can result in
1643 : : incorrect allocation. */
1644 : 95976078 : for (i = FIRST_PSEUDO_REGISTER; i < max_regno; i++)
1645 : 94492378 : if (lra_reg_info[i].nrefs != 0
1646 : 47707338 : && reg_renumber[i] >= 0
1647 : 94492378 : && overlaps_hard_reg_set_p (lra_reg_info[i].conflict_hard_regs,
1648 : 38711957 : PSEUDO_REGNO_MODE (i), reg_renumber[i]))
1649 : 0 : gcc_unreachable ();
1650 : : /* Setup insns to process on the next constraint pass. */
1651 : 1483830 : bitmap_initialize (&changed_pseudo_bitmap, ®_obstack);
1652 : 1483830 : init_live_reload_and_inheritance_pseudos ();
1653 : 1483830 : fails_p = assign_by_spills ();
1654 : 1483830 : finish_live_reload_and_inheritance_pseudos ();
1655 : 1483830 : bitmap_ior_into (&changed_pseudo_bitmap, &all_spilled_pseudos);
1656 : 1483830 : no_spills_p = true;
1657 : 1746733 : EXECUTE_IF_SET_IN_BITMAP (&all_spilled_pseudos, 0, u, bi)
1658 : : /* We ignore spilled pseudos created on last inheritance pass
1659 : : because they will be removed. */
1660 : 288918 : if (lra_reg_info[u].restore_rtx == NULL_RTX)
1661 : : {
1662 : : no_spills_p = false;
1663 : : break;
1664 : : }
1665 : 1483830 : finish_live_range_start_chains ();
1666 : 1483830 : bitmap_clear (&all_spilled_pseudos);
1667 : 1483830 : bitmap_initialize (&insns_to_process, ®_obstack);
1668 : 3602291 : EXECUTE_IF_SET_IN_BITMAP (&changed_pseudo_bitmap, 0, u, bi)
1669 : 2118461 : bitmap_ior_into (&insns_to_process, &lra_reg_info[u].insn_bitmap);
1670 : 1483830 : bitmap_clear (&changed_pseudo_bitmap);
1671 : 6557741 : EXECUTE_IF_SET_IN_BITMAP (&insns_to_process, 0, u, bi)
1672 : : {
1673 : 5073911 : lra_push_insn_by_uid (u);
1674 : : /* Invalidate alternatives for insn should be processed. */
1675 : 5073911 : lra_set_used_insn_alternative_by_uid (u, -1);
1676 : : }
1677 : 1483830 : bitmap_clear (&insns_to_process);
1678 : 1483830 : finish_regno_assign_info ();
1679 : 1483830 : free (regno_live_length);
1680 : 1483830 : free (regno_allocno_class_array);
1681 : 1483830 : free (sorted_pseudos);
1682 : 1483830 : free (sorted_reload_pseudos);
1683 : 1483830 : finish_lives ();
1684 : 1483830 : timevar_pop (TV_LRA_ASSIGN);
1685 : 1483830 : if (former_reload_pseudo_spill_p)
1686 : 1804 : lra_assignment_iter_after_spill++;
1687 : : /* This is conditional on flag_checking because valid code can take
1688 : : more than this maximum number of iteration, but at the same time
1689 : : the test can uncover errors in machine descriptions. */
1690 : 1483830 : if (flag_checking
1691 : 1483810 : && (lra_assignment_iter_after_spill
1692 : 1483810 : > LRA_MAX_ASSIGNMENT_ITERATION_NUMBER))
1693 : 0 : internal_error
1694 : 0 : ("maximum number of LRA assignment passes is achieved (%d)",
1695 : : LRA_MAX_ASSIGNMENT_ITERATION_NUMBER);
1696 : : /* Reset the assignment correctness flag: */
1697 : 1483830 : check_and_force_assignment_correctness_p = false;
1698 : 1483830 : return no_spills_p;
1699 : : }
1700 : :
1701 : : /* Find start and finish insns for reload pseudo REGNO. Return true
1702 : : if we managed to find the expected insns. Return false,
1703 : : otherwise. */
1704 : : static bool
1705 : 369 : find_reload_regno_insns (int regno, rtx_insn * &start, rtx_insn * &finish)
1706 : : {
1707 : 369 : unsigned int uid;
1708 : 369 : bitmap_iterator bi;
1709 : 369 : int insns_num = 0;
1710 : 369 : bool clobber_p = false;
1711 : 369 : rtx_insn *prev_insn, *next_insn;
1712 : 369 : rtx_insn *start_insn = NULL, *first_insn = NULL, *second_insn = NULL;
1713 : :
1714 : 1268 : EXECUTE_IF_SET_IN_BITMAP (&lra_reg_info[regno].insn_bitmap, 0, uid, bi)
1715 : : {
1716 : 899 : if (start_insn == NULL)
1717 : 369 : start_insn = lra_insn_recog_data[uid]->insn;
1718 : 899 : if (GET_CODE (PATTERN (lra_insn_recog_data[uid]->insn)) == CLOBBER)
1719 : : clobber_p = true;
1720 : : else
1721 : 899 : insns_num++;
1722 : : }
1723 : : /* For reload pseudo we should have at most 3 insns besides clobber referring for
1724 : : it: input/output reload insns and the original insn. */
1725 : 369 : if (insns_num > 3)
1726 : : return false;
1727 : 369 : if (clobber_p)
1728 : 0 : insns_num++;
1729 : 369 : if (insns_num > 1)
1730 : : {
1731 : 336 : for (prev_insn = PREV_INSN (start_insn),
1732 : 336 : next_insn = NEXT_INSN (start_insn);
1733 : 17905 : insns_num != 1 && (prev_insn != NULL
1734 : 186 : || (next_insn != NULL && second_insn == NULL)); )
1735 : : {
1736 : : if (prev_insn != NULL)
1737 : : {
1738 : 17569 : if (bitmap_bit_p (&lra_reg_info[regno].insn_bitmap,
1739 : 17569 : INSN_UID (prev_insn)))
1740 : : {
1741 : 134 : first_insn = prev_insn;
1742 : 134 : insns_num--;
1743 : : }
1744 : 17569 : prev_insn = PREV_INSN (prev_insn);
1745 : : }
1746 : 17569 : if (next_insn != NULL && second_insn == NULL)
1747 : : {
1748 : 548 : if (! bitmap_bit_p (&lra_reg_info[regno].insn_bitmap,
1749 : 548 : INSN_UID (next_insn)))
1750 : 338 : next_insn = NEXT_INSN (next_insn);
1751 : : else
1752 : : {
1753 : 210 : second_insn = next_insn;
1754 : 210 : insns_num--;
1755 : : }
1756 : : }
1757 : : }
1758 : 336 : if (insns_num > 1)
1759 : : return false;
1760 : : }
1761 : 150 : start = first_insn != NULL ? first_insn : start_insn;
1762 : 183 : finish = second_insn != NULL ? second_insn : start_insn;
1763 : 183 : return true;
1764 : : }
1765 : :
1766 : : /* Process reload pseudos which did not get a hard reg, split a hard
1767 : : reg live range in live range of a reload pseudo, and then return
1768 : : TRUE. If we did not split a hard reg live range, report an error,
1769 : : and return FALSE. */
1770 : : bool
1771 : 201 : lra_split_hard_reg_for (void)
1772 : : {
1773 : 201 : int i, regno;
1774 : 201 : rtx_insn *insn, *first, *last;
1775 : 201 : unsigned int u;
1776 : 201 : bitmap_iterator bi;
1777 : 201 : enum reg_class rclass;
1778 : 201 : int max_regno = max_reg_num ();
1779 : : /* We did not assign hard regs to reload pseudos after two
1780 : : iterations. Either it's an asm and something is wrong with the
1781 : : constraints, or we have run out of spill registers; error out in
1782 : : either case. */
1783 : 201 : bool asm_p = false, spill_p = false;
1784 : 201 : bitmap_head failed_reload_insns, failed_reload_pseudos, over_split_insns;
1785 : :
1786 : 201 : if (lra_dump_file != NULL)
1787 : 0 : fprintf (lra_dump_file,
1788 : : "\n****** Splitting a hard reg after assignment #%d: ******\n\n",
1789 : : lra_assignment_iter);
1790 : 201 : bitmap_initialize (&failed_reload_pseudos, ®_obstack);
1791 : 201 : bitmap_initialize (&non_reload_pseudos, ®_obstack);
1792 : 201 : bitmap_ior (&non_reload_pseudos, &lra_inheritance_pseudos, &lra_split_regs);
1793 : 201 : bitmap_ior_into (&non_reload_pseudos, &lra_subreg_reload_pseudos);
1794 : 201 : bitmap_ior_into (&non_reload_pseudos, &lra_optional_reload_pseudos);
1795 : 201 : bitmap_initialize (&over_split_insns, ®_obstack);
1796 : 2097 : for (i = lra_constraint_new_regno_start; i < max_regno; i++)
1797 : 811 : if (reg_renumber[i] < 0 && lra_reg_info[i].nrefs != 0
1798 : 656 : && (rclass = lra_get_allocno_class (i)) != NO_REGS
1799 : 2547 : && ! bitmap_bit_p (&non_reload_pseudos, i))
1800 : : {
1801 : 369 : if (! find_reload_regno_insns (i, first, last))
1802 : 186 : continue;
1803 : 183 : if (BLOCK_FOR_INSN (first) == BLOCK_FOR_INSN (last))
1804 : : {
1805 : : /* Check that we are not trying to split over the same insn
1806 : : requiring reloads to avoid splitting the same hard reg twice or
1807 : : more. If we need several hard regs splitting over the same insn
1808 : : it can be finished on the next iterations.
1809 : :
1810 : : The following loop iteration number is small as we split hard
1811 : : reg in a very small range. */
1812 : 353 : for (insn = first;
1813 : 536 : insn != NEXT_INSN (last);
1814 : 353 : insn = NEXT_INSN (insn))
1815 : 362 : if (bitmap_bit_p (&over_split_insns, INSN_UID (insn)))
1816 : : break;
1817 : 183 : if (insn != NEXT_INSN (last)
1818 : 183 : || !spill_hard_reg_in_range (i, rclass, first, last))
1819 : : {
1820 : 23 : bitmap_set_bit (&failed_reload_pseudos, i);
1821 : : }
1822 : : else
1823 : : {
1824 : 304 : for (insn = first;
1825 : 464 : insn != NEXT_INSN (last);
1826 : 304 : insn = NEXT_INSN (insn))
1827 : 304 : bitmap_set_bit (&over_split_insns, INSN_UID (insn));
1828 : : spill_p = true;
1829 : : }
1830 : : }
1831 : : }
1832 : 201 : bitmap_clear (&over_split_insns);
1833 : 201 : if (spill_p)
1834 : : {
1835 : 99 : bitmap_clear (&failed_reload_pseudos);
1836 : 99 : lra_dump_insns_if_possible ("changed func after splitting hard regs");
1837 : 99 : return true;
1838 : : }
1839 : 102 : bitmap_clear (&non_reload_pseudos);
1840 : 102 : bitmap_initialize (&failed_reload_insns, ®_obstack);
1841 : 116 : EXECUTE_IF_SET_IN_BITMAP (&failed_reload_pseudos, 0, u, bi)
1842 : : {
1843 : 14 : regno = u;
1844 : 14 : bitmap_ior_into (&failed_reload_insns,
1845 : 14 : &lra_reg_info[regno].insn_bitmap);
1846 : 14 : lra_setup_reg_renumber
1847 : 28 : (regno, ira_class_hard_regs[lra_get_allocno_class (regno)][0], false);
1848 : : }
1849 : 127 : EXECUTE_IF_SET_IN_BITMAP (&failed_reload_insns, 0, u, bi)
1850 : : {
1851 : 25 : insn = lra_insn_recog_data[u]->insn;
1852 : 25 : if (asm_noperands (PATTERN (insn)) >= 0)
1853 : : {
1854 : 10 : asm_p = true;
1855 : 10 : lra_asm_insn_error (insn);
1856 : : }
1857 : 15 : else if (!asm_p)
1858 : : {
1859 : 0 : error ("unable to find a register to spill");
1860 : 0 : fatal_insn ("this is the insn:", insn);
1861 : : }
1862 : : }
1863 : 102 : bitmap_clear (&failed_reload_pseudos);
1864 : 102 : bitmap_clear (&failed_reload_insns);
1865 : 102 : return false;
1866 : : }
|