Branch data Line data Source code
1 : : /* Top-level LTO routines.
2 : : Copyright (C) 2009-2025 Free Software Foundation, Inc.
3 : : Contributed by CodeSourcery, Inc.
4 : :
5 : : This file is part of GCC.
6 : :
7 : : GCC is free software; you can redistribute it and/or modify it under
8 : : the terms of the GNU General Public License as published by the Free
9 : : Software Foundation; either version 3, or (at your option) any later
10 : : version.
11 : :
12 : : GCC is distributed in the hope that it will be useful, but WITHOUT ANY
13 : : WARRANTY; without even the implied warranty of MERCHANTABILITY or
14 : : FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
15 : : for more details.
16 : :
17 : : You should have received a copy of the GNU General Public License
18 : : along with GCC; see the file COPYING3. If not see
19 : : <http://www.gnu.org/licenses/>. */
20 : :
21 : : #define INCLUDE_STRING
22 : : #include "config.h"
23 : : #include "system.h"
24 : : #include "coretypes.h"
25 : : #include "tm.h"
26 : : #include "function.h"
27 : : #include "bitmap.h"
28 : : #include "basic-block.h"
29 : : #include "tree.h"
30 : : #include "gimple.h"
31 : : #include "cfghooks.h"
32 : : #include "alloc-pool.h"
33 : : #include "tree-pass.h"
34 : : #include "tree-streamer.h"
35 : : #include "cgraph.h"
36 : : #include "opts.h"
37 : : #include "toplev.h"
38 : : #include "stor-layout.h"
39 : : #include "symbol-summary.h"
40 : : #include "tree-vrp.h"
41 : : #include "sreal.h"
42 : : #include "ipa-cp.h"
43 : : #include "ipa-prop.h"
44 : : #include "debug.h"
45 : : #include "lto.h"
46 : : #include "lto-section-names.h"
47 : : #include "splay-tree.h"
48 : : #include "lto-partition.h"
49 : : #include "context.h"
50 : : #include "pass_manager.h"
51 : : #include "ipa-fnsummary.h"
52 : : #include "ipa-utils.h"
53 : : #include "gomp-constants.h"
54 : : #include "lto-symtab.h"
55 : : #include "stringpool.h"
56 : : #include "fold-const.h"
57 : : #include "attribs.h"
58 : : #include "builtins.h"
59 : : #include "lto-common.h"
60 : : #include "opts-jobserver.h"
61 : :
62 : : /* Number of parallel tasks to run. */
63 : : static int lto_parallelism;
64 : :
65 : : #ifdef HAVE_WORKING_FORK
66 : : /* Number of active WPA streaming processes. */
67 : : static int nruns = 0;
68 : : #endif
69 : :
70 : : /* GNU make's jobserver info. */
71 : : static jobserver_info *jinfo = NULL;
72 : :
73 : : /* Return true when NODE has a clone that is analyzed (i.e. we need
74 : : to load its body even if the node itself is not needed). */
75 : :
76 : : static bool
77 : 14996 : has_analyzed_clone_p (struct cgraph_node *node)
78 : : {
79 : 14996 : struct cgraph_node *orig = node;
80 : 14996 : node = node->clones;
81 : 14996 : if (node)
82 : 3309 : while (node != orig)
83 : : {
84 : 3309 : if (node->analyzed)
85 : : return true;
86 : 413 : if (node->clones)
87 : : node = node->clones;
88 : 0 : else if (node->next_sibling_clone)
89 : : node = node->next_sibling_clone;
90 : : else
91 : : {
92 : 0 : while (node != orig && !node->next_sibling_clone)
93 : 0 : node = node->clone_of;
94 : 0 : if (node != orig)
95 : 0 : node = node->next_sibling_clone;
96 : : }
97 : : }
98 : : return false;
99 : : }
100 : :
101 : : /* Read the function body for the function associated with NODE. */
102 : :
103 : : static void
104 : 152594 : lto_materialize_function (struct cgraph_node *node)
105 : : {
106 : 152594 : tree decl;
107 : :
108 : 152594 : decl = node->decl;
109 : : /* Read in functions with body (analyzed nodes)
110 : : and also functions that are needed to produce virtual clones. */
111 : 137260 : if ((node->has_gimple_body_p () && node->analyzed)
112 : 15335 : || node->used_as_abstract_origin
113 : 167590 : || has_analyzed_clone_p (node))
114 : : {
115 : : /* Clones don't need to be read. */
116 : 140494 : if (node->clone_of)
117 : : return;
118 : 117997 : if (DECL_FUNCTION_PERSONALITY (decl) && !first_personality_decl)
119 : 627 : first_personality_decl = DECL_FUNCTION_PERSONALITY (decl);
120 : : /* If the file contains a function with a language specific EH
121 : : personality set or with EH enabled initialize the backend EH
122 : : machinery. */
123 : 117997 : if (DECL_FUNCTION_PERSONALITY (decl)
124 : 117997 : || opt_for_fn (decl, flag_exceptions))
125 : 42040 : lto_init_eh ();
126 : : }
127 : :
128 : : /* Let the middle end know about the function. */
129 : 130097 : rest_of_decl_compilation (decl, 1, 0);
130 : : }
131 : :
132 : : /* Materialize all the bodies for all the nodes in the callgraph. */
133 : :
134 : : static void
135 : 19907 : materialize_cgraph (void)
136 : : {
137 : 19907 : struct cgraph_node *node;
138 : 19907 : timevar_id_t lto_timer;
139 : :
140 : 19907 : if (!quiet_flag)
141 : 0 : fprintf (stderr,
142 : 0 : flag_wpa ? "Materializing decls:" : "Reading function bodies:");
143 : :
144 : : /* Start the appropriate timer depending on the mode that we are
145 : : operating in. */
146 : 19907 : lto_timer = (flag_wpa) ? TV_WHOPR_WPA
147 : 12258 : : (flag_ltrans) ? TV_WHOPR_LTRANS
148 : : : TV_LTO;
149 : 19907 : timevar_push (lto_timer);
150 : :
151 : 415628 : FOR_EACH_FUNCTION (node)
152 : : {
153 : 187907 : if (node->lto_file_data)
154 : : {
155 : 152594 : lto_materialize_function (node);
156 : 152594 : lto_stats.num_input_cgraph_nodes++;
157 : : }
158 : : }
159 : :
160 : 19907 : current_function_decl = NULL;
161 : 19907 : set_cfun (NULL);
162 : :
163 : 19907 : if (!quiet_flag)
164 : 0 : fprintf (stderr, "\n");
165 : :
166 : 19907 : timevar_pop (lto_timer);
167 : 19907 : }
168 : :
169 : : /* Actually stream out ENCODER into TEMP_FILENAME. */
170 : :
171 : : static void
172 : 8010 : stream_out (char *temp_filename, lto_symtab_encoder_t encoder, int part)
173 : : {
174 : 8010 : lto_file *file = lto_obj_file_open (temp_filename, true);
175 : 8010 : if (!file)
176 : 0 : fatal_error (input_location, "%<lto_obj_file_open()%> failed");
177 : 8010 : lto_set_current_out_file (file);
178 : :
179 : 8010 : gcc_assert (!dump_file);
180 : 8010 : streamer_dump_file = dump_begin (TDI_lto_stream_out, NULL, part);
181 : 8010 : ipa_write_optimization_summaries (encoder, part == 0);
182 : :
183 : 8010 : free (CONST_CAST (char *, file->filename));
184 : :
185 : 8010 : lto_set_current_out_file (NULL);
186 : 8010 : lto_obj_file_close (file);
187 : 8010 : free (file);
188 : 8010 : if (streamer_dump_file)
189 : : {
190 : 0 : dump_end (TDI_lto_stream_out, streamer_dump_file);
191 : 0 : streamer_dump_file = NULL;
192 : : }
193 : 8010 : }
194 : :
195 : : /* Wait for forked process and signal errors. */
196 : : #ifdef HAVE_WORKING_FORK
197 : : static void
198 : 0 : wait_for_child ()
199 : : {
200 : 0 : int status;
201 : 0 : do
202 : : {
203 : : #ifndef WCONTINUED
204 : : #define WCONTINUED 0
205 : : #endif
206 : 0 : int w = waitpid (0, &status, WUNTRACED | WCONTINUED);
207 : 0 : if (w == -1)
208 : 0 : fatal_error (input_location, "waitpid failed");
209 : :
210 : 0 : if (WIFEXITED (status) && WEXITSTATUS (status))
211 : 0 : fatal_error (input_location, "streaming subprocess failed");
212 : 0 : else if (WIFSIGNALED (status))
213 : 0 : fatal_error (input_location,
214 : : "streaming subprocess was killed by signal");
215 : : }
216 : 0 : while (!WIFEXITED (status) && !WIFSIGNALED (status));
217 : :
218 : 0 : --nruns;
219 : :
220 : : /* Return token to the jobserver if active. */
221 : 0 : if (jinfo != NULL && jinfo->is_connected)
222 : 0 : jinfo->return_token ();
223 : 0 : }
224 : : #endif
225 : :
226 : : static void
227 : 7994 : stream_out_partitions_1 (char *temp_filename, int blen, int min, int max)
228 : : {
229 : : /* Write all the nodes in SET. */
230 : 16004 : for (int p = min; p < max; p ++)
231 : : {
232 : 8010 : sprintf (temp_filename + blen, "%u.o", p);
233 : 8010 : stream_out (temp_filename, ltrans_partitions[p]->encoder, p);
234 : 8010 : ltrans_partitions[p]->encoder = NULL;
235 : : }
236 : 7994 : }
237 : :
238 : : /* Stream out ENCODER into TEMP_FILENAME
239 : : Fork if that seems to help. */
240 : :
241 : : static void
242 : 7994 : stream_out_partitions (char *temp_filename, int blen, int min, int max,
243 : : bool ARG_UNUSED (last))
244 : : {
245 : : #ifdef HAVE_WORKING_FORK
246 : 7994 : if (lto_parallelism <= 1)
247 : : {
248 : 7457 : stream_out_partitions_1 (temp_filename, blen, min, max);
249 : 7457 : return;
250 : : }
251 : :
252 : 537 : if (lto_parallelism > 0 && nruns >= lto_parallelism)
253 : 0 : wait_for_child ();
254 : :
255 : : /* If this is not the last parallel partition, execute new
256 : : streaming process. */
257 : 537 : if (!last)
258 : : {
259 : 345 : if (jinfo != NULL && jinfo->is_connected)
260 : 345 : while (true)
261 : : {
262 : 345 : if (jinfo->get_token ())
263 : : break;
264 : 345 : if (nruns > 0)
265 : 0 : wait_for_child ();
266 : : else
267 : : {
268 : : /* There are no free tokens, lets do the job outselves. */
269 : 345 : stream_out_partitions_1 (temp_filename, blen, min, max);
270 : 345 : asm_nodes_output = true;
271 : 345 : return;
272 : : }
273 : : }
274 : :
275 : 0 : pid_t cpid = fork ();
276 : :
277 : 0 : if (!cpid)
278 : : {
279 : 0 : setproctitle ("lto1-wpa-streaming");
280 : 0 : stream_out_partitions_1 (temp_filename, blen, min, max);
281 : 0 : exit (0);
282 : : }
283 : : /* Fork failed; lets do the job ourseleves. */
284 : 0 : else if (cpid == -1)
285 : 0 : stream_out_partitions_1 (temp_filename, blen, min, max);
286 : : else
287 : 0 : nruns++;
288 : : }
289 : : /* Last partition; stream it and wait for all children to die. */
290 : : else
291 : : {
292 : 192 : stream_out_partitions_1 (temp_filename, blen, min, max);
293 : 384 : while (nruns > 0)
294 : 0 : wait_for_child ();
295 : :
296 : 192 : if (jinfo != NULL && jinfo->is_connected)
297 : 192 : jinfo->disconnect ();
298 : : }
299 : 192 : asm_nodes_output = true;
300 : : #else
301 : : stream_out_partitions_1 (temp_filename, blen, min, max);
302 : : #endif
303 : : }
304 : :
305 : : /* Write all output files in WPA mode and the file with the list of
306 : : LTRANS units. */
307 : :
308 : : static void
309 : 7649 : lto_wpa_write_files (void)
310 : : {
311 : 7649 : unsigned i, n_sets;
312 : 7649 : ltrans_partition part;
313 : 7649 : FILE *ltrans_output_list_stream;
314 : 7649 : char *temp_filename;
315 : 7649 : auto_vec <char *>temp_filenames;
316 : 7649 : auto_vec <int>temp_priority;
317 : 7649 : size_t blen;
318 : :
319 : : /* Open the LTRANS output list. */
320 : 7649 : if (!ltrans_output_list)
321 : 0 : fatal_error (input_location, "no LTRANS output list filename provided");
322 : :
323 : 7649 : timevar_push (TV_WHOPR_WPA);
324 : :
325 : 23308 : FOR_EACH_VEC_ELT (ltrans_partitions, i, part)
326 : 16020 : lto_stats.num_output_symtab_nodes
327 : 16011 : += lto_symtab_encoder_size (part->encoder);
328 : :
329 : 7649 : timevar_pop (TV_WHOPR_WPA);
330 : :
331 : 7649 : timevar_push (TV_WHOPR_WPA_IO);
332 : :
333 : 7649 : cgraph_node *node;
334 : : /* Do body modifications needed for streaming before we fork out
335 : : worker processes. */
336 : 175890 : FOR_EACH_FUNCTION (node)
337 : 80296 : if (!node->clone_of && gimple_has_body_p (node->decl))
338 : 5415 : lto_prepare_function_for_streaming (node);
339 : :
340 : 7649 : ggc_trim ();
341 : 7649 : report_heap_memory_use ();
342 : :
343 : : /* Generate a prefix for the LTRANS unit files. */
344 : 7649 : blen = strlen (ltrans_output_list);
345 : 7649 : temp_filename = (char *) xmalloc (blen + sizeof ("2147483648.o"));
346 : 7649 : strcpy (temp_filename, ltrans_output_list);
347 : 7649 : if (blen > sizeof (".out")
348 : 7649 : && strcmp (temp_filename + blen - sizeof (".out") + 1,
349 : : ".out") == 0)
350 : 7649 : temp_filename[blen - sizeof (".out") + 1] = '\0';
351 : 7649 : blen = strlen (temp_filename);
352 : :
353 : 7649 : n_sets = ltrans_partitions.length ();
354 : 7649 : unsigned sets_per_worker = n_sets;
355 : 7649 : if (lto_parallelism > 1)
356 : : {
357 : 7571 : if (lto_parallelism > (int)n_sets)
358 : 7567 : lto_parallelism = n_sets;
359 : 7571 : sets_per_worker = (n_sets + lto_parallelism - 1) / lto_parallelism;
360 : : }
361 : :
362 : 15659 : for (i = 0; i < n_sets; i++)
363 : : {
364 : 8010 : ltrans_partition part = ltrans_partitions[i];
365 : :
366 : : /* Write all the nodes in SET. */
367 : 8010 : sprintf (temp_filename + blen, "%u.o", i);
368 : :
369 : 8010 : if (!quiet_flag)
370 : 0 : fprintf (stderr, " %s (%s %i insns)", temp_filename, part->name,
371 : : part->insns);
372 : 8010 : if (symtab->dump_file)
373 : : {
374 : 1 : lto_symtab_encoder_iterator lsei;
375 : :
376 : 1 : fprintf (symtab->dump_file,
377 : : "Writing partition %s to file %s, %i insns\n",
378 : : part->name, temp_filename, part->insns);
379 : 1 : fprintf (symtab->dump_file, " Symbols in partition: ");
380 : 1 : for (lsei = lsei_start_in_partition (part->encoder);
381 : 8 : !lsei_end_p (lsei);
382 : 7 : lsei_next_in_partition (&lsei))
383 : : {
384 : 7 : symtab_node *node = lsei_node (lsei);
385 : 7 : fprintf (symtab->dump_file, "%s ", node->dump_asm_name ());
386 : : }
387 : 1 : fprintf (symtab->dump_file, "\n Symbols in boundary: ");
388 : 8 : for (lsei = lsei_start (part->encoder); !lsei_end_p (lsei);
389 : 7 : lsei_next (&lsei))
390 : : {
391 : 7 : symtab_node *node = lsei_node (lsei);
392 : 7 : if (!lto_symtab_encoder_in_partition_p (part->encoder, node))
393 : : {
394 : 0 : fprintf (symtab->dump_file, "%s ", node->dump_asm_name ());
395 : 0 : cgraph_node *cnode = dyn_cast <cgraph_node *> (node);
396 : 0 : if (cnode
397 : 0 : && lto_symtab_encoder_encode_body_p (part->encoder,
398 : : cnode))
399 : 0 : fprintf (symtab->dump_file, "(body included)");
400 : : else
401 : : {
402 : 7 : varpool_node *vnode = dyn_cast <varpool_node *> (node);
403 : 0 : if (vnode
404 : 0 : && lto_symtab_encoder_encode_initializer_p (part->encoder,
405 : : vnode))
406 : 0 : fprintf (symtab->dump_file, "(initializer included)");
407 : : }
408 : : }
409 : : }
410 : 1 : fprintf (symtab->dump_file, "\n");
411 : : }
412 : 8010 : gcc_checking_assert (lto_symtab_encoder_size (part->encoder) || !i);
413 : :
414 : 8010 : temp_priority.safe_push (part->insns);
415 : 8010 : temp_filenames.safe_push (xstrdup (temp_filename));
416 : : }
417 : 7649 : memory_block_pool::trim (0);
418 : :
419 : 15643 : for (int set = 0; set < MAX (lto_parallelism, 1); set++)
420 : : {
421 : 7994 : stream_out_partitions (temp_filename, blen, set * sets_per_worker,
422 : 7994 : MIN ((set + 1) * sets_per_worker, n_sets),
423 : 7994 : set == MAX (lto_parallelism, 1) - 1);
424 : : }
425 : :
426 : 7649 : ltrans_output_list_stream = fopen (ltrans_output_list, "w");
427 : 7649 : if (ltrans_output_list_stream == NULL)
428 : 0 : fatal_error (input_location,
429 : : "opening LTRANS output list %s: %m", ltrans_output_list);
430 : 15659 : for (i = 0; i < n_sets; i++)
431 : : {
432 : 8010 : unsigned int len = strlen (temp_filenames[i]);
433 : 8010 : if (fprintf (ltrans_output_list_stream, "%i\n", temp_priority[i]) < 0
434 : 8010 : || fwrite (temp_filenames[i], 1, len, ltrans_output_list_stream) < len
435 : 16020 : || fwrite ("\n", 1, 1, ltrans_output_list_stream) < 1)
436 : 0 : fatal_error (input_location, "writing to LTRANS output list %s: %m",
437 : : ltrans_output_list);
438 : 8010 : free (temp_filenames[i]);
439 : : }
440 : :
441 : 7649 : lto_stats.num_output_files += n_sets;
442 : :
443 : : /* Close the LTRANS output list. */
444 : 7649 : if (fclose (ltrans_output_list_stream))
445 : 0 : fatal_error (input_location,
446 : : "closing LTRANS output list %s: %m", ltrans_output_list);
447 : :
448 : 7649 : free_ltrans_partitions ();
449 : 7649 : free (temp_filename);
450 : :
451 : 7649 : timevar_pop (TV_WHOPR_WPA_IO);
452 : 7649 : }
453 : :
454 : : /* Create artificial pointers for "omp declare target link" vars. */
455 : :
456 : : static void
457 : 4248 : offload_handle_link_vars (void)
458 : : {
459 : : #ifdef ACCEL_COMPILER
460 : : varpool_node *var;
461 : : FOR_EACH_VARIABLE (var)
462 : : if (lookup_attribute ("omp declare target link",
463 : : DECL_ATTRIBUTES (var->decl)))
464 : : {
465 : : tree type = build_pointer_type (TREE_TYPE (var->decl));
466 : : tree link_ptr_var = build_decl (UNKNOWN_LOCATION, VAR_DECL,
467 : : clone_function_name (var->decl,
468 : : "linkptr"), type);
469 : : TREE_USED (link_ptr_var) = 1;
470 : : TREE_STATIC (link_ptr_var) = 1;
471 : : TREE_PUBLIC (link_ptr_var) = TREE_PUBLIC (var->decl);
472 : : DECL_ARTIFICIAL (link_ptr_var) = 1;
473 : : SET_DECL_ASSEMBLER_NAME (link_ptr_var, DECL_NAME (link_ptr_var));
474 : : SET_DECL_VALUE_EXPR (var->decl, build_simple_mem_ref (link_ptr_var));
475 : : DECL_HAS_VALUE_EXPR_P (var->decl) = 1;
476 : : }
477 : : #endif
478 : 4248 : }
479 : :
480 : : /* Perform whole program analysis (WPA) on the callgraph and write out the
481 : : optimization plan. */
482 : :
483 : : static void
484 : 7649 : do_whole_program_analysis (void)
485 : : {
486 : 7649 : symtab_node *node;
487 : :
488 : 7649 : lto_parallelism = 1;
489 : :
490 : 7649 : if (!strcmp (flag_wpa, "jobserver"))
491 : : {
492 : 7571 : jinfo = new jobserver_info ();
493 : 7571 : if (jinfo->is_active)
494 : 7571 : jinfo->connect ();
495 : :
496 : 7571 : lto_parallelism = param_max_lto_streaming_parallelism;
497 : : }
498 : : else
499 : : {
500 : 78 : lto_parallelism = atoi (flag_wpa);
501 : 78 : if (lto_parallelism <= 0)
502 : 78 : lto_parallelism = 0;
503 : 78 : if (lto_parallelism >= param_max_lto_streaming_parallelism)
504 : 0 : lto_parallelism = param_max_lto_streaming_parallelism;
505 : : }
506 : :
507 : 7649 : timevar_start (TV_PHASE_OPT_GEN);
508 : :
509 : : /* Note that since we are in WPA mode, materialize_cgraph will not
510 : : actually read in all the function bodies. It only materializes
511 : : the decls and cgraph nodes so that analysis can be performed. */
512 : 7649 : materialize_cgraph ();
513 : :
514 : : /* Reading in the cgraph uses different timers, start timing WPA now. */
515 : 7649 : timevar_push (TV_WHOPR_WPA);
516 : :
517 : 7649 : if (pre_ipa_mem_report)
518 : 0 : dump_memory_report ("Memory consumption before IPA");
519 : :
520 : 7649 : symtab->function_flags_ready = true;
521 : :
522 : 7649 : if (symtab->dump_file)
523 : 1 : symtab->dump (symtab->dump_file);
524 : 7649 : bitmap_obstack_initialize (NULL);
525 : 7649 : symtab->state = IPA_SSA;
526 : :
527 : 7649 : execute_ipa_pass_list (g->get_passes ()->all_regular_ipa_passes);
528 : :
529 : : /* When WPA analysis raises errors, do not bother to output anything. */
530 : 7649 : if (seen_error ())
531 : : return;
532 : :
533 : : /* We are about to launch the final LTRANS phase, stop the WPA timer. */
534 : 7649 : timevar_pop (TV_WHOPR_WPA);
535 : :
536 : : /* We are no longer going to stream in anything. Free some memory. */
537 : 7649 : lto_free_file_name_hash ();
538 : :
539 : :
540 : 7649 : timevar_push (TV_WHOPR_PARTITIONING);
541 : :
542 : 7649 : gcc_assert (!dump_file);
543 : 7649 : dump_file = dump_begin (partition_dump_id, NULL);
544 : :
545 : 7649 : if (dump_file)
546 : 0 : symtab->dump (dump_file);
547 : :
548 : 7649 : symtab_node::checking_verify_symtab_nodes ();
549 : 7649 : bitmap_obstack_release (NULL);
550 : 7649 : if (flag_ipa_reorder_for_locality)
551 : 0 : lto_locality_map (param_max_locality_partition_size);
552 : 7649 : else if (flag_lto_partition == LTO_PARTITION_1TO1)
553 : 295 : lto_1_to_1_map ();
554 : : else if (flag_lto_partition == LTO_PARTITION_MAX)
555 : 12 : lto_max_map ();
556 : : else if (flag_lto_partition == LTO_PARTITION_ONE)
557 : 70 : lto_balanced_map (1, INT_MAX);
558 : : else if (flag_lto_partition == LTO_PARTITION_BALANCED)
559 : 7272 : lto_balanced_map (param_lto_partitions,
560 : : param_max_partition_size);
561 : : else if (flag_lto_partition == LTO_PARTITION_CACHE)
562 : 0 : lto_cache_map (param_lto_partitions, param_max_partition_size);
563 : : else
564 : 0 : gcc_unreachable ();
565 : :
566 : : /* Size summaries are needed for balanced partitioning. Free them now so
567 : : the memory can be used for streamer caches. */
568 : 7649 : ipa_free_size_summary ();
569 : :
570 : : /* AUX pointers are used by partitioning code to bookkeep number of
571 : : partitions symbol is in. This is no longer needed. */
572 : 111966 : FOR_EACH_SYMBOL (node)
573 : 104317 : node->aux = NULL;
574 : :
575 : 7649 : lto_stats.num_cgraph_partitions += ltrans_partitions.length ();
576 : :
577 : : /* Find out statics that need to be promoted
578 : : to globals with hidden visibility because they are accessed from multiple
579 : : partitions. */
580 : 7649 : lto_promote_cross_file_statics ();
581 : 7649 : offload_handle_link_vars ();
582 : 7649 : if (dump_file)
583 : 0 : dump_end (partition_dump_id, dump_file);
584 : 7649 : dump_file = NULL;
585 : 7649 : timevar_pop (TV_WHOPR_PARTITIONING);
586 : :
587 : 7649 : timevar_stop (TV_PHASE_OPT_GEN);
588 : :
589 : : /* Collect a last time - in lto_wpa_write_files we may end up forking
590 : : with the idea that this doesn't increase memory usage. So we
591 : : absoultely do not want to collect after that. */
592 : 7649 : ggc_collect ();
593 : :
594 : 7649 : timevar_start (TV_PHASE_STREAM_OUT);
595 : 7649 : if (!quiet_flag)
596 : : {
597 : 0 : fprintf (stderr, "\nStreaming out");
598 : 0 : fflush (stderr);
599 : : }
600 : 7649 : lto_wpa_write_files ();
601 : 7649 : if (!quiet_flag)
602 : 0 : fprintf (stderr, "\n");
603 : 7649 : timevar_stop (TV_PHASE_STREAM_OUT);
604 : :
605 : 7649 : if (post_ipa_mem_report)
606 : 0 : dump_memory_report ("Memory consumption after IPA");
607 : :
608 : : /* Show the LTO report before launching LTRANS. */
609 : 7649 : if (flag_lto_report || (flag_wpa && flag_lto_report_wpa))
610 : 0 : print_lto_report_1 ();
611 : 7649 : if (mem_report_wpa)
612 : 0 : dump_memory_report ("Final");
613 : : }
614 : :
615 : : unsigned int
616 : 43453 : lto_option_lang_mask (void)
617 : : {
618 : 43453 : return CL_LTO;
619 : : }
620 : :
621 : : /* Main entry point for the GIMPLE front end. This front end has
622 : : three main personalities:
623 : :
624 : : - LTO (-flto). All the object files on the command line are
625 : : loaded in memory and processed as a single translation unit.
626 : : This is the traditional link-time optimization behavior.
627 : :
628 : : - WPA (-fwpa). Only the callgraph and summary information for
629 : : files in the command file are loaded. A single callgraph
630 : : (without function bodies) is instantiated for the whole set of
631 : : files. IPA passes are only allowed to analyze the call graph
632 : : and make transformation decisions. The callgraph is
633 : : partitioned, each partition is written to a new object file
634 : : together with the transformation decisions.
635 : :
636 : : - LTRANS (-fltrans). Similar to -flto but it prevents the IPA
637 : : summary files from running again. Since WPA computed summary
638 : : information and decided what transformations to apply, LTRANS
639 : : simply applies them. */
640 : :
641 : : void
642 : 19907 : lto_main (void)
643 : : {
644 : : /* LTO is called as a front end, even though it is not a front end.
645 : : Because it is called as a front end, TV_PHASE_PARSING and
646 : : TV_PARSE_GLOBAL are active, and we need to turn them off while
647 : : doing LTO. Later we turn them back on so they are active up in
648 : : toplev.cc. */
649 : 19907 : timevar_pop (TV_PARSE_GLOBAL);
650 : 19907 : timevar_stop (TV_PHASE_PARSING);
651 : :
652 : 19907 : timevar_start (TV_PHASE_SETUP);
653 : :
654 : : /* Initialize the LTO front end. */
655 : 19907 : lto_fe_init ();
656 : :
657 : 19907 : timevar_stop (TV_PHASE_SETUP);
658 : 19907 : timevar_start (TV_PHASE_STREAM_IN);
659 : :
660 : : /* Read all the symbols and call graph from all the files in the
661 : : command line. */
662 : 19907 : read_cgraph_and_symbols (num_in_fnames, in_fnames);
663 : :
664 : 19907 : timevar_stop (TV_PHASE_STREAM_IN);
665 : :
666 : 19907 : if (!seen_error ())
667 : : {
668 : 19907 : offload_handle_link_vars ();
669 : :
670 : : /* If WPA is enabled analyze the whole call graph and create an
671 : : optimization plan. Otherwise, read in all the function
672 : : bodies and continue with optimization. */
673 : 19907 : if (flag_wpa)
674 : 7649 : do_whole_program_analysis ();
675 : : else
676 : : {
677 : 12258 : timevar_start (TV_PHASE_OPT_GEN);
678 : :
679 : 12258 : materialize_cgraph ();
680 : 12258 : if (!flag_ltrans)
681 : : {
682 : 4248 : lto_promote_statics_nonwpa ();
683 : 4248 : offload_handle_link_vars ();
684 : : }
685 : :
686 : : /* Annotate the CU DIE and mark the early debug phase as finished. */
687 : 12258 : debuginfo_early_start ();
688 : 12258 : debug_hooks->early_finish ("<artificial>");
689 : 12258 : debuginfo_early_stop ();
690 : :
691 : : /* Let the middle end know that we have read and merged all of
692 : : the input files. */
693 : 12258 : symtab->compile ();
694 : :
695 : 12258 : timevar_stop (TV_PHASE_OPT_GEN);
696 : :
697 : : /* FIXME lto, if the processes spawned by WPA fail, we miss
698 : : the chance to print WPA's report, so WPA will call
699 : : print_lto_report before launching LTRANS. If LTRANS was
700 : : launched directly by the driver we would not need to do
701 : : this. */
702 : 12258 : if (flag_lto_report || (flag_wpa && flag_lto_report_wpa))
703 : 0 : print_lto_report_1 ();
704 : : }
705 : : }
706 : :
707 : : /* Here we make LTO pretend to be a parser. */
708 : 19907 : timevar_start (TV_PHASE_PARSING);
709 : 19907 : timevar_push (TV_PARSE_GLOBAL);
710 : 19907 : }
|