LCOV - code coverage report
Current view: top level - gcc - ipa-cp.cc (source / functions) Coverage Total Hit
Test: gcc.info Lines: 91.1 % 3030 2761
Test Date: 2024-12-21 13:15:12 Functions: 93.1 % 159 148
Legend: Lines: hit not hit | Branches: + taken - not taken # not executed Branches: - 0 0

             Branch data     Line data    Source code
       1                 :             : /* Interprocedural constant propagation
       2                 :             :    Copyright (C) 2005-2024 Free Software Foundation, Inc.
       3                 :             : 
       4                 :             :    Contributed by Razya Ladelsky <RAZYA@il.ibm.com> and Martin Jambor
       5                 :             :    <mjambor@suse.cz>
       6                 :             : 
       7                 :             : This file is part of GCC.
       8                 :             : 
       9                 :             : GCC is free software; you can redistribute it and/or modify it under
      10                 :             : the terms of the GNU General Public License as published by the Free
      11                 :             : Software Foundation; either version 3, or (at your option) any later
      12                 :             : version.
      13                 :             : 
      14                 :             : GCC is distributed in the hope that it will be useful, but WITHOUT ANY
      15                 :             : WARRANTY; without even the implied warranty of MERCHANTABILITY or
      16                 :             : FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
      17                 :             : for more details.
      18                 :             : 
      19                 :             : You should have received a copy of the GNU General Public License
      20                 :             : along with GCC; see the file COPYING3.  If not see
      21                 :             : <http://www.gnu.org/licenses/>.  */
      22                 :             : 
      23                 :             : /* Interprocedural constant propagation (IPA-CP).
      24                 :             : 
      25                 :             :    The goal of this transformation is to
      26                 :             : 
      27                 :             :    1) discover functions which are always invoked with some arguments with the
      28                 :             :       same known constant values and modify the functions so that the
      29                 :             :       subsequent optimizations can take advantage of the knowledge, and
      30                 :             : 
      31                 :             :    2) partial specialization - create specialized versions of functions
      32                 :             :       transformed in this way if some parameters are known constants only in
      33                 :             :       certain contexts but the estimated tradeoff between speedup and cost size
      34                 :             :       is deemed good.
      35                 :             : 
      36                 :             :    The algorithm also propagates types and attempts to perform type based
      37                 :             :    devirtualization.  Types are propagated much like constants.
      38                 :             : 
      39                 :             :    The algorithm basically consists of three stages.  In the first, functions
      40                 :             :    are analyzed one at a time and jump functions are constructed for all known
      41                 :             :    call-sites.  In the second phase, the pass propagates information from the
      42                 :             :    jump functions across the call to reveal what values are available at what
      43                 :             :    call sites, performs estimations of effects of known values on functions and
      44                 :             :    their callees, and finally decides what specialized extra versions should be
      45                 :             :    created.  In the third, the special versions materialize and appropriate
      46                 :             :    calls are redirected.
      47                 :             : 
      48                 :             :    The algorithm used is to a certain extent based on "Interprocedural Constant
      49                 :             :    Propagation", by David Callahan, Keith D Cooper, Ken Kennedy, Linda Torczon,
      50                 :             :    Comp86, pg 152-161 and "A Methodology for Procedure Cloning" by Keith D
      51                 :             :    Cooper, Mary W. Hall, and Ken Kennedy.
      52                 :             : 
      53                 :             : 
      54                 :             :    First stage - intraprocedural analysis
      55                 :             :    =======================================
      56                 :             : 
      57                 :             :    This phase computes jump_function and modification flags.
      58                 :             : 
      59                 :             :    A jump function for a call-site represents the values passed as an actual
      60                 :             :    arguments of a given call-site. In principle, there are three types of
      61                 :             :    values:
      62                 :             : 
      63                 :             :    Pass through - the caller's formal parameter is passed as an actual
      64                 :             :                   argument, plus an operation on it can be performed.
      65                 :             :    Constant - a constant is passed as an actual argument.
      66                 :             :    Unknown - neither of the above.
      67                 :             : 
      68                 :             :    All jump function types are described in detail in ipa-prop.h, together with
      69                 :             :    the data structures that represent them and methods of accessing them.
      70                 :             : 
      71                 :             :    ipcp_generate_summary() is the main function of the first stage.
      72                 :             : 
      73                 :             :    Second stage - interprocedural analysis
      74                 :             :    ========================================
      75                 :             : 
      76                 :             :    This stage is itself divided into two phases.  In the first, we propagate
      77                 :             :    known values over the call graph, in the second, we make cloning decisions.
      78                 :             :    It uses a different algorithm than the original Callahan's paper.
      79                 :             : 
      80                 :             :    First, we traverse the functions topologically from callers to callees and,
      81                 :             :    for each strongly connected component (SCC), we propagate constants
      82                 :             :    according to previously computed jump functions.  We also record what known
      83                 :             :    values depend on other known values and estimate local effects.  Finally, we
      84                 :             :    propagate cumulative information about these effects from dependent values
      85                 :             :    to those on which they depend.
      86                 :             : 
      87                 :             :    Second, we again traverse the call graph in the same topological order and
      88                 :             :    make clones for functions which we know are called with the same values in
      89                 :             :    all contexts and decide about extra specialized clones of functions just for
      90                 :             :    some contexts - these decisions are based on both local estimates and
      91                 :             :    cumulative estimates propagated from callees.
      92                 :             : 
      93                 :             :    ipcp_propagate_stage() and ipcp_decision_stage() together constitute the
      94                 :             :    third stage.
      95                 :             : 
      96                 :             :    Third phase - materialization of clones, call statement updates.
      97                 :             :    ============================================
      98                 :             : 
      99                 :             :    This stage is currently performed by call graph code (mainly in cgraphunit.cc
     100                 :             :    and tree-inline.cc) according to instructions inserted to the call graph by
     101                 :             :    the second stage.  */
     102                 :             : 
     103                 :             : #define INCLUDE_ALGORITHM
     104                 :             : #include "config.h"
     105                 :             : #include "system.h"
     106                 :             : #include "coretypes.h"
     107                 :             : #include "backend.h"
     108                 :             : #include "tree.h"
     109                 :             : #include "gimple-expr.h"
     110                 :             : #include "gimple.h"
     111                 :             : #include "predict.h"
     112                 :             : #include "sreal.h"
     113                 :             : #include "alloc-pool.h"
     114                 :             : #include "tree-pass.h"
     115                 :             : #include "cgraph.h"
     116                 :             : #include "diagnostic.h"
     117                 :             : #include "fold-const.h"
     118                 :             : #include "gimple-iterator.h"
     119                 :             : #include "gimple-fold.h"
     120                 :             : #include "symbol-summary.h"
     121                 :             : #include "tree-vrp.h"
     122                 :             : #include "ipa-cp.h"
     123                 :             : #include "ipa-prop.h"
     124                 :             : #include "tree-pretty-print.h"
     125                 :             : #include "tree-inline.h"
     126                 :             : #include "ipa-fnsummary.h"
     127                 :             : #include "ipa-utils.h"
     128                 :             : #include "tree-ssa-ccp.h"
     129                 :             : #include "stringpool.h"
     130                 :             : #include "attribs.h"
     131                 :             : #include "dbgcnt.h"
     132                 :             : #include "symtab-clones.h"
     133                 :             : #include "gimple-range.h"
     134                 :             : 
     135                 :             : 
     136                 :             : /* Allocation pools for values and their sources in ipa-cp.  */
     137                 :             : 
     138                 :             : object_allocator<ipcp_value<tree> > ipcp_cst_values_pool
     139                 :             :   ("IPA-CP constant values");
     140                 :             : 
     141                 :             : object_allocator<ipcp_value<ipa_polymorphic_call_context> >
     142                 :             :   ipcp_poly_ctx_values_pool ("IPA-CP polymorphic contexts");
     143                 :             : 
     144                 :             : object_allocator<ipcp_value_source<tree> > ipcp_sources_pool
     145                 :             :   ("IPA-CP value sources");
     146                 :             : 
     147                 :             : object_allocator<ipcp_agg_lattice> ipcp_agg_lattice_pool
     148                 :             :   ("IPA_CP aggregate lattices");
     149                 :             : 
     150                 :             : /* Base count to use in heuristics when using profile feedback.  */
     151                 :             : 
     152                 :             : static profile_count base_count;
     153                 :             : 
     154                 :             : /* Original overall size of the program.  */
     155                 :             : 
     156                 :             : static long overall_size, orig_overall_size;
     157                 :             : 
     158                 :             : /* Node name to unique clone suffix number map.  */
     159                 :             : static hash_map<const char *, unsigned> *clone_num_suffixes;
     160                 :             : 
     161                 :             : /* Return the param lattices structure corresponding to the Ith formal
     162                 :             :    parameter of the function described by INFO.  */
     163                 :             : static inline class ipcp_param_lattices *
     164                 :    27448917 : ipa_get_parm_lattices (class ipa_node_params *info, int i)
     165                 :             : {
     166                 :    54897834 :   gcc_assert (i >= 0 && i < ipa_get_param_count (info));
     167                 :    27448917 :   gcc_checking_assert (!info->ipcp_orig_node);
     168                 :    27448917 :   return &(info->lattices[i]);
     169                 :             : }
     170                 :             : 
     171                 :             : /* Return the lattice corresponding to the scalar value of the Ith formal
     172                 :             :    parameter of the function described by INFO.  */
     173                 :             : static inline ipcp_lattice<tree> *
     174                 :     5093138 : ipa_get_scalar_lat (class ipa_node_params *info, int i)
     175                 :             : {
     176                 :    10186276 :   class ipcp_param_lattices *plats = ipa_get_parm_lattices (info, i);
     177                 :     5093138 :   return &plats->itself;
     178                 :             : }
     179                 :             : 
     180                 :             : /* Return the lattice corresponding to the scalar value of the Ith formal
     181                 :             :    parameter of the function described by INFO.  */
     182                 :             : static inline ipcp_lattice<ipa_polymorphic_call_context> *
     183                 :      242063 : ipa_get_poly_ctx_lat (class ipa_node_params *info, int i)
     184                 :             : {
     185                 :      484126 :   class ipcp_param_lattices *plats = ipa_get_parm_lattices (info, i);
     186                 :      242063 :   return &plats->ctxlat;
     187                 :             : }
     188                 :             : 
     189                 :             : /* Return whether LAT is a lattice with a single constant and without an
     190                 :             :    undefined value.  */
     191                 :             : 
     192                 :             : template <typename valtype>
     193                 :             : inline bool
     194                 :    10218147 : ipcp_lattice<valtype>::is_single_const ()
     195                 :             : {
     196                 :     1126596 :   if (bottom || contains_variable || values_count != 1)
     197                 :             :     return false;
     198                 :             :   else
     199                 :             :     return true;
     200                 :             : }
     201                 :             : 
     202                 :             : /* Return true iff X and Y should be considered equal values by IPA-CP.  */
     203                 :             : 
     204                 :             : bool
     205                 :      846294 : values_equal_for_ipcp_p (tree x, tree y)
     206                 :             : {
     207                 :      846294 :   gcc_checking_assert (x != NULL_TREE && y != NULL_TREE);
     208                 :             : 
     209                 :      846294 :   if (x == y)
     210                 :             :     return true;
     211                 :             : 
     212                 :      516082 :   if (TREE_CODE (x) == ADDR_EXPR
     213                 :      149134 :       && TREE_CODE (y) == ADDR_EXPR
     214                 :      148833 :       && (TREE_CODE (TREE_OPERAND (x, 0)) == CONST_DECL
     215                 :      131880 :           || (TREE_CODE (TREE_OPERAND (x, 0)) == VAR_DECL
     216                 :       80009 :               && DECL_IN_CONSTANT_POOL (TREE_OPERAND (x, 0))))
     217                 :      533035 :       && (TREE_CODE (TREE_OPERAND (y, 0)) == CONST_DECL
     218                 :          10 :           || (TREE_CODE (TREE_OPERAND (y, 0)) == VAR_DECL
     219                 :           5 :               && DECL_IN_CONSTANT_POOL (TREE_OPERAND (y, 0)))))
     220                 :       16943 :     return TREE_OPERAND (x, 0) == TREE_OPERAND (y, 0)
     221                 :       33843 :            || operand_equal_p (DECL_INITIAL (TREE_OPERAND (x, 0)),
     222                 :       16900 :                                DECL_INITIAL (TREE_OPERAND (y, 0)), 0);
     223                 :             :   else
     224                 :      499139 :     return operand_equal_p (x, y, 0);
     225                 :             : }
     226                 :             : 
     227                 :             : /* Print V which is extracted from a value in a lattice to F.  This overloaded
     228                 :             :    function is used to print tree constants.  */
     229                 :             : 
     230                 :             : static void
     231                 :         570 : print_ipcp_constant_value (FILE * f, tree v)
     232                 :             : {
     233                 :           0 :   ipa_print_constant_value (f, v);
     234                 :           0 : }
     235                 :             : 
     236                 :             : /* Print V which is extracted from a value in a lattice to F.  This overloaded
     237                 :             :    function is used to print constant polymorphic call contexts.  */
     238                 :             : 
     239                 :             : static void
     240                 :         171 : print_ipcp_constant_value (FILE * f, ipa_polymorphic_call_context v)
     241                 :             : {
     242                 :         171 :   v.dump(f, false);
     243                 :           0 : }
     244                 :             : 
     245                 :             : /* Print a lattice LAT to F.  */
     246                 :             : 
     247                 :             : template <typename valtype>
     248                 :             : void
     249                 :        1902 : ipcp_lattice<valtype>::print (FILE * f, bool dump_sources, bool dump_benefits)
     250                 :             : {
     251                 :             :   ipcp_value<valtype> *val;
     252                 :        1902 :   bool prev = false;
     253                 :             : 
     254                 :        1902 :   if (bottom)
     255                 :             :     {
     256                 :         962 :       fprintf (f, "BOTTOM\n");
     257                 :         962 :       return;
     258                 :             :     }
     259                 :             : 
     260                 :         940 :   if (!values_count && !contains_variable)
     261                 :             :     {
     262                 :           0 :       fprintf (f, "TOP\n");
     263                 :           0 :       return;
     264                 :             :     }
     265                 :             : 
     266                 :         940 :   if (contains_variable)
     267                 :             :     {
     268                 :         686 :       fprintf (f, "VARIABLE");
     269                 :         686 :       prev = true;
     270                 :         686 :       if (dump_benefits)
     271                 :         686 :         fprintf (f, "\n");
     272                 :             :     }
     273                 :             : 
     274                 :        1469 :   for (val = values; val; val = val->next)
     275                 :             :     {
     276                 :         529 :       if (dump_benefits && prev)
     277                 :         275 :         fprintf (f, "               ");
     278                 :         254 :       else if (!dump_benefits && prev)
     279                 :           0 :         fprintf (f, ", ");
     280                 :             :       else
     281                 :             :         prev = true;
     282                 :             : 
     283                 :         529 :       print_ipcp_constant_value (f, val->value);
     284                 :             : 
     285                 :         529 :       if (dump_sources)
     286                 :             :         {
     287                 :             :           ipcp_value_source<valtype> *s;
     288                 :             : 
     289                 :         170 :           if (val->self_recursion_generated_p ())
     290                 :          27 :             fprintf (f, " [self_gen(%i), from:",
     291                 :             :                      val->self_recursion_generated_level);
     292                 :             :           else
     293                 :         143 :             fprintf (f, " [scc: %i, from:", val->scc_no);
     294                 :         358 :           for (s = val->sources; s; s = s->next)
     295                 :         188 :             fprintf (f, " %i(%f)", s->cs->caller->order,
     296                 :         376 :                      s->cs->sreal_frequency ().to_double ());
     297                 :         170 :           fprintf (f, "]");
     298                 :             :         }
     299                 :             : 
     300                 :         529 :       if (dump_benefits)
     301                 :         529 :         fprintf (f, " [loc_time: %g, loc_size: %i, "
     302                 :             :                  "prop_time: %g, prop_size: %i]\n",
     303                 :             :                  val->local_time_benefit.to_double (), val->local_size_cost,
     304                 :             :                  val->prop_time_benefit.to_double (), val->prop_size_cost);
     305                 :             :     }
     306                 :         940 :   if (!dump_benefits)
     307                 :           0 :     fprintf (f, "\n");
     308                 :             : }
     309                 :             : 
     310                 :             : void
     311                 :         889 : ipcp_bits_lattice::print (FILE *f)
     312                 :             : {
     313                 :         889 :   if (top_p ())
     314                 :           0 :     fprintf (f, "         Bits unknown (TOP)\n");
     315                 :         889 :   else if (bottom_p ())
     316                 :         715 :     fprintf (f, "         Bits unusable (BOTTOM)\n");
     317                 :             :   else
     318                 :             :     {
     319                 :         174 :       fprintf (f, "         Bits: value = "); print_hex (get_value (), f);
     320                 :         174 :       fprintf (f, ", mask = "); print_hex (get_mask (), f);
     321                 :         174 :       fprintf (f, "\n");
     322                 :             :     }
     323                 :         889 : }
     324                 :             : 
     325                 :             : /* Print value range lattice to F.  */
     326                 :             : 
     327                 :             : void
     328                 :         889 : ipcp_vr_lattice::print (FILE * f)
     329                 :             : {
     330                 :         889 :   m_vr.dump (f);
     331                 :         889 : }
     332                 :             : 
     333                 :             : /* Print all ipcp_lattices of all functions to F.  */
     334                 :             : 
     335                 :             : static void
     336                 :         153 : print_all_lattices (FILE * f, bool dump_sources, bool dump_benefits)
     337                 :             : {
     338                 :         153 :   struct cgraph_node *node;
     339                 :         153 :   int i, count;
     340                 :             : 
     341                 :         153 :   fprintf (f, "\nLattices:\n");
     342                 :         853 :   FOR_EACH_FUNCTION_WITH_GIMPLE_BODY (node)
     343                 :             :     {
     344                 :         700 :       class ipa_node_params *info;
     345                 :             : 
     346                 :         700 :       info = ipa_node_params_sum->get (node);
     347                 :             :       /* Skip unoptimized functions and constprop clones since we don't make
     348                 :             :          lattices for them.  */
     349                 :         700 :       if (!info || info->ipcp_orig_node)
     350                 :           0 :         continue;
     351                 :         700 :       fprintf (f, "  Node: %s:\n", node->dump_name ());
     352                 :         700 :       count = ipa_get_param_count (info);
     353                 :        1589 :       for (i = 0; i < count; i++)
     354                 :             :         {
     355                 :         889 :           struct ipcp_agg_lattice *aglat;
     356                 :         889 :           class ipcp_param_lattices *plats = ipa_get_parm_lattices (info, i);
     357                 :         889 :           fprintf (f, "    param [%d]: ", i);
     358                 :         889 :           plats->itself.print (f, dump_sources, dump_benefits);
     359                 :         889 :           fprintf (f, "         ctxs: ");
     360                 :         889 :           plats->ctxlat.print (f, dump_sources, dump_benefits);
     361                 :         889 :           plats->bits_lattice.print (f);
     362                 :         889 :           fprintf (f, "         ");
     363                 :         889 :           plats->m_value_range.print (f);
     364                 :         889 :           fprintf (f, "\n");
     365                 :         889 :           if (plats->virt_call)
     366                 :          75 :             fprintf (f, "        virt_call flag set\n");
     367                 :             : 
     368                 :         889 :           if (plats->aggs_bottom)
     369                 :             :             {
     370                 :         498 :               fprintf (f, "        AGGS BOTTOM\n");
     371                 :         498 :               continue;
     372                 :             :             }
     373                 :         391 :           if (plats->aggs_contain_variable)
     374                 :         353 :             fprintf (f, "        AGGS VARIABLE\n");
     375                 :         515 :           for (aglat = plats->aggs; aglat; aglat = aglat->next)
     376                 :             :             {
     377                 :         124 :               fprintf (f, "        %soffset " HOST_WIDE_INT_PRINT_DEC ": ",
     378                 :         124 :                        plats->aggs_by_ref ? "ref " : "", aglat->offset);
     379                 :         124 :               aglat->print (f, dump_sources, dump_benefits);
     380                 :             :             }
     381                 :             :         }
     382                 :             :     }
     383                 :         153 : }
     384                 :             : 
     385                 :             : /* Determine whether it is at all technically possible to create clones of NODE
     386                 :             :    and store this information in the ipa_node_params structure associated
     387                 :             :    with NODE.  */
     388                 :             : 
     389                 :             : static void
     390                 :     1194647 : determine_versionability (struct cgraph_node *node,
     391                 :             :                           class ipa_node_params *info)
     392                 :             : {
     393                 :     1194647 :   const char *reason = NULL;
     394                 :             : 
     395                 :             :   /* There are a number of generic reasons functions cannot be versioned.  We
     396                 :             :      also cannot remove parameters if there are type attributes such as fnspec
     397                 :             :      present.  */
     398                 :     1194647 :   if (node->alias || node->thunk)
     399                 :             :     reason = "alias or thunk";
     400                 :     1194647 :   else if (!node->versionable)
     401                 :             :     reason = "not a tree_versionable_function";
     402                 :     1068786 :   else if (node->get_availability () <= AVAIL_INTERPOSABLE)
     403                 :             :     reason = "insufficient body availability";
     404                 :     1003349 :   else if (!opt_for_fn (node->decl, optimize)
     405                 :     1003349 :            || !opt_for_fn (node->decl, flag_ipa_cp))
     406                 :             :     reason = "non-optimized function";
     407                 :     1003349 :   else if (lookup_attribute ("omp declare simd", DECL_ATTRIBUTES (node->decl)))
     408                 :             :     {
     409                 :             :       /* Ideally we should clone the SIMD clones themselves and create
     410                 :             :          vector copies of them, so IPA-cp and SIMD clones can happily
     411                 :             :          coexist, but that may not be worth the effort.  */
     412                 :             :       reason = "function has SIMD clones";
     413                 :             :     }
     414                 :     1002995 :   else if (lookup_attribute ("target_clones", DECL_ATTRIBUTES (node->decl)))
     415                 :             :     {
     416                 :             :       /* Ideally we should clone the target clones themselves and create
     417                 :             :          copies of them, so IPA-cp and target clones can happily
     418                 :             :          coexist, but that may not be worth the effort.  */
     419                 :             :       reason = "function target_clones attribute";
     420                 :             :     }
     421                 :             :   /* Don't clone decls local to a comdat group; it breaks and for C++
     422                 :             :      decloned constructors, inlining is always better anyway.  */
     423                 :     1002934 :   else if (node->comdat_local_p ())
     424                 :             :     reason = "comdat-local function";
     425                 :     1000942 :   else if (node->calls_comdat_local)
     426                 :             :     {
     427                 :             :       /* TODO: call is versionable if we make sure that all
     428                 :             :          callers are inside of a comdat group.  */
     429                 :        2094 :       reason = "calls comdat-local function";
     430                 :             :     }
     431                 :             : 
     432                 :             :   /* Functions calling BUILT_IN_VA_ARG_PACK and BUILT_IN_VA_ARG_PACK_LEN
     433                 :             :      work only when inlined.  Cloning them may still lead to better code
     434                 :             :      because ipa-cp will not give up on cloning further.  If the function is
     435                 :             :      external this however leads to wrong code because we may end up producing
     436                 :             :      offline copy of the function.  */
     437                 :     1194647 :   if (DECL_EXTERNAL (node->decl))
     438                 :      123143 :     for (cgraph_edge *edge = node->callees; !reason && edge;
     439                 :       84532 :          edge = edge->next_callee)
     440                 :       84532 :       if (fndecl_built_in_p (edge->callee->decl, BUILT_IN_NORMAL))
     441                 :             :         {
     442                 :       16408 :           if (DECL_FUNCTION_CODE (edge->callee->decl) == BUILT_IN_VA_ARG_PACK)
     443                 :           0 :             reason = "external function which calls va_arg_pack";
     444                 :       16408 :           if (DECL_FUNCTION_CODE (edge->callee->decl)
     445                 :             :               == BUILT_IN_VA_ARG_PACK_LEN)
     446                 :           0 :             reason = "external function which calls va_arg_pack_len";
     447                 :             :         }
     448                 :             : 
     449                 :     1194647 :   if (reason && dump_file && !node->alias && !node->thunk)
     450                 :          56 :     fprintf (dump_file, "Function %s is not versionable, reason: %s.\n",
     451                 :             :              node->dump_name (), reason);
     452                 :             : 
     453                 :     1194647 :   info->versionable = (reason == NULL);
     454                 :     1194647 : }
     455                 :             : 
     456                 :             : /* Return true if it is at all technically possible to create clones of a
     457                 :             :    NODE.  */
     458                 :             : 
     459                 :             : static bool
     460                 :     3330388 : ipcp_versionable_function_p (struct cgraph_node *node)
     461                 :             : {
     462                 :     3330388 :   ipa_node_params *info = ipa_node_params_sum->get (node);
     463                 :     3330388 :   return info && info->versionable;
     464                 :             : }
     465                 :             : 
     466                 :             : /* Structure holding accumulated information about callers of a node.  */
     467                 :             : 
     468                 :      839503 : struct caller_statistics
     469                 :             : {
     470                 :             :   /* If requested (see below), self-recursive call counts are summed into this
     471                 :             :      field.  */
     472                 :             :   profile_count rec_count_sum;
     473                 :             :   /* The sum of all ipa counts of all the other (non-recursive) calls.  */
     474                 :             :   profile_count count_sum;
     475                 :             :   /* Sum of all frequencies for all calls.  */
     476                 :             :   sreal freq_sum;
     477                 :             :   /* Number of calls and hot calls respectively.  */
     478                 :             :   int n_calls, n_hot_calls;
     479                 :             :   /* If itself is set up, also count the number of non-self-recursive
     480                 :             :      calls.  */
     481                 :             :   int n_nonrec_calls;
     482                 :             :   /* If non-NULL, this is the node itself and calls from it should have their
     483                 :             :      counts included in rec_count_sum and not count_sum.  */
     484                 :             :   cgraph_node *itself;
     485                 :             : };
     486                 :             : 
     487                 :             : /* Initialize fields of STAT to zeroes and optionally set it up so that edges
     488                 :             :    from IGNORED_CALLER are not counted.  */
     489                 :             : 
     490                 :             : static inline void
     491                 :      144949 : init_caller_stats (caller_statistics *stats, cgraph_node *itself = NULL)
     492                 :             : {
     493                 :      144949 :   stats->rec_count_sum = profile_count::zero ();
     494                 :      144949 :   stats->count_sum = profile_count::zero ();
     495                 :      144949 :   stats->n_calls = 0;
     496                 :      144949 :   stats->n_hot_calls = 0;
     497                 :      144949 :   stats->n_nonrec_calls = 0;
     498                 :      144949 :   stats->freq_sum = 0;
     499                 :      144949 :   stats->itself = itself;
     500                 :      144949 : }
     501                 :             : 
     502                 :             : /* Worker callback of cgraph_for_node_and_aliases accumulating statistics of
     503                 :             :    non-thunk incoming edges to NODE.  */
     504                 :             : 
     505                 :             : static bool
     506                 :      155520 : gather_caller_stats (struct cgraph_node *node, void *data)
     507                 :             : {
     508                 :      155520 :   struct caller_statistics *stats = (struct caller_statistics *) data;
     509                 :      155520 :   struct cgraph_edge *cs;
     510                 :             : 
     511                 :      242067 :   for (cs = node->callers; cs; cs = cs->next_caller)
     512                 :       86547 :     if (!cs->caller->thunk)
     513                 :             :       {
     514                 :       86202 :         ipa_node_params *info = ipa_node_params_sum->get (cs->caller);
     515                 :       86202 :         if (info && info->node_dead)
     516                 :           0 :           continue;
     517                 :             : 
     518                 :       86202 :         if (cs->count.ipa ().initialized_p ())
     519                 :             :           {
     520                 :        3224 :             if (stats->itself && stats->itself == cs->caller)
     521                 :           0 :               stats->rec_count_sum += cs->count.ipa ();
     522                 :             :             else
     523                 :        3224 :               stats->count_sum += cs->count.ipa ();
     524                 :             :           }
     525                 :       86202 :         stats->freq_sum += cs->sreal_frequency ();
     526                 :       86202 :         stats->n_calls++;
     527                 :       86202 :         if (stats->itself && stats->itself != cs->caller)
     528                 :           5 :           stats->n_nonrec_calls++;
     529                 :             : 
     530                 :       86202 :         if (cs->maybe_hot_p ())
     531                 :       49663 :           stats->n_hot_calls ++;
     532                 :             :       }
     533                 :      155520 :   return false;
     534                 :             : 
     535                 :             : }
     536                 :             : 
     537                 :             : /* Return true if this NODE is viable candidate for cloning.  */
     538                 :             : 
     539                 :             : static bool
     540                 :      739314 : ipcp_cloning_candidate_p (struct cgraph_node *node)
     541                 :             : {
     542                 :      739314 :   struct caller_statistics stats;
     543                 :             : 
     544                 :      739314 :   gcc_checking_assert (node->has_gimple_body_p ());
     545                 :             : 
     546                 :      739314 :   if (!opt_for_fn (node->decl, flag_ipa_cp_clone))
     547                 :             :     {
     548                 :      693439 :       if (dump_file)
     549                 :          29 :         fprintf (dump_file, "Not considering %s for cloning; "
     550                 :             :                  "-fipa-cp-clone disabled.\n",
     551                 :             :                  node->dump_name ());
     552                 :      693439 :       return false;
     553                 :             :     }
     554                 :             : 
     555                 :       45875 :   if (node->optimize_for_size_p ())
     556                 :             :     {
     557                 :         231 :       if (dump_file)
     558                 :           8 :         fprintf (dump_file, "Not considering %s for cloning; "
     559                 :             :                  "optimizing it for size.\n",
     560                 :             :                  node->dump_name ());
     561                 :         231 :       return false;
     562                 :             :     }
     563                 :             : 
     564                 :       45644 :   init_caller_stats (&stats);
     565                 :       45644 :   node->call_for_symbol_thunks_and_aliases (gather_caller_stats, &stats, false);
     566                 :             : 
     567                 :       45644 :   if (ipa_size_summaries->get (node)->self_size < stats.n_calls)
     568                 :             :     {
     569                 :         217 :       if (dump_file)
     570                 :           0 :         fprintf (dump_file, "Considering %s for cloning; code might shrink.\n",
     571                 :             :                  node->dump_name ());
     572                 :         217 :       return true;
     573                 :             :     }
     574                 :             : 
     575                 :             :   /* When profile is available and function is hot, propagate into it even if
     576                 :             :      calls seems cold; constant propagation can improve function's speed
     577                 :             :      significantly.  */
     578                 :       45427 :   if (stats.count_sum > profile_count::zero ()
     579                 :       45427 :       && node->count.ipa ().initialized_p ())
     580                 :             :     {
     581                 :          64 :       if (stats.count_sum > node->count.ipa ().apply_scale (90, 100))
     582                 :             :         {
     583                 :          43 :           if (dump_file)
     584                 :           0 :             fprintf (dump_file, "Considering %s for cloning; "
     585                 :             :                      "usually called directly.\n",
     586                 :             :                      node->dump_name ());
     587                 :          43 :           return true;
     588                 :             :         }
     589                 :             :     }
     590                 :       45384 :   if (!stats.n_hot_calls)
     591                 :             :     {
     592                 :       39397 :       if (dump_file)
     593                 :         234 :         fprintf (dump_file, "Not considering %s for cloning; no hot calls.\n",
     594                 :             :                  node->dump_name ());
     595                 :       39397 :       return false;
     596                 :             :     }
     597                 :        5987 :   if (dump_file)
     598                 :         127 :     fprintf (dump_file, "Considering %s for cloning.\n",
     599                 :             :              node->dump_name ());
     600                 :             :   return true;
     601                 :             : }
     602                 :             : 
     603                 :             : template <typename valtype>
     604                 :             : class value_topo_info
     605                 :             : {
     606                 :             : public:
     607                 :             :   /* Head of the linked list of topologically sorted values. */
     608                 :             :   ipcp_value<valtype> *values_topo;
     609                 :             :   /* Stack for creating SCCs, represented by a linked list too.  */
     610                 :             :   ipcp_value<valtype> *stack;
     611                 :             :   /* Counter driving the algorithm in add_val_to_toposort.  */
     612                 :             :   int dfs_counter;
     613                 :             : 
     614                 :      125030 :   value_topo_info () : values_topo (NULL), stack (NULL), dfs_counter (0)
     615                 :             :   {}
     616                 :             :   void add_val (ipcp_value<valtype> *cur_val);
     617                 :             :   void propagate_effects ();
     618                 :             : };
     619                 :             : 
     620                 :             : /* Arrays representing a topological ordering of call graph nodes and a stack
     621                 :             :    of nodes used during constant propagation and also data required to perform
     622                 :             :    topological sort of values and propagation of benefits in the determined
     623                 :             :    order.  */
     624                 :             : 
     625                 :             : class ipa_topo_info
     626                 :             : {
     627                 :             : public:
     628                 :             :   /* Array with obtained topological order of cgraph nodes.  */
     629                 :             :   struct cgraph_node **order;
     630                 :             :   /* Stack of cgraph nodes used during propagation within SCC until all values
     631                 :             :      in the SCC stabilize.  */
     632                 :             :   struct cgraph_node **stack;
     633                 :             :   int nnodes, stack_top;
     634                 :             : 
     635                 :             :   value_topo_info<tree> constants;
     636                 :             :   value_topo_info<ipa_polymorphic_call_context> contexts;
     637                 :             : 
     638                 :      125030 :   ipa_topo_info () : order(NULL), stack(NULL), nnodes(0), stack_top(0),
     639                 :      125030 :     constants ()
     640                 :             :   {}
     641                 :             : };
     642                 :             : 
     643                 :             : /* Skip edges from and to nodes without ipa_cp enabled.
     644                 :             :    Ignore not available symbols.  */
     645                 :             : 
     646                 :             : static bool
     647                 :     4908111 : ignore_edge_p (cgraph_edge *e)
     648                 :             : {
     649                 :     4908111 :   enum availability avail;
     650                 :     4908111 :   cgraph_node *ultimate_target
     651                 :     4908111 :     = e->callee->function_or_virtual_thunk_symbol (&avail, e->caller);
     652                 :             : 
     653                 :     4908111 :   return (avail <= AVAIL_INTERPOSABLE
     654                 :     1679181 :           || !opt_for_fn (ultimate_target->decl, optimize)
     655                 :     6577824 :           || !opt_for_fn (ultimate_target->decl, flag_ipa_cp));
     656                 :             : }
     657                 :             : 
     658                 :             : /* Allocate the arrays in TOPO and topologically sort the nodes into order.  */
     659                 :             : 
     660                 :             : static void
     661                 :      125030 : build_toporder_info (class ipa_topo_info *topo)
     662                 :             : {
     663                 :      125030 :   topo->order = XCNEWVEC (struct cgraph_node *, symtab->cgraph_count);
     664                 :      125030 :   topo->stack = XCNEWVEC (struct cgraph_node *, symtab->cgraph_count);
     665                 :             : 
     666                 :      125030 :   gcc_checking_assert (topo->stack_top == 0);
     667                 :      125030 :   topo->nnodes = ipa_reduced_postorder (topo->order, true,
     668                 :             :                                         ignore_edge_p);
     669                 :      125030 : }
     670                 :             : 
     671                 :             : /* Free information about strongly connected components and the arrays in
     672                 :             :    TOPO.  */
     673                 :             : 
     674                 :             : static void
     675                 :      125030 : free_toporder_info (class ipa_topo_info *topo)
     676                 :             : {
     677                 :      125030 :   ipa_free_postorder_info ();
     678                 :      125030 :   free (topo->order);
     679                 :      125030 :   free (topo->stack);
     680                 :      125030 : }
     681                 :             : 
     682                 :             : /* Add NODE to the stack in TOPO, unless it is already there.  */
     683                 :             : 
     684                 :             : static inline void
     685                 :     1198346 : push_node_to_stack (class ipa_topo_info *topo, struct cgraph_node *node)
     686                 :             : {
     687                 :     1198346 :   ipa_node_params *info = ipa_node_params_sum->get (node);
     688                 :     1198346 :   if (info->node_enqueued)
     689                 :             :     return;
     690                 :     1197254 :   info->node_enqueued = 1;
     691                 :     1197254 :   topo->stack[topo->stack_top++] = node;
     692                 :             : }
     693                 :             : 
     694                 :             : /* Pop a node from the stack in TOPO and return it or return NULL if the stack
     695                 :             :    is empty.  */
     696                 :             : 
     697                 :             : static struct cgraph_node *
     698                 :     2471030 : pop_node_from_stack (class ipa_topo_info *topo)
     699                 :             : {
     700                 :     2471030 :   if (topo->stack_top)
     701                 :             :     {
     702                 :     1197254 :       struct cgraph_node *node;
     703                 :     1197254 :       topo->stack_top--;
     704                 :     1197254 :       node = topo->stack[topo->stack_top];
     705                 :     1197254 :       ipa_node_params_sum->get (node)->node_enqueued = 0;
     706                 :     1197254 :       return node;
     707                 :             :     }
     708                 :             :   else
     709                 :             :     return NULL;
     710                 :             : }
     711                 :             : 
     712                 :             : /* Set lattice LAT to bottom and return true if it previously was not set as
     713                 :             :    such.  */
     714                 :             : 
     715                 :             : template <typename valtype>
     716                 :             : inline bool
     717                 :     1988232 : ipcp_lattice<valtype>::set_to_bottom ()
     718                 :             : {
     719                 :     1988232 :   bool ret = !bottom;
     720                 :     1988232 :   bottom = true;
     721                 :             :   return ret;
     722                 :             : }
     723                 :             : 
     724                 :             : /* Mark lattice as containing an unknown value and return true if it previously
     725                 :             :    was not marked as such.  */
     726                 :             : 
     727                 :             : template <typename valtype>
     728                 :             : inline bool
     729                 :     1379054 : ipcp_lattice<valtype>::set_contains_variable ()
     730                 :             : {
     731                 :     1379054 :   bool ret = !contains_variable;
     732                 :     1379054 :   contains_variable = true;
     733                 :             :   return ret;
     734                 :             : }
     735                 :             : 
     736                 :             : /* Set all aggregate lattices in PLATS to bottom and return true if they were
     737                 :             :    not previously set as such.  */
     738                 :             : 
     739                 :             : static inline bool
     740                 :     1988042 : set_agg_lats_to_bottom (class ipcp_param_lattices *plats)
     741                 :             : {
     742                 :     1988042 :   bool ret = !plats->aggs_bottom;
     743                 :     1988042 :   plats->aggs_bottom = true;
     744                 :     1988042 :   return ret;
     745                 :             : }
     746                 :             : 
     747                 :             : /* Mark all aggregate lattices in PLATS as containing an unknown value and
     748                 :             :    return true if they were not previously marked as such.  */
     749                 :             : 
     750                 :             : static inline bool
     751                 :      953197 : set_agg_lats_contain_variable (class ipcp_param_lattices *plats)
     752                 :             : {
     753                 :      953197 :   bool ret = !plats->aggs_contain_variable;
     754                 :      953197 :   plats->aggs_contain_variable = true;
     755                 :      953197 :   return ret;
     756                 :             : }
     757                 :             : 
     758                 :             : bool
     759                 :           0 : ipcp_vr_lattice::meet_with (const ipcp_vr_lattice &other)
     760                 :             : {
     761                 :           0 :   return meet_with_1 (other.m_vr);
     762                 :             : }
     763                 :             : 
     764                 :             : /* Meet the current value of the lattice with the range described by
     765                 :             :    P_VR.  */
     766                 :             : 
     767                 :             : bool
     768                 :      453065 : ipcp_vr_lattice::meet_with (const vrange &p_vr)
     769                 :             : {
     770                 :      453065 :   return meet_with_1 (p_vr);
     771                 :             : }
     772                 :             : 
     773                 :             : /* Meet the current value of the lattice with the range described by
     774                 :             :    OTHER_VR.  Return TRUE if anything changed.  */
     775                 :             : 
     776                 :             : bool
     777                 :      453065 : ipcp_vr_lattice::meet_with_1 (const vrange &other_vr)
     778                 :             : {
     779                 :      453065 :   if (bottom_p ())
     780                 :             :     return false;
     781                 :             : 
     782                 :      453065 :   if (other_vr.varying_p ())
     783                 :           0 :     return set_to_bottom ();
     784                 :             : 
     785                 :      453065 :   bool res;
     786                 :      453065 :   if (flag_checking)
     787                 :             :     {
     788                 :      453065 :       value_range save (m_vr);
     789                 :      453065 :       res = m_vr.union_ (other_vr);
     790                 :      453065 :       gcc_assert (res == (m_vr != save));
     791                 :      453065 :     }
     792                 :             :   else
     793                 :           0 :     res = m_vr.union_ (other_vr);
     794                 :             :   return res;
     795                 :             : }
     796                 :             : 
     797                 :             : /* Return true if value range information in the lattice is yet unknown.  */
     798                 :             : 
     799                 :             : bool
     800                 :             : ipcp_vr_lattice::top_p () const
     801                 :             : {
     802                 :      152086 :   return m_vr.undefined_p ();
     803                 :             : }
     804                 :             : 
     805                 :             : /* Return true if value range information in the lattice is known to be
     806                 :             :    unusable.  */
     807                 :             : 
     808                 :             : bool
     809                 :     6342521 : ipcp_vr_lattice::bottom_p () const
     810                 :             : {
     811                 :      453065 :   return m_vr.varying_p ();
     812                 :             : }
     813                 :             : 
     814                 :             : /* Set value range information in the lattice to bottom.  Return true if it
     815                 :             :    previously was in a different state.  */
     816                 :             : 
     817                 :             : bool
     818                 :     2238753 : ipcp_vr_lattice::set_to_bottom ()
     819                 :             : {
     820                 :     2238753 :   if (m_vr.varying_p ())
     821                 :             :     return false;
     822                 :             : 
     823                 :             :   /* Setting an unsupported type here forces the temporary to default
     824                 :             :      to unsupported_range, which can handle VARYING/DEFINED ranges,
     825                 :             :      but nothing else (union, intersect, etc).  This allows us to set
     826                 :             :      bottoms on any ranges, and is safe as all users of the lattice
     827                 :             :      check for bottom first.  */
     828                 :     2104629 :   m_vr.set_type (void_type_node);
     829                 :     2104629 :   m_vr.set_varying (void_type_node);
     830                 :             : 
     831                 :     2104629 :   return true;
     832                 :             : }
     833                 :             : 
     834                 :             : /* Set lattice value to bottom, if it already isn't the case.  */
     835                 :             : 
     836                 :             : bool
     837                 :     2254604 : ipcp_bits_lattice::set_to_bottom ()
     838                 :             : {
     839                 :     2254604 :   if (bottom_p ())
     840                 :             :     return false;
     841                 :     2121233 :   m_lattice_val = IPA_BITS_VARYING;
     842                 :     2121233 :   m_value = 0;
     843                 :     2121233 :   m_mask = -1;
     844                 :     2121233 :   return true;
     845                 :             : }
     846                 :             : 
     847                 :             : /* Set to constant if it isn't already. Only meant to be called
     848                 :             :    when switching state from TOP.  */
     849                 :             : 
     850                 :             : bool
     851                 :       62463 : ipcp_bits_lattice::set_to_constant (widest_int value, widest_int mask)
     852                 :             : {
     853                 :       62463 :   gcc_assert (top_p ());
     854                 :       62463 :   m_lattice_val = IPA_BITS_CONSTANT;
     855                 :       62463 :   m_value = wi::bit_and (wi::bit_not (mask), value);
     856                 :       62463 :   m_mask = mask;
     857                 :       62463 :   return true;
     858                 :             : }
     859                 :             : 
     860                 :             : /* Return true if any of the known bits are non-zero.  */
     861                 :             : 
     862                 :             : bool
     863                 :         521 : ipcp_bits_lattice::known_nonzero_p () const
     864                 :             : {
     865                 :         521 :   if (!constant_p ())
     866                 :             :     return false;
     867                 :         521 :   return wi::ne_p (wi::bit_and (wi::bit_not (m_mask), m_value), 0);
     868                 :             : }
     869                 :             : 
     870                 :             : /* Convert operand to value, mask form.  */
     871                 :             : 
     872                 :             : void
     873                 :        2542 : ipcp_bits_lattice::get_value_and_mask (tree operand, widest_int *valuep, widest_int *maskp)
     874                 :             : {
     875                 :        2542 :   wide_int get_nonzero_bits (const_tree);
     876                 :             : 
     877                 :        2542 :   if (TREE_CODE (operand) == INTEGER_CST)
     878                 :             :     {
     879                 :        2542 :       *valuep = wi::to_widest (operand);
     880                 :        2542 :       *maskp = 0;
     881                 :             :     }
     882                 :             :   else
     883                 :             :     {
     884                 :           0 :       *valuep = 0;
     885                 :           0 :       *maskp = -1;
     886                 :             :     }
     887                 :        2542 : }
     888                 :             : 
     889                 :             : /* Meet operation, similar to ccp_lattice_meet, we xor values
     890                 :             :    if this->value, value have different values at same bit positions, we want
     891                 :             :    to drop that bit to varying. Return true if mask is changed.
     892                 :             :    This function assumes that the lattice value is in CONSTANT state.  If
     893                 :             :    DROP_ALL_ONES, mask out any known bits with value one afterwards.  */
     894                 :             : 
     895                 :             : bool
     896                 :      282556 : ipcp_bits_lattice::meet_with_1 (widest_int value, widest_int mask,
     897                 :             :                                 unsigned precision, bool drop_all_ones)
     898                 :             : {
     899                 :      282556 :   gcc_assert (constant_p ());
     900                 :             : 
     901                 :      282556 :   widest_int old_mask = m_mask;
     902                 :      282556 :   m_mask = (m_mask | mask) | (m_value ^ value);
     903                 :      282556 :   if (drop_all_ones)
     904                 :         205 :     m_mask |= m_value;
     905                 :      282556 :   m_value &= ~m_mask;
     906                 :             : 
     907                 :      282556 :   if (wi::sext (m_mask, precision) == -1)
     908                 :        3148 :     return set_to_bottom ();
     909                 :             : 
     910                 :      279408 :   return m_mask != old_mask;
     911                 :      282556 : }
     912                 :             : 
     913                 :             : /* Meet the bits lattice with operand
     914                 :             :    described by <value, mask, sgn, precision.  */
     915                 :             : 
     916                 :             : bool
     917                 :      366474 : ipcp_bits_lattice::meet_with (widest_int value, widest_int mask,
     918                 :             :                               unsigned precision)
     919                 :             : {
     920                 :      366474 :   if (bottom_p ())
     921                 :             :     return false;
     922                 :             : 
     923                 :      366474 :   if (top_p ())
     924                 :             :     {
     925                 :       97815 :       if (wi::sext (mask, precision) == -1)
     926                 :       40510 :         return set_to_bottom ();
     927                 :       57305 :       return set_to_constant (value, mask);
     928                 :             :     }
     929                 :             : 
     930                 :      268659 :   return meet_with_1 (value, mask, precision, false);
     931                 :             : }
     932                 :             : 
     933                 :             : /* Meet bits lattice with the result of bit_value_binop (other, operand)
     934                 :             :    if code is binary operation or bit_value_unop (other) if code is unary op.
     935                 :             :    In the case when code is nop_expr, no adjustment is required.  If
     936                 :             :    DROP_ALL_ONES, mask out any known bits with value one afterwards.  */
     937                 :             : 
     938                 :             : bool
     939                 :       22551 : ipcp_bits_lattice::meet_with (ipcp_bits_lattice& other, unsigned precision,
     940                 :             :                               signop sgn, enum tree_code code, tree operand,
     941                 :             :                               bool drop_all_ones)
     942                 :             : {
     943                 :       22551 :   if (other.bottom_p ())
     944                 :           0 :     return set_to_bottom ();
     945                 :             : 
     946                 :       22551 :   if (bottom_p () || other.top_p ())
     947                 :             :     return false;
     948                 :             : 
     949                 :       19170 :   widest_int adjusted_value, adjusted_mask;
     950                 :             : 
     951                 :       19170 :   if (TREE_CODE_CLASS (code) == tcc_binary)
     952                 :             :     {
     953                 :        2542 :       tree type = TREE_TYPE (operand);
     954                 :        2542 :       widest_int o_value, o_mask;
     955                 :        2542 :       get_value_and_mask (operand, &o_value, &o_mask);
     956                 :             : 
     957                 :        2542 :       bit_value_binop (code, sgn, precision, &adjusted_value, &adjusted_mask,
     958                 :        5084 :                        sgn, precision, other.get_value (), other.get_mask (),
     959                 :        2542 :                        TYPE_SIGN (type), TYPE_PRECISION (type), o_value, o_mask);
     960                 :             : 
     961                 :        2542 :       if (wi::sext (adjusted_mask, precision) == -1)
     962                 :          88 :         return set_to_bottom ();
     963                 :        2542 :     }
     964                 :             : 
     965                 :       16628 :   else if (TREE_CODE_CLASS (code) == tcc_unary)
     966                 :             :     {
     967                 :       33206 :       bit_value_unop (code, sgn, precision, &adjusted_value,
     968                 :       33206 :                       &adjusted_mask, sgn, precision, other.get_value (),
     969                 :       16603 :                       other.get_mask ());
     970                 :             : 
     971                 :       16603 :       if (wi::sext (adjusted_mask, precision) == -1)
     972                 :           2 :         return set_to_bottom ();
     973                 :             :     }
     974                 :             : 
     975                 :             :   else
     976                 :          25 :     return set_to_bottom ();
     977                 :             : 
     978                 :       19055 :   if (top_p ())
     979                 :             :     {
     980                 :        5158 :       if (drop_all_ones)
     981                 :             :         {
     982                 :         316 :           adjusted_mask |= adjusted_value;
     983                 :         316 :           adjusted_value &= ~adjusted_mask;
     984                 :             :         }
     985                 :        5158 :       if (wi::sext (adjusted_mask, precision) == -1)
     986                 :           0 :         return set_to_bottom ();
     987                 :        5158 :       return set_to_constant (adjusted_value, adjusted_mask);
     988                 :             :     }
     989                 :             :   else
     990                 :       13897 :     return meet_with_1 (adjusted_value, adjusted_mask, precision,
     991                 :             :                         drop_all_ones);
     992                 :       19170 : }
     993                 :             : 
     994                 :             : /* Dump the contents of the list to FILE.  */
     995                 :             : 
     996                 :             : void
     997                 :          92 : ipa_argagg_value_list::dump (FILE *f)
     998                 :             : {
     999                 :          92 :   bool comma = false;
    1000                 :         258 :   for (const ipa_argagg_value &av : m_elts)
    1001                 :             :     {
    1002                 :         166 :       fprintf (f, "%s %i[%u]=", comma ? "," : "",
    1003                 :         166 :                av.index, av.unit_offset);
    1004                 :         166 :       print_generic_expr (f, av.value);
    1005                 :         166 :       if (av.by_ref)
    1006                 :         145 :         fprintf (f, "(by_ref)");
    1007                 :         166 :       if (av.killed)
    1008                 :           1 :         fprintf (f, "(killed)");
    1009                 :         166 :       comma = true;
    1010                 :             :     }
    1011                 :          92 :   fprintf (f, "\n");
    1012                 :          92 : }
    1013                 :             : 
    1014                 :             : /* Dump the contents of the list to stderr.  */
    1015                 :             : 
    1016                 :             : void
    1017                 :           0 : ipa_argagg_value_list::debug ()
    1018                 :             : {
    1019                 :           0 :   dump (stderr);
    1020                 :           0 : }
    1021                 :             : 
    1022                 :             : /* Return the item describing a constant stored for INDEX at UNIT_OFFSET or
    1023                 :             :    NULL if there is no such constant.  */
    1024                 :             : 
    1025                 :             : const ipa_argagg_value *
    1026                 :    21771091 : ipa_argagg_value_list::get_elt (int index, unsigned unit_offset) const
    1027                 :             : {
    1028                 :    21771091 :   ipa_argagg_value key;
    1029                 :    21771091 :   key.index = index;
    1030                 :    21771091 :   key.unit_offset = unit_offset;
    1031                 :    21771091 :   const ipa_argagg_value *res
    1032                 :    21771091 :     = std::lower_bound (m_elts.begin (), m_elts.end (), key,
    1033                 :     3606450 :                         [] (const ipa_argagg_value &elt,
    1034                 :             :                             const ipa_argagg_value &val)
    1035                 :             :                         {
    1036                 :     3606450 :                           if (elt.index < val.index)
    1037                 :             :                             return true;
    1038                 :     3118388 :                           if (elt.index > val.index)
    1039                 :             :                             return false;
    1040                 :     2523044 :                           if (elt.unit_offset < val.unit_offset)
    1041                 :             :                             return true;
    1042                 :             :                           return false;
    1043                 :             :                         });
    1044                 :             : 
    1045                 :    21771091 :   if (res == m_elts.end ()
    1046                 :     1638713 :       || res->index != index
    1047                 :    23109087 :       || res->unit_offset != unit_offset)
    1048                 :             :     res = nullptr;
    1049                 :             : 
    1050                 :             :   /* TODO: perhaps remove the check (that the underlying array is indeed
    1051                 :             :      sorted) if it turns out it can be too slow? */
    1052                 :    21771091 :   if (!flag_checking)
    1053                 :             :     return res;
    1054                 :             : 
    1055                 :             :   const ipa_argagg_value *slow_res = NULL;
    1056                 :             :   int prev_index = -1;
    1057                 :             :   unsigned prev_unit_offset = 0;
    1058                 :    28772523 :   for (const ipa_argagg_value &av : m_elts)
    1059                 :             :     {
    1060                 :     7001432 :       gcc_assert (prev_index < 0
    1061                 :             :                   || prev_index < av.index
    1062                 :             :                   || prev_unit_offset < av.unit_offset);
    1063                 :     7001432 :       prev_index = av.index;
    1064                 :     7001432 :       prev_unit_offset = av.unit_offset;
    1065                 :     7001432 :       if (av.index == index
    1066                 :     3778906 :           && av.unit_offset == unit_offset)
    1067                 :     7001432 :         slow_res = &av;
    1068                 :             :     }
    1069                 :    21771091 :   gcc_assert (res == slow_res);
    1070                 :             : 
    1071                 :             :   return res;
    1072                 :             : }
    1073                 :             : 
    1074                 :             : /* Return the first item describing a constant stored for parameter with INDEX,
    1075                 :             :    regardless of offset or reference, or NULL if there is no such constant.  */
    1076                 :             : 
    1077                 :             : const ipa_argagg_value *
    1078                 :      120606 : ipa_argagg_value_list::get_elt_for_index (int index) const
    1079                 :             : {
    1080                 :      120606 :   const ipa_argagg_value *res
    1081                 :      120606 :     = std::lower_bound (m_elts.begin (), m_elts.end (), index,
    1082                 :       10828 :                         [] (const ipa_argagg_value &elt, unsigned idx)
    1083                 :             :                         {
    1084                 :       10828 :                           return elt.index < idx;
    1085                 :             :                         });
    1086                 :      120606 :   if (res == m_elts.end ()
    1087                 :      120606 :       || res->index != index)
    1088                 :             :     res = nullptr;
    1089                 :      120606 :   return res;
    1090                 :             : }
    1091                 :             : 
    1092                 :             : /* Return the aggregate constant stored for INDEX at UNIT_OFFSET, not
    1093                 :             :    performing any check of whether value is passed by reference, or NULL_TREE
    1094                 :             :    if there is no such constant.  */
    1095                 :             : 
    1096                 :             : tree
    1097                 :       24723 : ipa_argagg_value_list::get_value (int index, unsigned unit_offset) const
    1098                 :             : {
    1099                 :       24723 :   const ipa_argagg_value *av = get_elt (index, unit_offset);
    1100                 :       24723 :   return av ? av->value : NULL_TREE;
    1101                 :             : }
    1102                 :             : 
    1103                 :             : /* Return the aggregate constant stored for INDEX at UNIT_OFFSET, if it is
    1104                 :             :    passed by reference or not according to BY_REF, or NULL_TREE if there is
    1105                 :             :    no such constant.  */
    1106                 :             : 
    1107                 :             : tree
    1108                 :    21737062 : ipa_argagg_value_list::get_value (int index, unsigned unit_offset,
    1109                 :             :                                     bool by_ref) const
    1110                 :             : {
    1111                 :    21737062 :   const ipa_argagg_value *av = get_elt (index, unit_offset);
    1112                 :    21737062 :   if (av && av->by_ref == by_ref)
    1113                 :     1056491 :     return av->value;
    1114                 :             :   return NULL_TREE;
    1115                 :             : }
    1116                 :             : 
    1117                 :             : /* Return true if all elements present in OTHER are also present in this
    1118                 :             :    list.  */
    1119                 :             : 
    1120                 :             : bool
    1121                 :          12 : ipa_argagg_value_list::superset_of_p (const ipa_argagg_value_list &other) const
    1122                 :             : {
    1123                 :          12 :   unsigned j = 0;
    1124                 :          17 :   for (unsigned i = 0; i < other.m_elts.size (); i++)
    1125                 :             :     {
    1126                 :          12 :       unsigned other_index = other.m_elts[i].index;
    1127                 :          12 :       unsigned other_offset = other.m_elts[i].unit_offset;
    1128                 :             : 
    1129                 :          12 :       while (j < m_elts.size ()
    1130                 :          12 :              && (m_elts[j].index < other_index
    1131                 :           5 :                  || (m_elts[j].index == other_index
    1132                 :           5 :                      && m_elts[j].unit_offset < other_offset)))
    1133                 :           0 :        j++;
    1134                 :             : 
    1135                 :          12 :       if (j >= m_elts.size ()
    1136                 :           5 :           || m_elts[j].index != other_index
    1137                 :           5 :           || m_elts[j].unit_offset != other_offset
    1138                 :           5 :           || m_elts[j].by_ref != other.m_elts[i].by_ref
    1139                 :           5 :           || !m_elts[j].value
    1140                 :          17 :           || !values_equal_for_ipcp_p (m_elts[j].value, other.m_elts[i].value))
    1141                 :           7 :         return false;
    1142                 :             :     }
    1143                 :             :   return true;
    1144                 :             : }
    1145                 :             : 
    1146                 :             : /* Push all items in this list that describe parameter SRC_INDEX into RES as
    1147                 :             :    ones describing DST_INDEX while subtracting UNIT_DELTA from their unit
    1148                 :             :    offsets but skip those which would end up with a negative offset.  */
    1149                 :             : 
    1150                 :             : void
    1151                 :         406 : ipa_argagg_value_list::push_adjusted_values (unsigned src_index,
    1152                 :             :                                              unsigned dest_index,
    1153                 :             :                                              unsigned unit_delta,
    1154                 :             :                                              vec<ipa_argagg_value> *res) const
    1155                 :             : {
    1156                 :         406 :   const ipa_argagg_value *av = get_elt_for_index (src_index);
    1157                 :         406 :   if (!av)
    1158                 :             :     return;
    1159                 :             :   unsigned prev_unit_offset = 0;
    1160                 :             :   bool first = true;
    1161                 :        1145 :   for (; av < m_elts.end (); ++av)
    1162                 :             :     {
    1163                 :         837 :       if (av->index > src_index)
    1164                 :             :         return;
    1165                 :         784 :       if (av->index == src_index
    1166                 :         784 :           && (av->unit_offset >= unit_delta)
    1167                 :         784 :           && av->value)
    1168                 :             :         {
    1169                 :         784 :           ipa_argagg_value new_av;
    1170                 :         784 :           gcc_checking_assert (av->value);
    1171                 :         784 :           new_av.value = av->value;
    1172                 :         784 :           new_av.unit_offset = av->unit_offset - unit_delta;
    1173                 :         784 :           new_av.index = dest_index;
    1174                 :         784 :           new_av.by_ref = av->by_ref;
    1175                 :         784 :           gcc_assert (!av->killed);
    1176                 :         784 :           new_av.killed = false;
    1177                 :             : 
    1178                 :             :           /* Quick check that the offsets we push are indeed increasing.  */
    1179                 :         784 :           gcc_assert (first
    1180                 :             :                       || new_av.unit_offset > prev_unit_offset);
    1181                 :         784 :           prev_unit_offset = new_av.unit_offset;
    1182                 :         784 :           first = false;
    1183                 :             : 
    1184                 :         784 :           res->safe_push (new_av);
    1185                 :             :         }
    1186                 :             :     }
    1187                 :             : }
    1188                 :             : 
    1189                 :             : /* Push to RES information about single lattices describing aggregate values in
    1190                 :             :    PLATS as those describing parameter DEST_INDEX and the original offset minus
    1191                 :             :    UNIT_DELTA.  Return true if any item has been pushed to RES.  */
    1192                 :             : 
    1193                 :             : static bool
    1194                 :     1688705 : push_agg_values_from_plats (ipcp_param_lattices *plats, int dest_index,
    1195                 :             :                             unsigned unit_delta,
    1196                 :             :                             vec<ipa_argagg_value> *res)
    1197                 :             : {
    1198                 :     1688705 :   if (plats->aggs_contain_variable)
    1199                 :             :     return false;
    1200                 :             : 
    1201                 :     1528610 :   bool pushed_sth = false;
    1202                 :     1528610 :   bool first = true;
    1203                 :     1528610 :   unsigned prev_unit_offset = 0;
    1204                 :     1558185 :   for (struct ipcp_agg_lattice *aglat = plats->aggs; aglat; aglat = aglat->next)
    1205                 :       58857 :     if (aglat->is_single_const ()
    1206                 :       22278 :         && (aglat->offset / BITS_PER_UNIT - unit_delta) >= 0)
    1207                 :             :       {
    1208                 :       22278 :         ipa_argagg_value iav;
    1209                 :       22278 :         iav.value = aglat->values->value;
    1210                 :       22278 :         iav.unit_offset = aglat->offset / BITS_PER_UNIT - unit_delta;
    1211                 :       22278 :         iav.index = dest_index;
    1212                 :       22278 :         iav.by_ref = plats->aggs_by_ref;
    1213                 :       22278 :         iav.killed = false;
    1214                 :             : 
    1215                 :       22278 :         gcc_assert (first
    1216                 :             :                     || iav.unit_offset > prev_unit_offset);
    1217                 :       22278 :         prev_unit_offset = iav.unit_offset;
    1218                 :       22278 :         first = false;
    1219                 :             : 
    1220                 :       22278 :         pushed_sth = true;
    1221                 :       22278 :         res->safe_push (iav);
    1222                 :             :       }
    1223                 :             :   return pushed_sth;
    1224                 :             : }
    1225                 :             : 
    1226                 :             : /* Turn all values in LIST that are not present in OTHER into NULL_TREEs.
    1227                 :             :    Return the number of remaining valid entries.  */
    1228                 :             : 
    1229                 :             : static unsigned
    1230                 :        3350 : intersect_argaggs_with (vec<ipa_argagg_value> &elts,
    1231                 :             :                         const vec<ipa_argagg_value> &other)
    1232                 :             : {
    1233                 :        3350 :   unsigned valid_entries = 0;
    1234                 :        3350 :   unsigned j = 0;
    1235                 :       21513 :   for (unsigned i = 0; i < elts.length (); i++)
    1236                 :             :     {
    1237                 :       18163 :       if (!elts[i].value)
    1238                 :        3067 :         continue;
    1239                 :             : 
    1240                 :       15096 :       unsigned this_index = elts[i].index;
    1241                 :       15096 :       unsigned this_offset = elts[i].unit_offset;
    1242                 :             : 
    1243                 :       15096 :       while (j < other.length ()
    1244                 :       56354 :              && (other[j].index < this_index
    1245                 :       26478 :                  || (other[j].index == this_index
    1246                 :       26303 :                      && other[j].unit_offset < this_offset)))
    1247                 :       13291 :         j++;
    1248                 :             : 
    1249                 :       15096 :       if (j >= other.length ())
    1250                 :             :         {
    1251                 :         420 :           elts[i].value = NULL_TREE;
    1252                 :         420 :           continue;
    1253                 :             :         }
    1254                 :             : 
    1255                 :       14676 :       if (other[j].index == this_index
    1256                 :       14501 :           && other[j].unit_offset == this_offset
    1257                 :       14348 :           && other[j].by_ref == elts[i].by_ref
    1258                 :       14348 :           && other[j].value
    1259                 :       29024 :           && values_equal_for_ipcp_p (other[j].value, elts[i].value))
    1260                 :       13029 :         valid_entries++;
    1261                 :             :       else
    1262                 :        1647 :         elts[i].value = NULL_TREE;
    1263                 :             :     }
    1264                 :        3350 :   return valid_entries;
    1265                 :             : }
    1266                 :             : 
    1267                 :             : /* Mark bot aggregate and scalar lattices as containing an unknown variable,
    1268                 :             :    return true is any of them has not been marked as such so far.  */
    1269                 :             : 
    1270                 :             : static inline bool
    1271                 :      149569 : set_all_contains_variable (class ipcp_param_lattices *plats)
    1272                 :             : {
    1273                 :      149569 :   bool ret;
    1274                 :      149569 :   ret = plats->itself.set_contains_variable ();
    1275                 :      149569 :   ret |= plats->ctxlat.set_contains_variable ();
    1276                 :      149569 :   ret |= set_agg_lats_contain_variable (plats);
    1277                 :      149569 :   ret |= plats->bits_lattice.set_to_bottom ();
    1278                 :      149569 :   ret |= plats->m_value_range.set_to_bottom ();
    1279                 :      149569 :   return ret;
    1280                 :             : }
    1281                 :             : 
    1282                 :             : /* Worker of call_for_symbol_thunks_and_aliases, increment the integer DATA
    1283                 :             :    points to by the number of callers to NODE.  */
    1284                 :             : 
    1285                 :             : static bool
    1286                 :       91640 : count_callers (cgraph_node *node, void *data)
    1287                 :             : {
    1288                 :       91640 :   int *caller_count = (int *) data;
    1289                 :             : 
    1290                 :      378216 :   for (cgraph_edge *cs = node->callers; cs; cs = cs->next_caller)
    1291                 :             :     /* Local thunks can be handled transparently, but if the thunk cannot
    1292                 :             :        be optimized out, count it as a real use.  */
    1293                 :      286576 :     if (!cs->caller->thunk || !cs->caller->local)
    1294                 :      286576 :       ++*caller_count;
    1295                 :       91640 :   return false;
    1296                 :             : }
    1297                 :             : 
    1298                 :             : /* Worker of call_for_symbol_thunks_and_aliases, it is supposed to be called on
    1299                 :             :    the one caller of some other node.  Set the caller's corresponding flag.  */
    1300                 :             : 
    1301                 :             : static bool
    1302                 :       51608 : set_single_call_flag (cgraph_node *node, void *)
    1303                 :             : {
    1304                 :       51608 :   cgraph_edge *cs = node->callers;
    1305                 :             :   /* Local thunks can be handled transparently, skip them.  */
    1306                 :       51608 :   while (cs && cs->caller->thunk && cs->caller->local)
    1307                 :           0 :     cs = cs->next_caller;
    1308                 :       51608 :   if (cs)
    1309                 :       50957 :     if (ipa_node_params* info = ipa_node_params_sum->get (cs->caller))
    1310                 :             :       {
    1311                 :       50956 :         info->node_calling_single_call = true;
    1312                 :       50956 :         return true;
    1313                 :             :       }
    1314                 :             :   return false;
    1315                 :             : }
    1316                 :             : 
    1317                 :             : /* Initialize ipcp_lattices.  */
    1318                 :             : 
    1319                 :             : static void
    1320                 :     1194647 : initialize_node_lattices (struct cgraph_node *node)
    1321                 :             : {
    1322                 :     1194647 :   ipa_node_params *info = ipa_node_params_sum->get (node);
    1323                 :     1194647 :   struct cgraph_edge *ie;
    1324                 :     1194647 :   bool disable = false, variable = false;
    1325                 :     1194647 :   int i;
    1326                 :             : 
    1327                 :     1194647 :   gcc_checking_assert (node->has_gimple_body_p ());
    1328                 :             : 
    1329                 :     1194647 :   if (!ipa_get_param_count (info))
    1330                 :             :     disable = true;
    1331                 :      975939 :   else if (node->local)
    1332                 :             :     {
    1333                 :       80561 :       int caller_count = 0;
    1334                 :       80561 :       node->call_for_symbol_thunks_and_aliases (count_callers, &caller_count,
    1335                 :             :                                                 true);
    1336                 :       80561 :       gcc_checking_assert (caller_count > 0);
    1337                 :       80561 :       if (caller_count == 1)
    1338                 :       50957 :         node->call_for_symbol_thunks_and_aliases (set_single_call_flag,
    1339                 :             :                                                   NULL, true);
    1340                 :             :     }
    1341                 :             :   else
    1342                 :             :     {
    1343                 :             :       /* When cloning is allowed, we can assume that externally visible
    1344                 :             :          functions are not called.  We will compensate this by cloning
    1345                 :             :          later.  */
    1346                 :      895378 :       if (ipcp_versionable_function_p (node)
    1347                 :      895378 :           && ipcp_cloning_candidate_p (node))
    1348                 :             :         variable = true;
    1349                 :             :       else
    1350                 :             :         disable = true;
    1351                 :             :     }
    1352                 :             : 
    1353                 :         700 :   if (dump_file && (dump_flags & TDF_DETAILS)
    1354                 :     1194800 :       && !node->alias && !node->thunk)
    1355                 :             :     {
    1356                 :         153 :       fprintf (dump_file, "Initializing lattices of %s\n",
    1357                 :             :                node->dump_name ());
    1358                 :         153 :       if (disable || variable)
    1359                 :         110 :         fprintf (dump_file, "  Marking all lattices as %s\n",
    1360                 :             :                  disable ? "BOTTOM" : "VARIABLE");
    1361                 :             :     }
    1362                 :             : 
    1363                 :     1194647 :   auto_vec<bool, 16> surviving_params;
    1364                 :     1194647 :   bool pre_modified = false;
    1365                 :             : 
    1366                 :     1194647 :   clone_info *cinfo = clone_info::get (node);
    1367                 :             : 
    1368                 :     1194647 :   if (!disable && cinfo && cinfo->param_adjustments)
    1369                 :             :     {
    1370                 :             :       /* At the moment all IPA optimizations should use the number of
    1371                 :             :          parameters of the prevailing decl as the m_always_copy_start.
    1372                 :             :          Handling any other value would complicate the code below, so for the
    1373                 :             :          time bing let's only assert it is so.  */
    1374                 :           0 :       gcc_assert ((cinfo->param_adjustments->m_always_copy_start
    1375                 :             :                    == ipa_get_param_count (info))
    1376                 :             :                   || cinfo->param_adjustments->m_always_copy_start < 0);
    1377                 :             : 
    1378                 :           0 :       pre_modified = true;
    1379                 :           0 :       cinfo->param_adjustments->get_surviving_params (&surviving_params);
    1380                 :             : 
    1381                 :           0 :       if (dump_file && (dump_flags & TDF_DETAILS)
    1382                 :           0 :           && !node->alias && !node->thunk)
    1383                 :             :         {
    1384                 :             :           bool first = true;
    1385                 :           0 :           for (int j = 0; j < ipa_get_param_count (info); j++)
    1386                 :             :             {
    1387                 :           0 :               if (j < (int) surviving_params.length ()
    1388                 :           0 :                   && surviving_params[j])
    1389                 :           0 :                 continue;
    1390                 :           0 :               if (first)
    1391                 :             :                 {
    1392                 :           0 :                   fprintf (dump_file,
    1393                 :             :                            "  The following parameters are dead on arrival:");
    1394                 :           0 :                   first = false;
    1395                 :             :                 }
    1396                 :           0 :               fprintf (dump_file, " %u", j);
    1397                 :             :             }
    1398                 :           0 :           if (!first)
    1399                 :           0 :               fprintf (dump_file, "\n");
    1400                 :             :         }
    1401                 :             :     }
    1402                 :             : 
    1403                 :     6526844 :   for (i = 0; i < ipa_get_param_count (info); i++)
    1404                 :             :     {
    1405                 :     2178129 :       ipcp_param_lattices *plats = ipa_get_parm_lattices (info, i);
    1406                 :     2178129 :       tree type = ipa_get_type (info, i);
    1407                 :     2178129 :       if (disable
    1408                 :      191137 :           || !ipa_get_type (info, i)
    1409                 :     2369266 :           || (pre_modified && (surviving_params.length () <= (unsigned) i
    1410                 :           0 :                                || !surviving_params[i])))
    1411                 :             :         {
    1412                 :     1986992 :           plats->itself.set_to_bottom ();
    1413                 :     1986992 :           plats->ctxlat.set_to_bottom ();
    1414                 :     1986992 :           set_agg_lats_to_bottom (plats);
    1415                 :     1986992 :           plats->bits_lattice.set_to_bottom ();
    1416                 :     1986992 :           plats->m_value_range.init (type);
    1417                 :     1986992 :           plats->m_value_range.set_to_bottom ();
    1418                 :             :         }
    1419                 :             :       else
    1420                 :             :         {
    1421                 :      191137 :           plats->m_value_range.init (type);
    1422                 :      191137 :           if (variable)
    1423                 :       16136 :             set_all_contains_variable (plats);
    1424                 :             :         }
    1425                 :             :     }
    1426                 :             : 
    1427                 :     1327698 :   for (ie = node->indirect_calls; ie; ie = ie->next_callee)
    1428                 :      133051 :     if (ie->indirect_info->polymorphic
    1429                 :        9273 :         && ie->indirect_info->param_index >= 0)
    1430                 :             :       {
    1431                 :        9248 :         gcc_checking_assert (ie->indirect_info->param_index >= 0);
    1432                 :        9248 :         ipa_get_parm_lattices (info,
    1433                 :        9248 :                                ie->indirect_info->param_index)->virt_call = 1;
    1434                 :             :       }
    1435                 :     1194647 : }
    1436                 :             : 
    1437                 :             : /* Return true if VALUE can be safely IPA-CP propagated to a parameter of type
    1438                 :             :    PARAM_TYPE.  */
    1439                 :             : 
    1440                 :             : static bool
    1441                 :      376282 : ipacp_value_safe_for_type (tree param_type, tree value)
    1442                 :             : {
    1443                 :      376282 :   tree val_type = TREE_TYPE (value);
    1444                 :      376282 :   if (param_type == val_type
    1445                 :       71863 :       || useless_type_conversion_p (param_type, val_type)
    1446                 :      385716 :       || fold_convertible_p (param_type, value))
    1447                 :      376265 :     return true;
    1448                 :             :   else
    1449                 :             :     return false;
    1450                 :             : }
    1451                 :             : 
    1452                 :             : /* Return the result of a (possibly arithmetic) operation on the constant
    1453                 :             :    value INPUT.  OPERAND is 2nd operand for binary operation.  RES_TYPE is
    1454                 :             :    the type of the parameter to which the result is passed.  Return
    1455                 :             :    NULL_TREE if that cannot be determined or be considered an
    1456                 :             :    interprocedural invariant.  */
    1457                 :             : 
    1458                 :             : static tree
    1459                 :       33473 : ipa_get_jf_arith_result (enum tree_code opcode, tree input, tree operand,
    1460                 :             :                          tree res_type)
    1461                 :             : {
    1462                 :       33473 :   tree res;
    1463                 :             : 
    1464                 :       33473 :   if (opcode == NOP_EXPR)
    1465                 :             :     return input;
    1466                 :        3888 :   if (!is_gimple_ip_invariant (input))
    1467                 :             :     return NULL_TREE;
    1468                 :             : 
    1469                 :        3888 :   if (opcode == ASSERT_EXPR)
    1470                 :             :     {
    1471                 :         665 :       if (values_equal_for_ipcp_p (input, operand))
    1472                 :             :         return input;
    1473                 :             :       else
    1474                 :             :         return NULL_TREE;
    1475                 :             :     }
    1476                 :             : 
    1477                 :        3223 :   if (!res_type)
    1478                 :             :     {
    1479                 :           0 :       if (TREE_CODE_CLASS (opcode) == tcc_comparison)
    1480                 :           0 :         res_type = boolean_type_node;
    1481                 :           0 :       else if (expr_type_first_operand_type_p (opcode))
    1482                 :           0 :         res_type = TREE_TYPE (input);
    1483                 :             :       else
    1484                 :             :         return NULL_TREE;
    1485                 :             :     }
    1486                 :             : 
    1487                 :        3223 :   if (TREE_CODE_CLASS (opcode) == tcc_unary)
    1488                 :          66 :     res = fold_unary (opcode, res_type, input);
    1489                 :             :   else
    1490                 :        3157 :     res = fold_binary (opcode, res_type, input, operand);
    1491                 :             : 
    1492                 :        3223 :   if (res && !is_gimple_ip_invariant (res))
    1493                 :             :     return NULL_TREE;
    1494                 :             : 
    1495                 :             :   return res;
    1496                 :             : }
    1497                 :             : 
    1498                 :             : /* Return the result of a (possibly arithmetic) pass through jump function
    1499                 :             :    JFUNC on the constant value INPUT.  RES_TYPE is the type of the parameter
    1500                 :             :    to which the result is passed.  Return NULL_TREE if that cannot be
    1501                 :             :    determined or be considered an interprocedural invariant.  */
    1502                 :             : 
    1503                 :             : static tree
    1504                 :       11660 : ipa_get_jf_pass_through_result (struct ipa_jump_func *jfunc, tree input,
    1505                 :             :                                 tree res_type)
    1506                 :             : {
    1507                 :       11660 :   return ipa_get_jf_arith_result (ipa_get_jf_pass_through_operation (jfunc),
    1508                 :             :                                   input,
    1509                 :             :                                   ipa_get_jf_pass_through_operand (jfunc),
    1510                 :       11660 :                                   res_type);
    1511                 :             : }
    1512                 :             : 
    1513                 :             : /* Return the result of an ancestor jump function JFUNC on the constant value
    1514                 :             :    INPUT.  Return NULL_TREE if that cannot be determined.  */
    1515                 :             : 
    1516                 :             : static tree
    1517                 :         994 : ipa_get_jf_ancestor_result (struct ipa_jump_func *jfunc, tree input)
    1518                 :             : {
    1519                 :         994 :   gcc_checking_assert (TREE_CODE (input) != TREE_BINFO);
    1520                 :         994 :   if (TREE_CODE (input) == ADDR_EXPR)
    1521                 :             :     {
    1522                 :         910 :       gcc_checking_assert (is_gimple_ip_invariant_address (input));
    1523                 :         910 :       poly_int64 off = ipa_get_jf_ancestor_offset (jfunc);
    1524                 :         910 :       if (known_eq (off, 0))
    1525                 :             :         return input;
    1526                 :         843 :       poly_int64 byte_offset = exact_div (off, BITS_PER_UNIT);
    1527                 :        1686 :       return build1 (ADDR_EXPR, TREE_TYPE (input),
    1528                 :         843 :                      fold_build2 (MEM_REF, TREE_TYPE (TREE_TYPE (input)), input,
    1529                 :         843 :                                   build_int_cst (ptr_type_node, byte_offset)));
    1530                 :             :     }
    1531                 :          84 :   else if (ipa_get_jf_ancestor_keep_null (jfunc)
    1532                 :          84 :            && zerop (input))
    1533                 :             :     return input;
    1534                 :             :   else
    1535                 :          80 :     return NULL_TREE;
    1536                 :             : }
    1537                 :             : 
    1538                 :             : /* Determine whether JFUNC evaluates to a single known constant value and if
    1539                 :             :    so, return it.  Otherwise return NULL.  INFO describes the caller node or
    1540                 :             :    the one it is inlined to, so that pass-through jump functions can be
    1541                 :             :    evaluated.  PARM_TYPE is the type of the parameter to which the result is
    1542                 :             :    passed.  */
    1543                 :             : 
    1544                 :             : tree
    1545                 :    14742181 : ipa_value_from_jfunc (class ipa_node_params *info, struct ipa_jump_func *jfunc,
    1546                 :             :                       tree parm_type)
    1547                 :             : {
    1548                 :    14742181 :   if (jfunc->type == IPA_JF_CONST)
    1549                 :     3978728 :     return ipa_get_jf_constant (jfunc);
    1550                 :    10763453 :   else if (jfunc->type == IPA_JF_PASS_THROUGH
    1551                 :     8175409 :            || jfunc->type == IPA_JF_ANCESTOR)
    1552                 :             :     {
    1553                 :     3221231 :       tree input;
    1554                 :     3221231 :       int idx;
    1555                 :             : 
    1556                 :     3221231 :       if (jfunc->type == IPA_JF_PASS_THROUGH)
    1557                 :     2588044 :         idx = ipa_get_jf_pass_through_formal_id (jfunc);
    1558                 :             :       else
    1559                 :      633187 :         idx = ipa_get_jf_ancestor_formal_id (jfunc);
    1560                 :             : 
    1561                 :     3221231 :       if (info->ipcp_orig_node)
    1562                 :       37949 :         input = info->known_csts[idx];
    1563                 :             :       else
    1564                 :             :         {
    1565                 :     3183282 :           ipcp_lattice<tree> *lat;
    1566                 :             : 
    1567                 :     5882235 :           if (info->lattices.is_empty ()
    1568                 :     2698953 :               || idx >= ipa_get_param_count (info))
    1569                 :             :             return NULL_TREE;
    1570                 :     2698953 :           lat = ipa_get_scalar_lat (info, idx);
    1571                 :     2698953 :           if (!lat->is_single_const ())
    1572                 :             :             return NULL_TREE;
    1573                 :         145 :           input = lat->values->value;
    1574                 :             :         }
    1575                 :             : 
    1576                 :       38094 :       if (!input)
    1577                 :             :         return NULL_TREE;
    1578                 :             : 
    1579                 :       12334 :       if (jfunc->type == IPA_JF_PASS_THROUGH)
    1580                 :       11660 :         return ipa_get_jf_pass_through_result (jfunc, input, parm_type);
    1581                 :             :       else
    1582                 :         674 :         return ipa_get_jf_ancestor_result (jfunc, input);
    1583                 :             :     }
    1584                 :             :   else
    1585                 :             :     return NULL_TREE;
    1586                 :             : }
    1587                 :             : 
    1588                 :             : /* Determine whether JFUNC evaluates to single known polymorphic context, given
    1589                 :             :    that INFO describes the caller node or the one it is inlined to, CS is the
    1590                 :             :    call graph edge corresponding to JFUNC and CSIDX index of the described
    1591                 :             :    parameter.  */
    1592                 :             : 
    1593                 :             : ipa_polymorphic_call_context
    1594                 :      238418 : ipa_context_from_jfunc (ipa_node_params *info, cgraph_edge *cs, int csidx,
    1595                 :             :                         ipa_jump_func *jfunc)
    1596                 :             : {
    1597                 :      238418 :   ipa_edge_args *args = ipa_edge_args_sum->get (cs);
    1598                 :      238418 :   ipa_polymorphic_call_context ctx;
    1599                 :      238418 :   ipa_polymorphic_call_context *edge_ctx
    1600                 :      238418 :     = cs ? ipa_get_ith_polymorhic_call_context (args, csidx) : NULL;
    1601                 :             : 
    1602                 :      195165 :   if (edge_ctx && !edge_ctx->useless_p ())
    1603                 :      193728 :     ctx = *edge_ctx;
    1604                 :             : 
    1605                 :      238418 :   if (jfunc->type == IPA_JF_PASS_THROUGH
    1606                 :      203769 :       || jfunc->type == IPA_JF_ANCESTOR)
    1607                 :             :     {
    1608                 :       38307 :       ipa_polymorphic_call_context srcctx;
    1609                 :       38307 :       int srcidx;
    1610                 :       38307 :       bool type_preserved = true;
    1611                 :       38307 :       if (jfunc->type == IPA_JF_PASS_THROUGH)
    1612                 :             :         {
    1613                 :       34649 :           if (ipa_get_jf_pass_through_operation (jfunc) != NOP_EXPR)
    1614                 :         273 :             return ctx;
    1615                 :       34376 :           type_preserved = ipa_get_jf_pass_through_type_preserved (jfunc);
    1616                 :       34376 :           srcidx = ipa_get_jf_pass_through_formal_id (jfunc);
    1617                 :             :         }
    1618                 :             :       else
    1619                 :             :         {
    1620                 :        3658 :           type_preserved = ipa_get_jf_ancestor_type_preserved (jfunc);
    1621                 :        3658 :           srcidx = ipa_get_jf_ancestor_formal_id (jfunc);
    1622                 :             :         }
    1623                 :       38034 :       if (info->ipcp_orig_node)
    1624                 :             :         {
    1625                 :        2994 :           if (info->known_contexts.exists ())
    1626                 :         450 :             srcctx = info->known_contexts[srcidx];
    1627                 :             :         }
    1628                 :             :       else
    1629                 :             :         {
    1630                 :       68014 :           if (info->lattices.is_empty ()
    1631                 :       32974 :               || srcidx >= ipa_get_param_count (info))
    1632                 :        2066 :             return ctx;
    1633                 :       32974 :           ipcp_lattice<ipa_polymorphic_call_context> *lat;
    1634                 :       32974 :           lat = ipa_get_poly_ctx_lat (info, srcidx);
    1635                 :       32974 :           if (!lat->is_single_const ())
    1636                 :       32097 :             return ctx;
    1637                 :         877 :           srcctx = lat->values->value;
    1638                 :             :         }
    1639                 :        3871 :       if (srcctx.useless_p ())
    1640                 :        2567 :         return ctx;
    1641                 :        1304 :       if (jfunc->type == IPA_JF_ANCESTOR)
    1642                 :          92 :         srcctx.offset_by (ipa_get_jf_ancestor_offset (jfunc));
    1643                 :        1304 :       if (!type_preserved)
    1644                 :         495 :         srcctx.possible_dynamic_type_change (cs->in_polymorphic_cdtor);
    1645                 :        1304 :       srcctx.combine_with (ctx);
    1646                 :        1304 :       return srcctx;
    1647                 :             :     }
    1648                 :             : 
    1649                 :      200111 :   return ctx;
    1650                 :             : }
    1651                 :             : 
    1652                 :             : /* Emulate effects of unary OPERATION and/or conversion from SRC_TYPE to
    1653                 :             :    DST_TYPE on value range in SRC_VR and store it to DST_VR.  Return true if
    1654                 :             :    the result is a range that is not VARYING nor UNDEFINED.  */
    1655                 :             : 
    1656                 :             : bool
    1657                 :     7329359 : ipa_vr_operation_and_type_effects (vrange &dst_vr,
    1658                 :             :                                    const vrange &src_vr,
    1659                 :             :                                    enum tree_code operation,
    1660                 :             :                                    tree dst_type, tree src_type)
    1661                 :             : {
    1662                 :    13847802 :   if (!ipa_vr_supported_type_p (dst_type)
    1663                 :           0 :       || !ipa_vr_supported_type_p (src_type))
    1664                 :             :     return false;
    1665                 :             : 
    1666                 :     7329359 :   range_op_handler handler (operation);
    1667                 :     7329359 :   if (!handler)
    1668                 :             :     return false;
    1669                 :             : 
    1670                 :     7329359 :   value_range varying (dst_type);
    1671                 :     7329359 :   varying.set_varying (dst_type);
    1672                 :             : 
    1673                 :     7329359 :   return (handler.operand_check_p (dst_type, src_type, dst_type)
    1674                 :     7329306 :           && handler.fold_range (dst_vr, dst_type, src_vr, varying)
    1675                 :     7329304 :           && !dst_vr.varying_p ()
    1676                 :    14658587 :           && !dst_vr.undefined_p ());
    1677                 :     7329359 : }
    1678                 :             : 
    1679                 :             : /* Same as above, but the SRC_VR argument is an IPA_VR which must
    1680                 :             :    first be extracted onto a vrange.  */
    1681                 :             : 
    1682                 :             : bool
    1683                 :     7238220 : ipa_vr_operation_and_type_effects (vrange &dst_vr,
    1684                 :             :                                    const ipa_vr &src_vr,
    1685                 :             :                                    enum tree_code operation,
    1686                 :             :                                    tree dst_type, tree src_type)
    1687                 :             : {
    1688                 :     7238220 :   value_range tmp;
    1689                 :     7238220 :   src_vr.get_vrange (tmp);
    1690                 :     7238220 :   return ipa_vr_operation_and_type_effects (dst_vr, tmp, operation,
    1691                 :     7238220 :                                             dst_type, src_type);
    1692                 :     7238220 : }
    1693                 :             : 
    1694                 :             : /* Given a PASS_THROUGH jump function JFUNC that takes as its source SRC_VR of
    1695                 :             :    SRC_TYPE and the result needs to be DST_TYPE, if any value range information
    1696                 :             :    can be deduced at all, intersect VR with it.  CONTEXT_NODE is the call graph
    1697                 :             :    node representing the function for which optimization flags should be
    1698                 :             :    evaluated.  */
    1699                 :             : 
    1700                 :             : static void
    1701                 :       91566 : ipa_vr_intersect_with_arith_jfunc (vrange &vr,
    1702                 :             :                                    ipa_jump_func *jfunc,
    1703                 :             :                                    cgraph_node *context_node,
    1704                 :             :                                    const value_range &src_vr,
    1705                 :             :                                    tree src_type,
    1706                 :             :                                    tree dst_type)
    1707                 :             : {
    1708                 :       91566 :   if (src_vr.undefined_p () || src_vr.varying_p ())
    1709                 :       90290 :     return;
    1710                 :             : 
    1711                 :       91139 :   enum tree_code operation = ipa_get_jf_pass_through_operation (jfunc);
    1712                 :       91139 :   if (TREE_CODE_CLASS (operation) == tcc_unary)
    1713                 :             :     {
    1714                 :       89863 :       value_range tmp_res (dst_type);
    1715                 :       89863 :       if (ipa_vr_operation_and_type_effects (tmp_res, src_vr, operation,
    1716                 :             :                                              dst_type, src_type))
    1717                 :       89810 :         vr.intersect (tmp_res);
    1718                 :       89863 :       return;
    1719                 :       89863 :     }
    1720                 :             : 
    1721                 :        1276 :   tree operand = ipa_get_jf_pass_through_operand (jfunc);
    1722                 :        1276 :   range_op_handler handler (operation);
    1723                 :        1276 :   if (!handler)
    1724                 :             :     return;
    1725                 :        1276 :   value_range op_vr (TREE_TYPE (operand));
    1726                 :        1276 :   ipa_get_range_from_ip_invariant (op_vr, operand, context_node);
    1727                 :             : 
    1728                 :        1276 :   tree operation_type;
    1729                 :        1276 :   if (TREE_CODE_CLASS (operation) == tcc_comparison)
    1730                 :          66 :     operation_type = boolean_type_node;
    1731                 :             :   else
    1732                 :             :     operation_type = src_type;
    1733                 :             : 
    1734                 :        1276 :   value_range op_res (dst_type);
    1735                 :        1787 :   if (!ipa_vr_supported_type_p (operation_type)
    1736                 :        1276 :       || !handler.operand_check_p (operation_type, src_type, op_vr.type ())
    1737                 :        1276 :       || !handler.fold_range (op_res, operation_type, src_vr, op_vr))
    1738                 :           0 :     return;
    1739                 :             : 
    1740                 :        1276 :   value_range tmp_res (dst_type);
    1741                 :        1276 :   if (ipa_vr_operation_and_type_effects (tmp_res, op_res, NOP_EXPR, dst_type,
    1742                 :             :                                          operation_type))
    1743                 :        1212 :       vr.intersect (tmp_res);
    1744                 :        1276 : }
    1745                 :             : 
    1746                 :             : /* Determine range of JFUNC given that INFO describes the caller node or
    1747                 :             :    the one it is inlined to, CS is the call graph edge corresponding to JFUNC
    1748                 :             :    and PARM_TYPE of the parameter.  */
    1749                 :             : 
    1750                 :             : void
    1751                 :     9678499 : ipa_value_range_from_jfunc (vrange &vr,
    1752                 :             :                             ipa_node_params *info, cgraph_edge *cs,
    1753                 :             :                             ipa_jump_func *jfunc, tree parm_type)
    1754                 :             : {
    1755                 :     9678499 :   vr.set_varying (parm_type);
    1756                 :             : 
    1757                 :     9678499 :   if (jfunc->m_vr && jfunc->m_vr->known_p ())
    1758                 :     6543343 :     ipa_vr_operation_and_type_effects (vr,
    1759                 :             :                                        *jfunc->m_vr,
    1760                 :             :                                        NOP_EXPR, parm_type,
    1761                 :     6543343 :                                        jfunc->m_vr->type ());
    1762                 :     9678499 :   if (vr.singleton_p ())
    1763                 :             :     return;
    1764                 :             : 
    1765                 :     9678463 :   if (jfunc->type == IPA_JF_PASS_THROUGH)
    1766                 :             :     {
    1767                 :     2013451 :       ipcp_transformation *sum
    1768                 :     2013451 :         = ipcp_get_transformation_summary (cs->caller->inlined_to
    1769                 :             :                                            ? cs->caller->inlined_to
    1770                 :             :                                            : cs->caller);
    1771                 :     2013451 :       if (!sum || !sum->m_vr)
    1772                 :     1937732 :         return;
    1773                 :             : 
    1774                 :      110535 :       int idx = ipa_get_jf_pass_through_formal_id (jfunc);
    1775                 :             : 
    1776                 :      110535 :       if (!(*sum->m_vr)[idx].known_p ())
    1777                 :             :         return;
    1778                 :       75719 :       tree src_type = ipa_get_type (info, idx);
    1779                 :       75719 :       value_range srcvr;
    1780                 :       75719 :       (*sum->m_vr)[idx].get_vrange (srcvr);
    1781                 :             : 
    1782                 :       75719 :       ipa_vr_intersect_with_arith_jfunc (vr, jfunc, cs->caller, srcvr, src_type,
    1783                 :             :                                          parm_type);
    1784                 :       75719 :     }
    1785                 :             : }
    1786                 :             : 
    1787                 :             : /* Determine whether ITEM, jump function for an aggregate part, evaluates to a
    1788                 :             :    single known constant value and if so, return it.  Otherwise return NULL.
    1789                 :             :    NODE and INFO describes the caller node or the one it is inlined to, and
    1790                 :             :    its related info.  */
    1791                 :             : 
    1792                 :             : tree
    1793                 :     1620680 : ipa_agg_value_from_jfunc (ipa_node_params *info, cgraph_node *node,
    1794                 :             :                           const ipa_agg_jf_item *item)
    1795                 :             : {
    1796                 :     1620680 :   tree value = NULL_TREE;
    1797                 :     1620680 :   int src_idx;
    1798                 :             : 
    1799                 :     1620680 :   if (item->offset < 0
    1800                 :     1590252 :       || item->jftype == IPA_JF_UNKNOWN
    1801                 :     1502809 :       || item->offset >= (HOST_WIDE_INT) UINT_MAX * BITS_PER_UNIT)
    1802                 :             :     return NULL_TREE;
    1803                 :             : 
    1804                 :     1502809 :   if (item->jftype == IPA_JF_CONST)
    1805                 :     1240546 :     return item->value.constant;
    1806                 :             : 
    1807                 :      262263 :   gcc_checking_assert (item->jftype == IPA_JF_PASS_THROUGH
    1808                 :             :                        || item->jftype == IPA_JF_LOAD_AGG);
    1809                 :             : 
    1810                 :      262263 :   src_idx = item->value.pass_through.formal_id;
    1811                 :             : 
    1812                 :      262263 :   if (info->ipcp_orig_node)
    1813                 :             :     {
    1814                 :        5217 :       if (item->jftype == IPA_JF_PASS_THROUGH)
    1815                 :        1347 :         value = info->known_csts[src_idx];
    1816                 :        3870 :       else if (ipcp_transformation *ts = ipcp_get_transformation_summary (node))
    1817                 :             :         {
    1818                 :        3870 :           ipa_argagg_value_list avl (ts);
    1819                 :        3870 :           value = avl.get_value (src_idx,
    1820                 :        3870 :                                  item->value.load_agg.offset / BITS_PER_UNIT,
    1821                 :        3870 :                                  item->value.load_agg.by_ref);
    1822                 :             :         }
    1823                 :             :     }
    1824                 :      257046 :   else if (!info->lattices.is_empty ())
    1825                 :             :     {
    1826                 :      186839 :       class ipcp_param_lattices *src_plats
    1827                 :      186839 :         = ipa_get_parm_lattices (info, src_idx);
    1828                 :             : 
    1829                 :      186839 :       if (item->jftype == IPA_JF_PASS_THROUGH)
    1830                 :             :         {
    1831                 :      118232 :           struct ipcp_lattice<tree> *lat = &src_plats->itself;
    1832                 :             : 
    1833                 :      383284 :           if (!lat->is_single_const ())
    1834                 :             :             return NULL_TREE;
    1835                 :             : 
    1836                 :           0 :           value = lat->values->value;
    1837                 :             :         }
    1838                 :       68607 :       else if (src_plats->aggs
    1839                 :        6710 :                && !src_plats->aggs_bottom
    1840                 :        6710 :                && !src_plats->aggs_contain_variable
    1841                 :        1215 :                && src_plats->aggs_by_ref == item->value.load_agg.by_ref)
    1842                 :             :         {
    1843                 :             :           struct ipcp_agg_lattice *aglat;
    1844                 :             : 
    1845                 :        1986 :           for (aglat = src_plats->aggs; aglat; aglat = aglat->next)
    1846                 :             :             {
    1847                 :        1986 :               if (aglat->offset > item->value.load_agg.offset)
    1848                 :             :                 break;
    1849                 :             : 
    1850                 :        1982 :               if (aglat->offset == item->value.load_agg.offset)
    1851                 :             :                 {
    1852                 :        1211 :                   if (aglat->is_single_const ())
    1853                 :           3 :                     value = aglat->values->value;
    1854                 :             :                   break;
    1855                 :             :                 }
    1856                 :             :             }
    1857                 :             :         }
    1858                 :             :     }
    1859                 :             : 
    1860                 :        5224 :   if (!value)
    1861                 :      141760 :     return NULL_TREE;
    1862                 :             : 
    1863                 :        2271 :   if (item->jftype == IPA_JF_LOAD_AGG)
    1864                 :             :     {
    1865                 :        1598 :       tree load_type = item->value.load_agg.type;
    1866                 :        1598 :       tree value_type = TREE_TYPE (value);
    1867                 :             : 
    1868                 :             :       /* Ensure value type is compatible with load type.  */
    1869                 :        1598 :       if (!useless_type_conversion_p (load_type, value_type))
    1870                 :             :         return NULL_TREE;
    1871                 :             :     }
    1872                 :             : 
    1873                 :        2271 :   return ipa_get_jf_arith_result (item->value.pass_through.operation,
    1874                 :             :                                   value,
    1875                 :        2271 :                                   item->value.pass_through.operand,
    1876                 :        2271 :                                   item->type);
    1877                 :             : }
    1878                 :             : 
    1879                 :             : /* Process all items in AGG_JFUNC relative to caller (or the node the original
    1880                 :             :   caller is inlined to) NODE which described by INFO and push the results to
    1881                 :             :   RES as describing values passed in parameter DST_INDEX.  */
    1882                 :             : 
    1883                 :             : void
    1884                 :    12103266 : ipa_push_agg_values_from_jfunc (ipa_node_params *info, cgraph_node *node,
    1885                 :             :                                 ipa_agg_jump_function *agg_jfunc,
    1886                 :             :                                 unsigned dst_index,
    1887                 :             :                                 vec<ipa_argagg_value> *res)
    1888                 :             : {
    1889                 :    12103266 :   unsigned prev_unit_offset = 0;
    1890                 :    12103266 :   bool first = true;
    1891                 :             : 
    1892                 :    15256741 :   for (const ipa_agg_jf_item &item : agg_jfunc->items)
    1893                 :             :     {
    1894                 :     1576235 :       tree value = ipa_agg_value_from_jfunc (info, node, &item);
    1895                 :     1576235 :       if (!value)
    1896                 :      376644 :         continue;
    1897                 :             : 
    1898                 :     1199591 :       ipa_argagg_value iav;
    1899                 :     1199591 :       iav.value = value;
    1900                 :     1199591 :       iav.unit_offset = item.offset / BITS_PER_UNIT;
    1901                 :     1199591 :       iav.index = dst_index;
    1902                 :     1199591 :       iav.by_ref = agg_jfunc->by_ref;
    1903                 :     1199591 :       iav.killed = 0;
    1904                 :             : 
    1905                 :     1199591 :       gcc_assert (first
    1906                 :             :                   || iav.unit_offset > prev_unit_offset);
    1907                 :     1199591 :       prev_unit_offset = iav.unit_offset;
    1908                 :     1199591 :       first = false;
    1909                 :             : 
    1910                 :     1199591 :       res->safe_push (iav);
    1911                 :             :     }
    1912                 :    12103266 : }
    1913                 :             : 
    1914                 :             : /* If checking is enabled, verify that no lattice is in the TOP state, i.e. not
    1915                 :             :    bottom, not containing a variable component and without any known value at
    1916                 :             :    the same time.  */
    1917                 :             : 
    1918                 :             : DEBUG_FUNCTION void
    1919                 :      125022 : ipcp_verify_propagated_values (void)
    1920                 :             : {
    1921                 :      125022 :   struct cgraph_node *node;
    1922                 :             : 
    1923                 :     1330139 :   FOR_EACH_FUNCTION_WITH_GIMPLE_BODY (node)
    1924                 :             :     {
    1925                 :     1205117 :       ipa_node_params *info = ipa_node_params_sum->get (node);
    1926                 :     1205117 :       if (!opt_for_fn (node->decl, flag_ipa_cp)
    1927                 :     1205117 :           || !opt_for_fn (node->decl, optimize))
    1928                 :       10487 :         continue;
    1929                 :     1194630 :       int i, count = ipa_get_param_count (info);
    1930                 :             : 
    1931                 :     3372745 :       for (i = 0; i < count; i++)
    1932                 :             :         {
    1933                 :     2178115 :           ipcp_lattice<tree> *lat = ipa_get_scalar_lat (info, i);
    1934                 :             : 
    1935                 :     2178115 :           if (!lat->bottom
    1936                 :      190230 :               && !lat->contains_variable
    1937                 :       31016 :               && lat->values_count == 0)
    1938                 :             :             {
    1939                 :           0 :               if (dump_file)
    1940                 :             :                 {
    1941                 :           0 :                   symtab->dump (dump_file);
    1942                 :           0 :                   fprintf (dump_file, "\nIPA lattices after constant "
    1943                 :             :                            "propagation, before gcc_unreachable:\n");
    1944                 :           0 :                   print_all_lattices (dump_file, true, false);
    1945                 :             :                 }
    1946                 :             : 
    1947                 :           0 :               gcc_unreachable ();
    1948                 :             :             }
    1949                 :             :         }
    1950                 :             :     }
    1951                 :      125022 : }
    1952                 :             : 
    1953                 :             : /* Return true iff X and Y should be considered equal contexts by IPA-CP.  */
    1954                 :             : 
    1955                 :             : static bool
    1956                 :        2284 : values_equal_for_ipcp_p (ipa_polymorphic_call_context x,
    1957                 :             :                          ipa_polymorphic_call_context y)
    1958                 :             : {
    1959                 :        2156 :   return x.equal_to (y);
    1960                 :             : }
    1961                 :             : 
    1962                 :             : 
    1963                 :             : /* Add a new value source to the value represented by THIS, marking that a
    1964                 :             :    value comes from edge CS and (if the underlying jump function is a
    1965                 :             :    pass-through or an ancestor one) from a caller value SRC_VAL of a caller
    1966                 :             :    parameter described by SRC_INDEX.  OFFSET is negative if the source was the
    1967                 :             :    scalar value of the parameter itself or the offset within an aggregate.  */
    1968                 :             : 
    1969                 :             : template <typename valtype>
    1970                 :             : void
    1971                 :      328155 : ipcp_value<valtype>::add_source (cgraph_edge *cs, ipcp_value *src_val,
    1972                 :             :                                  int src_idx, HOST_WIDE_INT offset)
    1973                 :             : {
    1974                 :             :   ipcp_value_source<valtype> *src;
    1975                 :             : 
    1976                 :      454052 :   src = new (ipcp_sources_pool.allocate ()) ipcp_value_source<valtype>;
    1977                 :      454052 :   src->offset = offset;
    1978                 :      454052 :   src->cs = cs;
    1979                 :      454052 :   src->val = src_val;
    1980                 :      454052 :   src->index = src_idx;
    1981                 :             : 
    1982                 :      454052 :   src->next = sources;
    1983                 :      454052 :   sources = src;
    1984                 :             : }
    1985                 :             : 
    1986                 :             : /* Allocate a new ipcp_value holding a tree constant, initialize its value to
    1987                 :             :    SOURCE and clear all other fields.  */
    1988                 :             : 
    1989                 :             : static ipcp_value<tree> *
    1990                 :      118979 : allocate_and_init_ipcp_value (tree cst, unsigned same_lat_gen_level)
    1991                 :             : {
    1992                 :      118979 :   ipcp_value<tree> *val;
    1993                 :             : 
    1994                 :      237958 :   val = new (ipcp_cst_values_pool.allocate ()) ipcp_value<tree>();
    1995                 :      118979 :   val->value = cst;
    1996                 :      118979 :   val->self_recursion_generated_level = same_lat_gen_level;
    1997                 :      118979 :   return val;
    1998                 :             : }
    1999                 :             : 
    2000                 :             : /* Allocate a new ipcp_value holding a polymorphic context, initialize its
    2001                 :             :    value to SOURCE and clear all other fields.  */
    2002                 :             : 
    2003                 :             : static ipcp_value<ipa_polymorphic_call_context> *
    2004                 :        6918 : allocate_and_init_ipcp_value (ipa_polymorphic_call_context ctx,
    2005                 :             :                               unsigned same_lat_gen_level)
    2006                 :             : {
    2007                 :        6918 :   ipcp_value<ipa_polymorphic_call_context> *val;
    2008                 :             : 
    2009                 :        6918 :   val = new (ipcp_poly_ctx_values_pool.allocate ())
    2010                 :        6918 :     ipcp_value<ipa_polymorphic_call_context>();
    2011                 :        6918 :   val->value = ctx;
    2012                 :        6918 :   val->self_recursion_generated_level = same_lat_gen_level;
    2013                 :        6918 :   return val;
    2014                 :             : }
    2015                 :             : 
    2016                 :             : /* Try to add NEWVAL to LAT, potentially creating a new ipcp_value for it.  CS,
    2017                 :             :    SRC_VAL SRC_INDEX and OFFSET are meant for add_source and have the same
    2018                 :             :    meaning.  OFFSET -1 means the source is scalar and not a part of an
    2019                 :             :    aggregate.  If non-NULL, VAL_P records address of existing or newly added
    2020                 :             :    ipcp_value.
    2021                 :             : 
    2022                 :             :    If the value is generated for a self-recursive call as a result of an
    2023                 :             :    arithmetic pass-through jump-function acting on a value in the same lattice,
    2024                 :             :    SAME_LAT_GEN_LEVEL must be the length of such chain, otherwise it must be
    2025                 :             :    zero.  If it is non-zero, PARAM_IPA_CP_VALUE_LIST_SIZE limit is ignored.  */
    2026                 :             : 
    2027                 :             : template <typename valtype>
    2028                 :             : bool
    2029                 :      465994 : ipcp_lattice<valtype>::add_value (valtype newval, cgraph_edge *cs,
    2030                 :             :                                   ipcp_value<valtype> *src_val,
    2031                 :             :                                   int src_idx, HOST_WIDE_INT offset,
    2032                 :             :                                   ipcp_value<valtype> **val_p,
    2033                 :             :                                   unsigned same_lat_gen_level)
    2034                 :             : {
    2035                 :      465994 :   ipcp_value<valtype> *val, *last_val = NULL;
    2036                 :             : 
    2037                 :      465994 :   if (val_p)
    2038                 :        1824 :     *val_p = NULL;
    2039                 :             : 
    2040                 :      465994 :   if (bottom)
    2041                 :             :     return false;
    2042                 :             : 
    2043                 :      923818 :   for (val = values; val; last_val = val, val = val->next)
    2044                 :      796681 :     if (values_equal_for_ipcp_p (val->value, newval))
    2045                 :             :       {
    2046                 :      335779 :         if (val_p)
    2047                 :        1011 :           *val_p = val;
    2048                 :             : 
    2049                 :      335779 :         if (val->self_recursion_generated_level < same_lat_gen_level)
    2050                 :         158 :           val->self_recursion_generated_level = same_lat_gen_level;
    2051                 :             : 
    2052                 :      335779 :         if (ipa_edge_within_scc (cs))
    2053                 :             :           {
    2054                 :             :             ipcp_value_source<valtype> *s;
    2055                 :       52599 :             for (s = val->sources; s; s = s->next)
    2056                 :       48434 :               if (s->cs == cs && s->val == src_val)
    2057                 :             :                 break;
    2058                 :       11789 :             if (s)
    2059                 :             :               return false;
    2060                 :             :           }
    2061                 :             : 
    2062                 :      328155 :         val->add_source (cs, src_val, src_idx, offset);
    2063                 :      328155 :         return false;
    2064                 :             :       }
    2065                 :             : 
    2066                 :      127137 :   if (!same_lat_gen_level && values_count >= opt_for_fn (cs->callee->decl,
    2067                 :             :                                                 param_ipa_cp_value_list_size))
    2068                 :             :     {
    2069                 :             :       /* We can only free sources, not the values themselves, because sources
    2070                 :             :          of other values in this SCC might point to them.   */
    2071                 :       11142 :       for (val = values; val; val = val->next)
    2072                 :             :         {
    2073                 :       38232 :           while (val->sources)
    2074                 :             :             {
    2075                 :       28330 :               ipcp_value_source<valtype> *src = val->sources;
    2076                 :       28330 :               val->sources = src->next;
    2077                 :       28330 :               ipcp_sources_pool.remove ((ipcp_value_source<tree>*)src);
    2078                 :             :             }
    2079                 :             :         }
    2080                 :        1240 :       values = NULL;
    2081                 :        1240 :       return set_to_bottom ();
    2082                 :             :     }
    2083                 :             : 
    2084                 :      125897 :   values_count++;
    2085                 :      125897 :   val = allocate_and_init_ipcp_value (newval, same_lat_gen_level);
    2086                 :      125897 :   val->add_source (cs, src_val, src_idx, offset);
    2087                 :      125897 :   val->next = NULL;
    2088                 :             : 
    2089                 :             :   /* Add the new value to end of value list, which can reduce iterations
    2090                 :             :      of propagation stage for recursive function.  */
    2091                 :      125897 :   if (last_val)
    2092                 :       40890 :     last_val->next = val;
    2093                 :             :   else
    2094                 :       85007 :     values = val;
    2095                 :             : 
    2096                 :      125897 :   if (val_p)
    2097                 :         813 :     *val_p = val;
    2098                 :             : 
    2099                 :             :   return true;
    2100                 :             : }
    2101                 :             : 
    2102                 :             : /* A helper function that returns result of operation specified by OPCODE on
    2103                 :             :    the value of SRC_VAL.  If non-NULL, OPND1_TYPE is expected type for the
    2104                 :             :    value of SRC_VAL.  If the operation is binary, OPND2 is a constant value
    2105                 :             :    acting as its second operand.  If non-NULL, RES_TYPE is expected type of
    2106                 :             :    the result.  */
    2107                 :             : 
    2108                 :             : static tree
    2109                 :       19512 : get_val_across_arith_op (enum tree_code opcode,
    2110                 :             :                          tree opnd1_type,
    2111                 :             :                          tree opnd2,
    2112                 :             :                          ipcp_value<tree> *src_val,
    2113                 :             :                          tree res_type)
    2114                 :             : {
    2115                 :       19512 :   tree opnd1 = src_val->value;
    2116                 :             : 
    2117                 :             :   /* Skip source values that is incompatible with specified type.  */
    2118                 :       19512 :   if (opnd1_type
    2119                 :       19512 :       && !useless_type_conversion_p (opnd1_type, TREE_TYPE (opnd1)))
    2120                 :             :     return NULL_TREE;
    2121                 :             : 
    2122                 :       19512 :   return ipa_get_jf_arith_result (opcode, opnd1, opnd2, res_type);
    2123                 :             : }
    2124                 :             : 
    2125                 :             : /* Propagate values through an arithmetic transformation described by a jump
    2126                 :             :    function associated with edge CS, taking values from SRC_LAT and putting
    2127                 :             :    them into DEST_LAT.  OPND1_TYPE is expected type for the values in SRC_LAT.
    2128                 :             :    OPND2 is a constant value if transformation is a binary operation.
    2129                 :             :    SRC_OFFSET specifies offset in an aggregate if SRC_LAT describes lattice of
    2130                 :             :    a part of the aggregate.  SRC_IDX is the index of the source parameter.
    2131                 :             :    RES_TYPE is the value type of result being propagated into.  Return true if
    2132                 :             :    DEST_LAT changed.  */
    2133                 :             : 
    2134                 :             : static bool
    2135                 :       73306 : propagate_vals_across_arith_jfunc (cgraph_edge *cs,
    2136                 :             :                                    enum tree_code opcode,
    2137                 :             :                                    tree opnd1_type,
    2138                 :             :                                    tree opnd2,
    2139                 :             :                                    ipcp_lattice<tree> *src_lat,
    2140                 :             :                                    ipcp_lattice<tree> *dest_lat,
    2141                 :             :                                    HOST_WIDE_INT src_offset,
    2142                 :             :                                    int src_idx,
    2143                 :             :                                    tree res_type)
    2144                 :             : {
    2145                 :       73306 :   ipcp_value<tree> *src_val;
    2146                 :       73306 :   bool ret = false;
    2147                 :             : 
    2148                 :             :   /* Due to circular dependencies, propagating within an SCC through arithmetic
    2149                 :             :      transformation would create infinite number of values.  But for
    2150                 :             :      self-feeding recursive function, we could allow propagation in a limited
    2151                 :             :      count, and this can enable a simple kind of recursive function versioning.
    2152                 :             :      For other scenario, we would just make lattices bottom.  */
    2153                 :       73306 :   if (opcode != NOP_EXPR && ipa_edge_within_scc (cs))
    2154                 :             :     {
    2155                 :        2676 :       int i;
    2156                 :             : 
    2157                 :        2676 :       int max_recursive_depth = opt_for_fn(cs->caller->decl,
    2158                 :             :                                            param_ipa_cp_max_recursive_depth);
    2159                 :        2676 :       if (src_lat != dest_lat || max_recursive_depth < 1)
    2160                 :        2099 :         return dest_lat->set_contains_variable ();
    2161                 :             : 
    2162                 :             :       /* No benefit if recursive execution is in low probability.  */
    2163                 :        1798 :       if (cs->sreal_frequency () * 100
    2164                 :        3596 :           <= ((sreal) 1) * opt_for_fn (cs->caller->decl,
    2165                 :             :                                        param_ipa_cp_min_recursive_probability))
    2166                 :          87 :         return dest_lat->set_contains_variable ();
    2167                 :             : 
    2168                 :        1711 :       auto_vec<ipcp_value<tree> *, 8> val_seeds;
    2169                 :             : 
    2170                 :        3897 :       for (src_val = src_lat->values; src_val; src_val = src_val->next)
    2171                 :             :         {
    2172                 :             :           /* Now we do not use self-recursively generated value as propagation
    2173                 :             :              source, this is absolutely conservative, but could avoid explosion
    2174                 :             :              of lattice's value space, especially when one recursive function
    2175                 :             :              calls another recursive.  */
    2176                 :        3320 :           if (src_val->self_recursion_generated_p ())
    2177                 :             :             {
    2178                 :        1966 :               ipcp_value_source<tree> *s;
    2179                 :             : 
    2180                 :             :               /* If the lattice has already been propagated for the call site,
    2181                 :             :                  no need to do that again.  */
    2182                 :        6947 :               for (s = src_val->sources; s; s = s->next)
    2183                 :        6115 :                 if (s->cs == cs)
    2184                 :        1134 :                   return dest_lat->set_contains_variable ();
    2185                 :             :             }
    2186                 :             :           else
    2187                 :        1354 :             val_seeds.safe_push (src_val);
    2188                 :             :         }
    2189                 :             : 
    2190                 :        1154 :       gcc_assert ((int) val_seeds.length () <= param_ipa_cp_value_list_size);
    2191                 :             : 
    2192                 :             :       /* Recursively generate lattice values with a limited count.  */
    2193                 :        1053 :       FOR_EACH_VEC_ELT (val_seeds, i, src_val)
    2194                 :             :         {
    2195                 :        2062 :           for (int j = 1; j < max_recursive_depth; j++)
    2196                 :             :             {
    2197                 :        1826 :               tree cstval = get_val_across_arith_op (opcode, opnd1_type, opnd2,
    2198                 :             :                                                      src_val, res_type);
    2199                 :        1826 :               if (!cstval
    2200                 :        1826 :                   || !ipacp_value_safe_for_type (res_type, cstval))
    2201                 :             :                 break;
    2202                 :             : 
    2203                 :        1824 :               ret |= dest_lat->add_value (cstval, cs, src_val, src_idx,
    2204                 :             :                                           src_offset, &src_val, j);
    2205                 :        1824 :               gcc_checking_assert (src_val);
    2206                 :             :             }
    2207                 :             :         }
    2208                 :         577 :       ret |= dest_lat->set_contains_variable ();
    2209                 :        1711 :     }
    2210                 :             :   else
    2211                 :       89589 :     for (src_val = src_lat->values; src_val; src_val = src_val->next)
    2212                 :             :       {
    2213                 :             :         /* Now we do not use self-recursively generated value as propagation
    2214                 :             :            source, otherwise it is easy to make value space of normal lattice
    2215                 :             :            overflow.  */
    2216                 :       18959 :         if (src_val->self_recursion_generated_p ())
    2217                 :             :           {
    2218                 :        1273 :             ret |= dest_lat->set_contains_variable ();
    2219                 :        1273 :             continue;
    2220                 :             :           }
    2221                 :             : 
    2222                 :       17686 :         tree cstval = get_val_across_arith_op (opcode, opnd1_type, opnd2,
    2223                 :             :                                                src_val, res_type);
    2224                 :       17686 :         if (cstval
    2225                 :       17686 :             && ipacp_value_safe_for_type (res_type, cstval))
    2226                 :       17499 :           ret |= dest_lat->add_value (cstval, cs, src_val, src_idx,
    2227                 :             :                                       src_offset);
    2228                 :             :         else
    2229                 :         187 :           ret |= dest_lat->set_contains_variable ();
    2230                 :             :       }
    2231                 :             : 
    2232                 :             :   return ret;
    2233                 :             : }
    2234                 :             : 
    2235                 :             : /* Propagate values through a pass-through jump function JFUNC associated with
    2236                 :             :    edge CS, taking values from SRC_LAT and putting them into DEST_LAT.  SRC_IDX
    2237                 :             :    is the index of the source parameter.  PARM_TYPE is the type of the
    2238                 :             :    parameter to which the result is passed.  */
    2239                 :             : 
    2240                 :             : static bool
    2241                 :       69740 : propagate_vals_across_pass_through (cgraph_edge *cs, ipa_jump_func *jfunc,
    2242                 :             :                                     ipcp_lattice<tree> *src_lat,
    2243                 :             :                                     ipcp_lattice<tree> *dest_lat, int src_idx,
    2244                 :             :                                     tree parm_type)
    2245                 :             : {
    2246                 :       69740 :   return propagate_vals_across_arith_jfunc (cs,
    2247                 :             :                                 ipa_get_jf_pass_through_operation (jfunc),
    2248                 :             :                                 NULL_TREE,
    2249                 :             :                                 ipa_get_jf_pass_through_operand (jfunc),
    2250                 :       69740 :                                 src_lat, dest_lat, -1, src_idx, parm_type);
    2251                 :             : }
    2252                 :             : 
    2253                 :             : /* Propagate values through an ancestor jump function JFUNC associated with
    2254                 :             :    edge CS, taking values from SRC_LAT and putting them into DEST_LAT.  SRC_IDX
    2255                 :             :    is the index of the source parameter.  */
    2256                 :             : 
    2257                 :             : static bool
    2258                 :        2153 : propagate_vals_across_ancestor (struct cgraph_edge *cs,
    2259                 :             :                                 struct ipa_jump_func *jfunc,
    2260                 :             :                                 ipcp_lattice<tree> *src_lat,
    2261                 :             :                                 ipcp_lattice<tree> *dest_lat, int src_idx,
    2262                 :             :                                 tree param_type)
    2263                 :             : {
    2264                 :        2153 :   ipcp_value<tree> *src_val;
    2265                 :        2153 :   bool ret = false;
    2266                 :             : 
    2267                 :        2153 :   if (ipa_edge_within_scc (cs))
    2268                 :           8 :     return dest_lat->set_contains_variable ();
    2269                 :             : 
    2270                 :        2465 :   for (src_val = src_lat->values; src_val; src_val = src_val->next)
    2271                 :             :     {
    2272                 :         320 :       tree t = ipa_get_jf_ancestor_result (jfunc, src_val->value);
    2273                 :             : 
    2274                 :         320 :       if (t && ipacp_value_safe_for_type (param_type, t))
    2275                 :         254 :         ret |= dest_lat->add_value (t, cs, src_val, src_idx);
    2276                 :             :       else
    2277                 :          66 :         ret |= dest_lat->set_contains_variable ();
    2278                 :             :     }
    2279                 :             : 
    2280                 :             :   return ret;
    2281                 :             : }
    2282                 :             : 
    2283                 :             : /* Propagate scalar values across jump function JFUNC that is associated with
    2284                 :             :    edge CS and put the values into DEST_LAT.  PARM_TYPE is the type of the
    2285                 :             :    parameter to which the result is passed.  */
    2286                 :             : 
    2287                 :             : static bool
    2288                 :     3492433 : propagate_scalar_across_jump_function (struct cgraph_edge *cs,
    2289                 :             :                                        struct ipa_jump_func *jfunc,
    2290                 :             :                                        ipcp_lattice<tree> *dest_lat,
    2291                 :             :                                        tree param_type)
    2292                 :             : {
    2293                 :     3492433 :   if (dest_lat->bottom)
    2294                 :             :     return false;
    2295                 :             : 
    2296                 :      744425 :   if (jfunc->type == IPA_JF_CONST)
    2297                 :             :     {
    2298                 :      356705 :       tree val = ipa_get_jf_constant (jfunc);
    2299                 :      356705 :       if (ipacp_value_safe_for_type (param_type, val))
    2300                 :      356688 :         return dest_lat->add_value (val, cs, NULL, 0);
    2301                 :             :       else
    2302                 :          17 :         return dest_lat->set_contains_variable ();
    2303                 :             :     }
    2304                 :      387720 :   else if (jfunc->type == IPA_JF_PASS_THROUGH
    2305                 :      224136 :            || jfunc->type == IPA_JF_ANCESTOR)
    2306                 :             :     {
    2307                 :      168097 :       ipa_node_params *caller_info = ipa_node_params_sum->get (cs->caller);
    2308                 :      168097 :       ipcp_lattice<tree> *src_lat;
    2309                 :      168097 :       int src_idx;
    2310                 :      168097 :       bool ret;
    2311                 :             : 
    2312                 :      168097 :       if (jfunc->type == IPA_JF_PASS_THROUGH)
    2313                 :      163584 :         src_idx = ipa_get_jf_pass_through_formal_id (jfunc);
    2314                 :             :       else
    2315                 :        4513 :         src_idx = ipa_get_jf_ancestor_formal_id (jfunc);
    2316                 :             : 
    2317                 :      168097 :       src_lat = ipa_get_scalar_lat (caller_info, src_idx);
    2318                 :      168097 :       if (src_lat->bottom)
    2319                 :       96030 :         return dest_lat->set_contains_variable ();
    2320                 :             : 
    2321                 :             :       /* If we would need to clone the caller and cannot, do not propagate.  */
    2322                 :       72067 :       if (!ipcp_versionable_function_p (cs->caller)
    2323                 :       72067 :           && (src_lat->contains_variable
    2324                 :         133 :               || (src_lat->values_count > 1)))
    2325                 :         174 :         return dest_lat->set_contains_variable ();
    2326                 :             : 
    2327                 :       71893 :       if (jfunc->type == IPA_JF_PASS_THROUGH)
    2328                 :       69740 :         ret = propagate_vals_across_pass_through (cs, jfunc, src_lat,
    2329                 :             :                                                   dest_lat, src_idx,
    2330                 :             :                                                   param_type);
    2331                 :             :       else
    2332                 :        2153 :         ret = propagate_vals_across_ancestor (cs, jfunc, src_lat, dest_lat,
    2333                 :             :                                               src_idx, param_type);
    2334                 :             : 
    2335                 :       71893 :       if (src_lat->contains_variable)
    2336                 :       62610 :         ret |= dest_lat->set_contains_variable ();
    2337                 :             : 
    2338                 :       71893 :       return ret;
    2339                 :             :     }
    2340                 :             : 
    2341                 :             :   /* TODO: We currently do not handle member method pointers in IPA-CP (we only
    2342                 :             :      use it for indirect inlining), we should propagate them too.  */
    2343                 :      219623 :   return dest_lat->set_contains_variable ();
    2344                 :             : }
    2345                 :             : 
    2346                 :             : /* Propagate scalar values across jump function JFUNC that is associated with
    2347                 :             :    edge CS and describes argument IDX and put the values into DEST_LAT.  */
    2348                 :             : 
    2349                 :             : static bool
    2350                 :     3492433 : propagate_context_across_jump_function (cgraph_edge *cs,
    2351                 :             :                           ipa_jump_func *jfunc, int idx,
    2352                 :             :                           ipcp_lattice<ipa_polymorphic_call_context> *dest_lat)
    2353                 :             : {
    2354                 :     3492433 :   if (dest_lat->bottom)
    2355                 :             :     return false;
    2356                 :      838865 :   ipa_edge_args *args = ipa_edge_args_sum->get (cs);
    2357                 :      838865 :   bool ret = false;
    2358                 :      838865 :   bool added_sth = false;
    2359                 :      838865 :   bool type_preserved = true;
    2360                 :             : 
    2361                 :      838865 :   ipa_polymorphic_call_context edge_ctx, *edge_ctx_ptr
    2362                 :      850522 :     = ipa_get_ith_polymorhic_call_context (args, idx);
    2363                 :             : 
    2364                 :       11657 :   if (edge_ctx_ptr)
    2365                 :       11657 :     edge_ctx = *edge_ctx_ptr;
    2366                 :             : 
    2367                 :      838865 :   if (jfunc->type == IPA_JF_PASS_THROUGH
    2368                 :      675060 :       || jfunc->type == IPA_JF_ANCESTOR)
    2369                 :             :     {
    2370                 :      168410 :       ipa_node_params *caller_info = ipa_node_params_sum->get (cs->caller);
    2371                 :      168410 :       int src_idx;
    2372                 :      168410 :       ipcp_lattice<ipa_polymorphic_call_context> *src_lat;
    2373                 :             : 
    2374                 :             :       /* TODO: Once we figure out how to propagate speculations, it will
    2375                 :             :          probably be a good idea to switch to speculation if type_preserved is
    2376                 :             :          not set instead of punting.  */
    2377                 :      168410 :       if (jfunc->type == IPA_JF_PASS_THROUGH)
    2378                 :             :         {
    2379                 :      163805 :           if (ipa_get_jf_pass_through_operation (jfunc) != NOP_EXPR)
    2380                 :        7293 :             goto prop_fail;
    2381                 :      156512 :           type_preserved = ipa_get_jf_pass_through_type_preserved (jfunc);
    2382                 :      156512 :           src_idx = ipa_get_jf_pass_through_formal_id (jfunc);
    2383                 :             :         }
    2384                 :             :       else
    2385                 :             :         {
    2386                 :        4605 :           type_preserved = ipa_get_jf_ancestor_type_preserved (jfunc);
    2387                 :        4605 :           src_idx = ipa_get_jf_ancestor_formal_id (jfunc);
    2388                 :             :         }
    2389                 :             : 
    2390                 :      161117 :       src_lat = ipa_get_poly_ctx_lat (caller_info, src_idx);
    2391                 :             :       /* If we would need to clone the caller and cannot, do not propagate.  */
    2392                 :      161117 :       if (!ipcp_versionable_function_p (cs->caller)
    2393                 :      161117 :           && (src_lat->contains_variable
    2394                 :       13503 :               || (src_lat->values_count > 1)))
    2395                 :        2500 :         goto prop_fail;
    2396                 :             : 
    2397                 :      158617 :       ipcp_value<ipa_polymorphic_call_context> *src_val;
    2398                 :      159815 :       for (src_val = src_lat->values; src_val; src_val = src_val->next)
    2399                 :             :         {
    2400                 :        1198 :           ipa_polymorphic_call_context cur = src_val->value;
    2401                 :             : 
    2402                 :        1198 :           if (!type_preserved)
    2403                 :         871 :             cur.possible_dynamic_type_change (cs->in_polymorphic_cdtor);
    2404                 :        1198 :           if (jfunc->type == IPA_JF_ANCESTOR)
    2405                 :         332 :             cur.offset_by (ipa_get_jf_ancestor_offset (jfunc));
    2406                 :             :           /* TODO: In cases we know how the context is going to be used,
    2407                 :             :              we can improve the result by passing proper OTR_TYPE.  */
    2408                 :        1198 :           cur.combine_with (edge_ctx);
    2409                 :        2396 :           if (!cur.useless_p ())
    2410                 :             :             {
    2411                 :        1039 :               if (src_lat->contains_variable
    2412                 :        1039 :                   && !edge_ctx.equal_to (cur))
    2413                 :         271 :                 ret |= dest_lat->set_contains_variable ();
    2414                 :        1039 :               ret |= dest_lat->add_value (cur, cs, src_val, src_idx);
    2415                 :        1039 :               added_sth = true;
    2416                 :             :             }
    2417                 :             :         }
    2418                 :             :     }
    2419                 :             : 
    2420                 :      670455 :  prop_fail:
    2421                 :      168410 :   if (!added_sth)
    2422                 :             :     {
    2423                 :      837879 :       if (!edge_ctx.useless_p ())
    2424                 :        7378 :         ret |= dest_lat->add_value (edge_ctx, cs);
    2425                 :             :       else
    2426                 :      830501 :         ret |= dest_lat->set_contains_variable ();
    2427                 :             :     }
    2428                 :             : 
    2429                 :             :   return ret;
    2430                 :             : }
    2431                 :             : 
    2432                 :             : /* Propagate bits across jfunc that is associated with
    2433                 :             :    edge cs and update dest_lattice accordingly.  */
    2434                 :             : 
    2435                 :             : bool
    2436                 :     3492433 : propagate_bits_across_jump_function (cgraph_edge *cs, int idx,
    2437                 :             :                                      ipa_jump_func *jfunc,
    2438                 :             :                                      ipcp_bits_lattice *dest_lattice)
    2439                 :             : {
    2440                 :     3492433 :   if (dest_lattice->bottom_p ())
    2441                 :             :     return false;
    2442                 :             : 
    2443                 :      463295 :   enum availability availability;
    2444                 :      463295 :   cgraph_node *callee = cs->callee->function_symbol (&availability);
    2445                 :      463295 :   ipa_node_params *callee_info = ipa_node_params_sum->get (callee);
    2446                 :      463295 :   tree parm_type = ipa_get_type (callee_info, idx);
    2447                 :             : 
    2448                 :             :   /* For K&R C programs, ipa_get_type() could return NULL_TREE.  Avoid the
    2449                 :             :      transform for these cases.  Similarly, we can have bad type mismatches
    2450                 :             :      with LTO, avoid doing anything with those too.  */
    2451                 :      463295 :   if (!parm_type
    2452                 :      463295 :       || (!INTEGRAL_TYPE_P (parm_type) && !POINTER_TYPE_P (parm_type)))
    2453                 :             :     {
    2454                 :       22944 :       if (dump_file && (dump_flags & TDF_DETAILS))
    2455                 :           7 :         fprintf (dump_file, "Setting dest_lattice to bottom, because type of "
    2456                 :             :                  "param %i of %s is NULL or unsuitable for bits propagation\n",
    2457                 :           7 :                  idx, cs->callee->dump_name ());
    2458                 :             : 
    2459                 :       22944 :       return dest_lattice->set_to_bottom ();
    2460                 :             :     }
    2461                 :             : 
    2462                 :      440351 :   unsigned precision = TYPE_PRECISION (parm_type);
    2463                 :      440351 :   signop sgn = TYPE_SIGN (parm_type);
    2464                 :             : 
    2465                 :      440351 :   if (jfunc->type == IPA_JF_PASS_THROUGH
    2466                 :      359080 :       || jfunc->type == IPA_JF_ANCESTOR)
    2467                 :             :     {
    2468                 :       83475 :       ipa_node_params *caller_info = ipa_node_params_sum->get (cs->caller);
    2469                 :       83475 :       tree operand = NULL_TREE;
    2470                 :       83475 :       enum tree_code code;
    2471                 :       83475 :       unsigned src_idx;
    2472                 :       83475 :       bool keep_null = false;
    2473                 :             : 
    2474                 :       83475 :       if (jfunc->type == IPA_JF_PASS_THROUGH)
    2475                 :             :         {
    2476                 :       81271 :           code = ipa_get_jf_pass_through_operation (jfunc);
    2477                 :       81271 :           src_idx = ipa_get_jf_pass_through_formal_id (jfunc);
    2478                 :       81271 :           if (code != NOP_EXPR)
    2479                 :        2018 :             operand = ipa_get_jf_pass_through_operand (jfunc);
    2480                 :             :         }
    2481                 :             :       else
    2482                 :             :         {
    2483                 :        2204 :           code = POINTER_PLUS_EXPR;
    2484                 :        2204 :           src_idx = ipa_get_jf_ancestor_formal_id (jfunc);
    2485                 :        2204 :           unsigned HOST_WIDE_INT offset
    2486                 :        2204 :             = ipa_get_jf_ancestor_offset (jfunc) / BITS_PER_UNIT;
    2487                 :        2204 :           keep_null = (ipa_get_jf_ancestor_keep_null (jfunc) || !offset);
    2488                 :        2204 :           operand = build_int_cstu (size_type_node, offset);
    2489                 :             :         }
    2490                 :             : 
    2491                 :       83475 :       class ipcp_param_lattices *src_lats
    2492                 :       83475 :         = ipa_get_parm_lattices (caller_info, src_idx);
    2493                 :             : 
    2494                 :             :       /* Try to propagate bits if src_lattice is bottom, but jfunc is known.
    2495                 :             :          for eg consider:
    2496                 :             :          int f(int x)
    2497                 :             :          {
    2498                 :             :            g (x & 0xff);
    2499                 :             :          }
    2500                 :             :          Assume lattice for x is bottom, however we can still propagate
    2501                 :             :          result of x & 0xff == 0xff, which gets computed during ccp1 pass
    2502                 :             :          and we store it in jump function during analysis stage.  */
    2503                 :             : 
    2504                 :       83475 :       if (!src_lats->bits_lattice.bottom_p ())
    2505                 :             :         {
    2506                 :       22551 :           bool drop_all_ones
    2507                 :       22551 :             = keep_null && !src_lats->bits_lattice.known_nonzero_p ();
    2508                 :             : 
    2509                 :       22551 :           return dest_lattice->meet_with (src_lats->bits_lattice, precision,
    2510                 :       22551 :                                           sgn, code, operand, drop_all_ones);
    2511                 :             :         }
    2512                 :             :     }
    2513                 :             : 
    2514                 :      417800 :   value_range vr (parm_type);
    2515                 :      417800 :   if (jfunc->m_vr)
    2516                 :             :     {
    2517                 :      366474 :       jfunc->m_vr->get_vrange (vr);
    2518                 :      366474 :       if (!vr.undefined_p () && !vr.varying_p ())
    2519                 :             :         {
    2520                 :      366474 :           irange_bitmask bm = vr.get_bitmask ();
    2521                 :      366474 :           widest_int mask
    2522                 :      366474 :             = widest_int::from (bm.mask (), TYPE_SIGN (parm_type));
    2523                 :      366474 :           widest_int value
    2524                 :      366474 :             = widest_int::from (bm.value (), TYPE_SIGN (parm_type));
    2525                 :      366474 :           return dest_lattice->meet_with (value, mask, precision);
    2526                 :      366474 :         }
    2527                 :             :     }
    2528                 :       51326 :   return dest_lattice->set_to_bottom ();
    2529                 :      417800 : }
    2530                 :             : 
    2531                 :             : /* Propagate value range across jump function JFUNC that is associated with
    2532                 :             :    edge CS with param of callee of PARAM_TYPE and update DEST_PLATS
    2533                 :             :    accordingly.  */
    2534                 :             : 
    2535                 :             : static bool
    2536                 :     3491608 : propagate_vr_across_jump_function (cgraph_edge *cs, ipa_jump_func *jfunc,
    2537                 :             :                                    class ipcp_param_lattices *dest_plats,
    2538                 :             :                                    tree param_type)
    2539                 :             : {
    2540                 :     3491608 :   ipcp_vr_lattice *dest_lat = &dest_plats->m_value_range;
    2541                 :             : 
    2542                 :     3491608 :   if (dest_lat->bottom_p ())
    2543                 :             :     return false;
    2544                 :             : 
    2545                 :      554432 :   if (!param_type
    2546                 :      554432 :       || !ipa_vr_supported_type_p (param_type))
    2547                 :       22934 :     return dest_lat->set_to_bottom ();
    2548                 :             : 
    2549                 :      531498 :   value_range vr (param_type);
    2550                 :      531498 :   vr.set_varying (param_type);
    2551                 :      531498 :   if (jfunc->m_vr)
    2552                 :      467988 :     ipa_vr_operation_and_type_effects (vr, *jfunc->m_vr, NOP_EXPR,
    2553                 :             :                                        param_type,
    2554                 :      467988 :                                        jfunc->m_vr->type ());
    2555                 :             : 
    2556                 :      531498 :   if (jfunc->type == IPA_JF_PASS_THROUGH)
    2557                 :             :     {
    2558                 :       74973 :       ipa_node_params *caller_info = ipa_node_params_sum->get (cs->caller);
    2559                 :       74973 :       int src_idx = ipa_get_jf_pass_through_formal_id (jfunc);
    2560                 :       74973 :       class ipcp_param_lattices *src_lats
    2561                 :       74973 :         = ipa_get_parm_lattices (caller_info, src_idx);
    2562                 :       74973 :       tree operand_type = ipa_get_type (caller_info, src_idx);
    2563                 :             : 
    2564                 :       74973 :       if (src_lats->m_value_range.bottom_p ())
    2565                 :       58620 :         return dest_lat->set_to_bottom ();
    2566                 :             : 
    2567                 :       16353 :       if (ipa_get_jf_pass_through_operation (jfunc) == NOP_EXPR
    2568                 :       16353 :           || !ipa_edge_within_scc (cs))
    2569                 :       15847 :         ipa_vr_intersect_with_arith_jfunc (vr, jfunc, cs->caller,
    2570                 :       15847 :                                            src_lats->m_value_range.m_vr,
    2571                 :             :                                            operand_type, param_type);
    2572                 :             :     }
    2573                 :             : 
    2574                 :      472878 :   if (!vr.undefined_p () && !vr.varying_p ())
    2575                 :      453065 :     return dest_lat->meet_with (vr);
    2576                 :             :   else
    2577                 :       19813 :     return dest_lat->set_to_bottom ();
    2578                 :      531498 : }
    2579                 :             : 
    2580                 :             : /* If DEST_PLATS already has aggregate items, check that aggs_by_ref matches
    2581                 :             :    NEW_AGGS_BY_REF and if not, mark all aggs as bottoms and return true (in all
    2582                 :             :    other cases, return false).  If there are no aggregate items, set
    2583                 :             :    aggs_by_ref to NEW_AGGS_BY_REF.  */
    2584                 :             : 
    2585                 :             : static bool
    2586                 :       34312 : set_check_aggs_by_ref (class ipcp_param_lattices *dest_plats,
    2587                 :             :                        bool new_aggs_by_ref)
    2588                 :             : {
    2589                 :           0 :   if (dest_plats->aggs)
    2590                 :             :     {
    2591                 :       19179 :       if (dest_plats->aggs_by_ref != new_aggs_by_ref)
    2592                 :             :         {
    2593                 :           0 :           set_agg_lats_to_bottom (dest_plats);
    2594                 :           0 :           return true;
    2595                 :             :         }
    2596                 :             :     }
    2597                 :             :   else
    2598                 :       15133 :     dest_plats->aggs_by_ref = new_aggs_by_ref;
    2599                 :             :   return false;
    2600                 :             : }
    2601                 :             : 
    2602                 :             : /* Walk aggregate lattices in DEST_PLATS from ***AGLAT on, until ***aglat is an
    2603                 :             :    already existing lattice for the given OFFSET and SIZE, marking all skipped
    2604                 :             :    lattices as containing variable and checking for overlaps.  If there is no
    2605                 :             :    already existing lattice for the OFFSET and VAL_SIZE, create one, initialize
    2606                 :             :    it with offset, size and contains_variable to PRE_EXISTING, and return true,
    2607                 :             :    unless there are too many already.  If there are two many, return false.  If
    2608                 :             :    there are overlaps turn whole DEST_PLATS to bottom and return false.  If any
    2609                 :             :    skipped lattices were newly marked as containing variable, set *CHANGE to
    2610                 :             :    true.  MAX_AGG_ITEMS is the maximum number of lattices.  */
    2611                 :             : 
    2612                 :             : static bool
    2613                 :       92549 : merge_agg_lats_step (class ipcp_param_lattices *dest_plats,
    2614                 :             :                      HOST_WIDE_INT offset, HOST_WIDE_INT val_size,
    2615                 :             :                      struct ipcp_agg_lattice ***aglat,
    2616                 :             :                      bool pre_existing, bool *change, int max_agg_items)
    2617                 :             : {
    2618                 :       92549 :   gcc_checking_assert (offset >= 0);
    2619                 :             : 
    2620                 :       95966 :   while (**aglat && (**aglat)->offset < offset)
    2621                 :             :     {
    2622                 :        3417 :       if ((**aglat)->offset + (**aglat)->size > offset)
    2623                 :             :         {
    2624                 :           0 :           set_agg_lats_to_bottom (dest_plats);
    2625                 :           0 :           return false;
    2626                 :             :         }
    2627                 :        3417 :       *change |= (**aglat)->set_contains_variable ();
    2628                 :        3417 :       *aglat = &(**aglat)->next;
    2629                 :             :     }
    2630                 :             : 
    2631                 :       92549 :   if (**aglat && (**aglat)->offset == offset)
    2632                 :             :     {
    2633                 :       47753 :       if ((**aglat)->size != val_size)
    2634                 :             :         {
    2635                 :          11 :           set_agg_lats_to_bottom (dest_plats);
    2636                 :          11 :           return false;
    2637                 :             :         }
    2638                 :       47742 :       gcc_assert (!(**aglat)->next
    2639                 :             :                   || (**aglat)->next->offset >= offset + val_size);
    2640                 :             :       return true;
    2641                 :             :     }
    2642                 :             :   else
    2643                 :             :     {
    2644                 :       44796 :       struct ipcp_agg_lattice *new_al;
    2645                 :             : 
    2646                 :       44796 :       if (**aglat && (**aglat)->offset < offset + val_size)
    2647                 :             :         {
    2648                 :           3 :           set_agg_lats_to_bottom (dest_plats);
    2649                 :           3 :           return false;
    2650                 :             :         }
    2651                 :       44793 :       if (dest_plats->aggs_count == max_agg_items)
    2652                 :             :         return false;
    2653                 :       44754 :       dest_plats->aggs_count++;
    2654                 :       44754 :       new_al = ipcp_agg_lattice_pool.allocate ();
    2655                 :             : 
    2656                 :       44754 :       new_al->offset = offset;
    2657                 :       44754 :       new_al->size = val_size;
    2658                 :       44754 :       new_al->contains_variable = pre_existing;
    2659                 :             : 
    2660                 :       44754 :       new_al->next = **aglat;
    2661                 :       44754 :       **aglat = new_al;
    2662                 :       44754 :       return true;
    2663                 :             :     }
    2664                 :             : }
    2665                 :             : 
    2666                 :             : /* Set all AGLAT and all other aggregate lattices reachable by next pointers as
    2667                 :             :    containing an unknown value.  */
    2668                 :             : 
    2669                 :             : static bool
    2670                 :       34296 : set_chain_of_aglats_contains_variable (struct ipcp_agg_lattice *aglat)
    2671                 :             : {
    2672                 :       34296 :   bool ret = false;
    2673                 :       36423 :   while (aglat)
    2674                 :             :     {
    2675                 :        2127 :       ret |= aglat->set_contains_variable ();
    2676                 :        2127 :       aglat = aglat->next;
    2677                 :             :     }
    2678                 :       34296 :   return ret;
    2679                 :             : }
    2680                 :             : 
    2681                 :             : /* Merge existing aggregate lattices in SRC_PLATS to DEST_PLATS, subtracting
    2682                 :             :    DELTA_OFFSET.  CS is the call graph edge and SRC_IDX the index of the source
    2683                 :             :    parameter used for lattice value sources.  Return true if DEST_PLATS changed
    2684                 :             :    in any way.  */
    2685                 :             : 
    2686                 :             : static bool
    2687                 :        2387 : merge_aggregate_lattices (struct cgraph_edge *cs,
    2688                 :             :                           class ipcp_param_lattices *dest_plats,
    2689                 :             :                           class ipcp_param_lattices *src_plats,
    2690                 :             :                           int src_idx, HOST_WIDE_INT offset_delta)
    2691                 :             : {
    2692                 :        2387 :   bool pre_existing = dest_plats->aggs != NULL;
    2693                 :        2387 :   struct ipcp_agg_lattice **dst_aglat;
    2694                 :        2387 :   bool ret = false;
    2695                 :             : 
    2696                 :        2387 :   if (set_check_aggs_by_ref (dest_plats, src_plats->aggs_by_ref))
    2697                 :           0 :     return true;
    2698                 :        2387 :   if (src_plats->aggs_bottom)
    2699                 :           2 :     return set_agg_lats_contain_variable (dest_plats);
    2700                 :        2385 :   if (src_plats->aggs_contain_variable)
    2701                 :        1248 :     ret |= set_agg_lats_contain_variable (dest_plats);
    2702                 :        2385 :   dst_aglat = &dest_plats->aggs;
    2703                 :             : 
    2704                 :        2385 :   int max_agg_items = opt_for_fn (cs->callee->function_symbol ()->decl,
    2705                 :             :                                   param_ipa_max_agg_items);
    2706                 :        2385 :   for (struct ipcp_agg_lattice *src_aglat = src_plats->aggs;
    2707                 :        8107 :        src_aglat;
    2708                 :        5722 :        src_aglat = src_aglat->next)
    2709                 :             :     {
    2710                 :        5722 :       HOST_WIDE_INT new_offset = src_aglat->offset - offset_delta;
    2711                 :             : 
    2712                 :        5722 :       if (new_offset < 0)
    2713                 :          10 :         continue;
    2714                 :        5712 :       if (merge_agg_lats_step (dest_plats, new_offset, src_aglat->size,
    2715                 :             :                                &dst_aglat, pre_existing, &ret, max_agg_items))
    2716                 :             :         {
    2717                 :        5708 :           struct ipcp_agg_lattice *new_al = *dst_aglat;
    2718                 :             : 
    2719                 :        5708 :           dst_aglat = &(*dst_aglat)->next;
    2720                 :        5708 :           if (src_aglat->bottom)
    2721                 :             :             {
    2722                 :           0 :               ret |= new_al->set_contains_variable ();
    2723                 :           0 :               continue;
    2724                 :             :             }
    2725                 :        5708 :           if (src_aglat->contains_variable)
    2726                 :        2783 :             ret |= new_al->set_contains_variable ();
    2727                 :        5708 :           for (ipcp_value<tree> *val = src_aglat->values;
    2728                 :        9500 :                val;
    2729                 :        3792 :                val = val->next)
    2730                 :        3792 :             ret |= new_al->add_value (val->value, cs, val, src_idx,
    2731                 :             :                                       src_aglat->offset);
    2732                 :             :         }
    2733                 :           4 :       else if (dest_plats->aggs_bottom)
    2734                 :             :         return true;
    2735                 :             :     }
    2736                 :        2385 :   ret |= set_chain_of_aglats_contains_variable (*dst_aglat);
    2737                 :        2385 :   return ret;
    2738                 :             : }
    2739                 :             : 
    2740                 :             : /* Determine whether there is anything to propagate FROM SRC_PLATS through a
    2741                 :             :    pass-through JFUNC and if so, whether it has conform and conforms to the
    2742                 :             :    rules about propagating values passed by reference.  */
    2743                 :             : 
    2744                 :             : static bool
    2745                 :      156348 : agg_pass_through_permissible_p (class ipcp_param_lattices *src_plats,
    2746                 :             :                                 struct ipa_jump_func *jfunc)
    2747                 :             : {
    2748                 :      156348 :   return src_plats->aggs
    2749                 :      156348 :     && (!src_plats->aggs_by_ref
    2750                 :        5176 :         || ipa_get_jf_pass_through_agg_preserved (jfunc));
    2751                 :             : }
    2752                 :             : 
    2753                 :             : /* Propagate values through ITEM, jump function for a part of an aggregate,
    2754                 :             :    into corresponding aggregate lattice AGLAT.  CS is the call graph edge
    2755                 :             :    associated with the jump function.  Return true if AGLAT changed in any
    2756                 :             :    way.  */
    2757                 :             : 
    2758                 :             : static bool
    2759                 :       86788 : propagate_aggregate_lattice (struct cgraph_edge *cs,
    2760                 :             :                              struct ipa_agg_jf_item *item,
    2761                 :             :                              struct ipcp_agg_lattice *aglat)
    2762                 :             : {
    2763                 :       86788 :   class ipa_node_params *caller_info;
    2764                 :       86788 :   class ipcp_param_lattices *src_plats;
    2765                 :       86788 :   struct ipcp_lattice<tree> *src_lat;
    2766                 :       86788 :   HOST_WIDE_INT src_offset;
    2767                 :       86788 :   int src_idx;
    2768                 :       86788 :   tree load_type;
    2769                 :       86788 :   bool ret;
    2770                 :             : 
    2771                 :       86788 :   if (item->jftype == IPA_JF_CONST)
    2772                 :             :     {
    2773                 :       77520 :       tree value = item->value.constant;
    2774                 :             : 
    2775                 :       77520 :       gcc_checking_assert (is_gimple_ip_invariant (value));
    2776                 :       77520 :       return aglat->add_value (value, cs, NULL, 0);
    2777                 :             :     }
    2778                 :             : 
    2779                 :        9268 :   gcc_checking_assert (item->jftype == IPA_JF_PASS_THROUGH
    2780                 :             :                        || item->jftype == IPA_JF_LOAD_AGG);
    2781                 :             : 
    2782                 :        9268 :   caller_info = ipa_node_params_sum->get (cs->caller);
    2783                 :        9268 :   src_idx = item->value.pass_through.formal_id;
    2784                 :        9268 :   src_plats = ipa_get_parm_lattices (caller_info, src_idx);
    2785                 :             : 
    2786                 :        9268 :   if (item->jftype == IPA_JF_PASS_THROUGH)
    2787                 :             :     {
    2788                 :        2673 :       load_type = NULL_TREE;
    2789                 :        2673 :       src_lat = &src_plats->itself;
    2790                 :        2673 :       src_offset = -1;
    2791                 :             :     }
    2792                 :             :   else
    2793                 :             :     {
    2794                 :        6595 :       HOST_WIDE_INT load_offset = item->value.load_agg.offset;
    2795                 :        6595 :       struct ipcp_agg_lattice *src_aglat;
    2796                 :             : 
    2797                 :        8718 :       for (src_aglat = src_plats->aggs; src_aglat; src_aglat = src_aglat->next)
    2798                 :        4991 :         if (src_aglat->offset >= load_offset)
    2799                 :             :           break;
    2800                 :             : 
    2801                 :        6595 :       load_type = item->value.load_agg.type;
    2802                 :        6595 :       if (!src_aglat
    2803                 :        2868 :           || src_aglat->offset > load_offset
    2804                 :        2696 :           || src_aglat->size != tree_to_shwi (TYPE_SIZE (load_type))
    2805                 :        9291 :           || src_plats->aggs_by_ref != item->value.load_agg.by_ref)
    2806                 :        3899 :         return aglat->set_contains_variable ();
    2807                 :             : 
    2808                 :             :       src_lat = src_aglat;
    2809                 :             :       src_offset = load_offset;
    2810                 :             :     }
    2811                 :             : 
    2812                 :        5369 :   if (src_lat->bottom
    2813                 :        5369 :       || (!ipcp_versionable_function_p (cs->caller)
    2814                 :        5369 :           && !src_lat->is_single_const ()))
    2815                 :        1803 :     return aglat->set_contains_variable ();
    2816                 :             : 
    2817                 :        3566 :   ret = propagate_vals_across_arith_jfunc (cs,
    2818                 :             :                                            item->value.pass_through.operation,
    2819                 :             :                                            load_type,
    2820                 :             :                                            item->value.pass_through.operand,
    2821                 :             :                                            src_lat, aglat,
    2822                 :             :                                            src_offset,
    2823                 :             :                                            src_idx,
    2824                 :             :                                            item->type);
    2825                 :             : 
    2826                 :        3566 :   if (src_lat->contains_variable)
    2827                 :        2020 :     ret |= aglat->set_contains_variable ();
    2828                 :             : 
    2829                 :             :   return ret;
    2830                 :             : }
    2831                 :             : 
    2832                 :             : /* Propagate scalar values across jump function JFUNC that is associated with
    2833                 :             :    edge CS and put the values into DEST_LAT.  */
    2834                 :             : 
    2835                 :             : static bool
    2836                 :     3492433 : propagate_aggs_across_jump_function (struct cgraph_edge *cs,
    2837                 :             :                                      struct ipa_jump_func *jfunc,
    2838                 :             :                                      class ipcp_param_lattices *dest_plats)
    2839                 :             : {
    2840                 :     3492433 :   bool ret = false;
    2841                 :             : 
    2842                 :     3492433 :   if (dest_plats->aggs_bottom)
    2843                 :             :     return false;
    2844                 :             : 
    2845                 :      837726 :   if (jfunc->type == IPA_JF_PASS_THROUGH
    2846                 :      837726 :       && ipa_get_jf_pass_through_operation (jfunc) == NOP_EXPR)
    2847                 :             :     {
    2848                 :      156348 :       ipa_node_params *caller_info = ipa_node_params_sum->get (cs->caller);
    2849                 :      156348 :       int src_idx = ipa_get_jf_pass_through_formal_id (jfunc);
    2850                 :      156348 :       class ipcp_param_lattices *src_plats;
    2851                 :             : 
    2852                 :      156348 :       src_plats = ipa_get_parm_lattices (caller_info, src_idx);
    2853                 :      156348 :       if (agg_pass_through_permissible_p (src_plats, jfunc))
    2854                 :             :         {
    2855                 :             :           /* Currently we do not produce clobber aggregate jump
    2856                 :             :              functions, replace with merging when we do.  */
    2857                 :        2316 :           gcc_assert (!jfunc->agg.items);
    2858                 :        2316 :           ret |= merge_aggregate_lattices (cs, dest_plats, src_plats,
    2859                 :             :                                            src_idx, 0);
    2860                 :        2316 :           return ret;
    2861                 :             :         }
    2862                 :             :     }
    2863                 :      681378 :   else if (jfunc->type == IPA_JF_ANCESTOR
    2864                 :      681378 :            && ipa_get_jf_ancestor_agg_preserved (jfunc))
    2865                 :             :     {
    2866                 :        1115 :       ipa_node_params *caller_info = ipa_node_params_sum->get (cs->caller);
    2867                 :        1115 :       int src_idx = ipa_get_jf_ancestor_formal_id (jfunc);
    2868                 :        1115 :       class ipcp_param_lattices *src_plats;
    2869                 :             : 
    2870                 :        1115 :       src_plats = ipa_get_parm_lattices (caller_info, src_idx);
    2871                 :        1115 :       if (src_plats->aggs && src_plats->aggs_by_ref)
    2872                 :             :         {
    2873                 :             :           /* Currently we do not produce clobber aggregate jump
    2874                 :             :              functions, replace with merging when we do.  */
    2875                 :          71 :           gcc_assert (!jfunc->agg.items);
    2876                 :          71 :           ret |= merge_aggregate_lattices (cs, dest_plats, src_plats, src_idx,
    2877                 :             :                                            ipa_get_jf_ancestor_offset (jfunc));
    2878                 :             :         }
    2879                 :        1044 :       else if (!src_plats->aggs_by_ref)
    2880                 :        1036 :         ret |= set_agg_lats_to_bottom (dest_plats);
    2881                 :             :       else
    2882                 :           8 :         ret |= set_agg_lats_contain_variable (dest_plats);
    2883                 :        1115 :       return ret;
    2884                 :             :     }
    2885                 :             : 
    2886                 :      834295 :   if (jfunc->agg.items)
    2887                 :             :     {
    2888                 :       31925 :       bool pre_existing = dest_plats->aggs != NULL;
    2889                 :       31925 :       struct ipcp_agg_lattice **aglat = &dest_plats->aggs;
    2890                 :       31925 :       struct ipa_agg_jf_item *item;
    2891                 :       31925 :       int i;
    2892                 :             : 
    2893                 :       31925 :       if (set_check_aggs_by_ref (dest_plats, jfunc->agg.by_ref))
    2894                 :          14 :         return true;
    2895                 :             : 
    2896                 :       31925 :       int max_agg_items = opt_for_fn (cs->callee->function_symbol ()->decl,
    2897                 :             :                                       param_ipa_max_agg_items);
    2898                 :      119050 :       FOR_EACH_VEC_ELT (*jfunc->agg.items, i, item)
    2899                 :             :         {
    2900                 :       87139 :           HOST_WIDE_INT val_size;
    2901                 :             : 
    2902                 :       87139 :           if (item->offset < 0 || item->jftype == IPA_JF_UNKNOWN)
    2903                 :         302 :             continue;
    2904                 :       86837 :           val_size = tree_to_shwi (TYPE_SIZE (item->type));
    2905                 :             : 
    2906                 :       86837 :           if (merge_agg_lats_step (dest_plats, item->offset, val_size,
    2907                 :             :                                    &aglat, pre_existing, &ret, max_agg_items))
    2908                 :             :             {
    2909                 :       86788 :               ret |= propagate_aggregate_lattice (cs, item, *aglat);
    2910                 :       86788 :               aglat = &(*aglat)->next;
    2911                 :             :             }
    2912                 :          49 :           else if (dest_plats->aggs_bottom)
    2913                 :             :             return true;
    2914                 :             :         }
    2915                 :             : 
    2916                 :       63822 :       ret |= set_chain_of_aglats_contains_variable (*aglat);
    2917                 :             :     }
    2918                 :             :   else
    2919                 :      802370 :     ret |= set_agg_lats_contain_variable (dest_plats);
    2920                 :             : 
    2921                 :      834281 :   return ret;
    2922                 :             : }
    2923                 :             : 
    2924                 :             : /* Return true if on the way cfrom CS->caller to the final (non-alias and
    2925                 :             :    non-thunk) destination, the call passes through a thunk.  */
    2926                 :             : 
    2927                 :             : static bool
    2928                 :     1571136 : call_passes_through_thunk (cgraph_edge *cs)
    2929                 :             : {
    2930                 :     1571136 :   cgraph_node *alias_or_thunk = cs->callee;
    2931                 :     1690845 :   while (alias_or_thunk->alias)
    2932                 :      119709 :     alias_or_thunk = alias_or_thunk->get_alias_target ();
    2933                 :     1571136 :   return alias_or_thunk->thunk;
    2934                 :             : }
    2935                 :             : 
    2936                 :             : /* Propagate constants from the caller to the callee of CS.  INFO describes the
    2937                 :             :    caller.  */
    2938                 :             : 
    2939                 :             : static bool
    2940                 :     4913778 : propagate_constants_across_call (struct cgraph_edge *cs)
    2941                 :             : {
    2942                 :     4913778 :   class ipa_node_params *callee_info;
    2943                 :     4913778 :   enum availability availability;
    2944                 :     4913778 :   cgraph_node *callee;
    2945                 :     4913778 :   class ipa_edge_args *args;
    2946                 :     4913778 :   bool ret = false;
    2947                 :     4913778 :   int i, args_count, parms_count;
    2948                 :             : 
    2949                 :     4913778 :   callee = cs->callee->function_symbol (&availability);
    2950                 :     4913778 :   if (!callee->definition)
    2951                 :             :     return false;
    2952                 :     1755875 :   gcc_checking_assert (callee->has_gimple_body_p ());
    2953                 :     1755875 :   callee_info = ipa_node_params_sum->get (callee);
    2954                 :     1755875 :   if (!callee_info)
    2955                 :             :     return false;
    2956                 :             : 
    2957                 :     1746591 :   args = ipa_edge_args_sum->get (cs);
    2958                 :     1746591 :   parms_count = ipa_get_param_count (callee_info);
    2959                 :     1560272 :   if (parms_count == 0)
    2960                 :             :     return false;
    2961                 :     1560272 :   if (!args
    2962                 :     1560028 :       || !opt_for_fn (cs->caller->decl, flag_ipa_cp)
    2963                 :     3120300 :       || !opt_for_fn (cs->caller->decl, optimize))
    2964                 :             :     {
    2965                 :         752 :       for (i = 0; i < parms_count; i++)
    2966                 :         508 :         ret |= set_all_contains_variable (ipa_get_parm_lattices (callee_info,
    2967                 :             :                                                                  i));
    2968                 :             :       return ret;
    2969                 :             :     }
    2970                 :     1560028 :   args_count = ipa_get_cs_argument_count (args);
    2971                 :             : 
    2972                 :             :   /* If this call goes through a thunk we must not propagate to the first (0th)
    2973                 :             :      parameter.  However, we might need to uncover a thunk from below a series
    2974                 :             :      of aliases first.  */
    2975                 :     1560028 :   if (call_passes_through_thunk (cs))
    2976                 :             :     {
    2977                 :         171 :       ret |= set_all_contains_variable (ipa_get_parm_lattices (callee_info,
    2978                 :             :                                                                0));
    2979                 :         171 :       i = 1;
    2980                 :             :     }
    2981                 :             :   else
    2982                 :             :     i = 0;
    2983                 :             : 
    2984                 :     5185047 :   for (; (i < args_count) && (i < parms_count); i++)
    2985                 :             :     {
    2986                 :     3625019 :       struct ipa_jump_func *jump_func = ipa_get_ith_jump_func (args, i);
    2987                 :     3625019 :       class ipcp_param_lattices *dest_plats;
    2988                 :     3625019 :       tree param_type = ipa_get_type (callee_info, i);
    2989                 :             : 
    2990                 :     3625019 :       dest_plats = ipa_get_parm_lattices (callee_info, i);
    2991                 :     3625019 :       if (availability == AVAIL_INTERPOSABLE)
    2992                 :      132586 :         ret |= set_all_contains_variable (dest_plats);
    2993                 :             :       else
    2994                 :             :         {
    2995                 :     3492433 :           ret |= propagate_scalar_across_jump_function (cs, jump_func,
    2996                 :             :                                                         &dest_plats->itself,
    2997                 :             :                                                         param_type);
    2998                 :     3492433 :           ret |= propagate_context_across_jump_function (cs, jump_func, i,
    2999                 :             :                                                          &dest_plats->ctxlat);
    3000                 :     3492433 :           ret
    3001                 :     3492433 :             |= propagate_bits_across_jump_function (cs, i, jump_func,
    3002                 :             :                                                     &dest_plats->bits_lattice);
    3003                 :     3492433 :           ret |= propagate_aggs_across_jump_function (cs, jump_func,
    3004                 :             :                                                       dest_plats);
    3005                 :     3492433 :           if (opt_for_fn (callee->decl, flag_ipa_vrp))
    3006                 :     3491608 :             ret |= propagate_vr_across_jump_function (cs, jump_func,
    3007                 :             :                                                       dest_plats, param_type);
    3008                 :             :           else
    3009                 :         825 :             ret |= dest_plats->m_value_range.set_to_bottom ();
    3010                 :             :         }
    3011                 :             :     }
    3012                 :     1560196 :   for (; i < parms_count; i++)
    3013                 :         168 :     ret |= set_all_contains_variable (ipa_get_parm_lattices (callee_info, i));
    3014                 :             : 
    3015                 :             :   return ret;
    3016                 :             : }
    3017                 :             : 
    3018                 :             : /* If an indirect edge IE can be turned into a direct one based on KNOWN_VALS
    3019                 :             :    KNOWN_CONTEXTS, and known aggregates either in AVS or KNOWN_AGGS return
    3020                 :             :    the destination.  The latter three can be NULL.  If AGG_REPS is not NULL,
    3021                 :             :    KNOWN_AGGS is ignored.  */
    3022                 :             : 
    3023                 :             : static tree
    3024                 :      615619 : ipa_get_indirect_edge_target_1 (struct cgraph_edge *ie,
    3025                 :             :                                 const vec<tree> &known_csts,
    3026                 :             :                                 const vec<ipa_polymorphic_call_context> &known_contexts,
    3027                 :             :                                 const ipa_argagg_value_list &avs,
    3028                 :             :                                 bool *speculative)
    3029                 :             : {
    3030                 :      615619 :   int param_index = ie->indirect_info->param_index;
    3031                 :      615619 :   HOST_WIDE_INT anc_offset;
    3032                 :      615619 :   tree t = NULL;
    3033                 :      615619 :   tree target = NULL;
    3034                 :             : 
    3035                 :      615619 :   *speculative = false;
    3036                 :             : 
    3037                 :      615619 :   if (param_index == -1)
    3038                 :             :     return NULL_TREE;
    3039                 :             : 
    3040                 :      357895 :   if (!ie->indirect_info->polymorphic)
    3041                 :             :     {
    3042                 :      238726 :       tree t = NULL;
    3043                 :             : 
    3044                 :      238726 :       if (ie->indirect_info->agg_contents)
    3045                 :             :         {
    3046                 :       50024 :           t = NULL;
    3047                 :       50024 :           if ((unsigned) param_index < known_csts.length ()
    3048                 :       50024 :               && known_csts[param_index])
    3049                 :       46415 :             t = ipa_find_agg_cst_from_init (known_csts[param_index],
    3050                 :             :                                             ie->indirect_info->offset,
    3051                 :             :                                             ie->indirect_info->by_ref);
    3052                 :             : 
    3053                 :       50024 :           if (!t && ie->indirect_info->guaranteed_unmodified)
    3054                 :       47669 :             t = avs.get_value (param_index,
    3055                 :       47669 :                                ie->indirect_info->offset / BITS_PER_UNIT,
    3056                 :             :                                ie->indirect_info->by_ref);
    3057                 :             :         }
    3058                 :      188702 :       else if ((unsigned) param_index < known_csts.length ())
    3059                 :      188702 :         t = known_csts[param_index];
    3060                 :             : 
    3061                 :      238667 :       if (t
    3062                 :      183325 :           && TREE_CODE (t) == ADDR_EXPR
    3063                 :      421935 :           && TREE_CODE (TREE_OPERAND (t, 0)) == FUNCTION_DECL)
    3064                 :      183268 :         return TREE_OPERAND (t, 0);
    3065                 :             :       else
    3066                 :       55458 :         return NULL_TREE;
    3067                 :             :     }
    3068                 :             : 
    3069                 :      119169 :   if (!opt_for_fn (ie->caller->decl, flag_devirtualize))
    3070                 :             :     return NULL_TREE;
    3071                 :             : 
    3072                 :      119169 :   gcc_assert (!ie->indirect_info->agg_contents);
    3073                 :      119169 :   gcc_assert (!ie->indirect_info->by_ref);
    3074                 :      119169 :   anc_offset = ie->indirect_info->offset;
    3075                 :             : 
    3076                 :      119169 :   t = NULL;
    3077                 :             : 
    3078                 :      119169 :   if ((unsigned) param_index < known_csts.length ()
    3079                 :      119169 :       && known_csts[param_index])
    3080                 :       20561 :     t = ipa_find_agg_cst_from_init (known_csts[param_index],
    3081                 :             :                                     ie->indirect_info->offset, true);
    3082                 :             : 
    3083                 :             :   /* Try to work out value of virtual table pointer value in replacements.  */
    3084                 :             :   /* or known aggregate values.  */
    3085                 :       20561 :   if (!t)
    3086                 :      119163 :     t = avs.get_value (param_index,
    3087                 :      119163 :                        ie->indirect_info->offset / BITS_PER_UNIT,
    3088                 :             :                        true);
    3089                 :             : 
    3090                 :             :   /* If we found the virtual table pointer, lookup the target.  */
    3091                 :      119163 :   if (t)
    3092                 :             :     {
    3093                 :       14197 :       tree vtable;
    3094                 :       14197 :       unsigned HOST_WIDE_INT offset;
    3095                 :       14197 :       if (vtable_pointer_value_to_vtable (t, &vtable, &offset))
    3096                 :             :         {
    3097                 :       14197 :           bool can_refer;
    3098                 :       14197 :           target = gimple_get_virt_method_for_vtable (ie->indirect_info->otr_token,
    3099                 :             :                                                       vtable, offset, &can_refer);
    3100                 :       14197 :           if (can_refer)
    3101                 :             :             {
    3102                 :       14159 :               if (!target
    3103                 :       14159 :                   || fndecl_built_in_p (target, BUILT_IN_UNREACHABLE)
    3104                 :       28198 :                   || !possible_polymorphic_call_target_p
    3105                 :       14039 :                        (ie, cgraph_node::get (target)))
    3106                 :             :                 {
    3107                 :             :                   /* Do not speculate builtin_unreachable, it is stupid!  */
    3108                 :         231 :                   if (ie->indirect_info->vptr_changed)
    3109                 :       10512 :                     return NULL;
    3110                 :         231 :                   target = ipa_impossible_devirt_target (ie, target);
    3111                 :             :                 }
    3112                 :       14159 :               *speculative = ie->indirect_info->vptr_changed;
    3113                 :       14159 :               if (!*speculative)
    3114                 :             :                 return target;
    3115                 :             :             }
    3116                 :             :         }
    3117                 :             :     }
    3118                 :             : 
    3119                 :             :   /* Do we know the constant value of pointer?  */
    3120                 :      108657 :   if (!t && (unsigned) param_index < known_csts.length ())
    3121                 :       40024 :     t = known_csts[param_index];
    3122                 :             : 
    3123                 :      108657 :   gcc_checking_assert (!t || TREE_CODE (t) != TREE_BINFO);
    3124                 :             : 
    3125                 :      108657 :   ipa_polymorphic_call_context context;
    3126                 :      108657 :   if (known_contexts.length () > (unsigned int) param_index)
    3127                 :             :     {
    3128                 :      108648 :       context = known_contexts[param_index];
    3129                 :      108648 :       context.offset_by (anc_offset);
    3130                 :      108648 :       if (ie->indirect_info->vptr_changed)
    3131                 :       46962 :         context.possible_dynamic_type_change (ie->in_polymorphic_cdtor,
    3132                 :             :                                               ie->indirect_info->otr_type);
    3133                 :      108648 :       if (t)
    3134                 :             :         {
    3135                 :       10332 :           ipa_polymorphic_call_context ctx2 = ipa_polymorphic_call_context
    3136                 :       10332 :             (t, ie->indirect_info->otr_type, anc_offset);
    3137                 :       20664 :           if (!ctx2.useless_p ())
    3138                 :        8849 :             context.combine_with (ctx2, ie->indirect_info->otr_type);
    3139                 :             :         }
    3140                 :             :     }
    3141                 :           9 :   else if (t)
    3142                 :             :     {
    3143                 :          12 :       context = ipa_polymorphic_call_context (t, ie->indirect_info->otr_type,
    3144                 :           6 :                                               anc_offset);
    3145                 :           6 :       if (ie->indirect_info->vptr_changed)
    3146                 :           0 :         context.possible_dynamic_type_change (ie->in_polymorphic_cdtor,
    3147                 :             :                                               ie->indirect_info->otr_type);
    3148                 :             :     }
    3149                 :             :   else
    3150                 :             :     return NULL_TREE;
    3151                 :             : 
    3152                 :      108654 :   vec <cgraph_node *>targets;
    3153                 :      108654 :   bool final;
    3154                 :             : 
    3155                 :      108654 :   targets = possible_polymorphic_call_targets
    3156                 :      217308 :     (ie->indirect_info->otr_type,
    3157                 :      108654 :      ie->indirect_info->otr_token,
    3158                 :             :      context, &final);
    3159                 :      118232 :   if (!final || targets.length () > 1)
    3160                 :             :     {
    3161                 :       99404 :       struct cgraph_node *node;
    3162                 :       99404 :       if (*speculative)
    3163                 :             :         return target;
    3164                 :       99382 :       if (!opt_for_fn (ie->caller->decl, flag_devirtualize_speculatively)
    3165                 :       99382 :           || ie->speculative || !ie->maybe_hot_p ())
    3166                 :       21351 :         return NULL;
    3167                 :      156062 :       node = try_speculative_devirtualization (ie->indirect_info->otr_type,
    3168                 :       78031 :                                                ie->indirect_info->otr_token,
    3169                 :             :                                                context);
    3170                 :       78031 :       if (node)
    3171                 :             :         {
    3172                 :         595 :           *speculative = true;
    3173                 :         595 :           target = node->decl;
    3174                 :             :         }
    3175                 :             :       else
    3176                 :             :         return NULL;
    3177                 :             :     }
    3178                 :             :   else
    3179                 :             :     {
    3180                 :        9250 :       *speculative = false;
    3181                 :        9250 :       if (targets.length () == 1)
    3182                 :        9235 :         target = targets[0]->decl;
    3183                 :             :       else
    3184                 :          15 :         target = ipa_impossible_devirt_target (ie, NULL_TREE);
    3185                 :             :     }
    3186                 :             : 
    3187                 :        9845 :   if (target && !possible_polymorphic_call_target_p (ie,
    3188                 :             :                                                      cgraph_node::get (target)))
    3189                 :             :     {
    3190                 :          53 :       if (*speculative)
    3191                 :             :         return NULL;
    3192                 :          35 :       target = ipa_impossible_devirt_target (ie, target);
    3193                 :             :     }
    3194                 :             : 
    3195                 :             :   return target;
    3196                 :             : }
    3197                 :             : 
    3198                 :             : /* If an indirect edge IE can be turned into a direct one based on data in
    3199                 :             :    AVALS, return the destination.  Store into *SPECULATIVE a boolean determinig
    3200                 :             :    whether the discovered target is only speculative guess.  */
    3201                 :             : 
    3202                 :             : tree
    3203                 :      505449 : ipa_get_indirect_edge_target (struct cgraph_edge *ie,
    3204                 :             :                               ipa_call_arg_values *avals,
    3205                 :             :                               bool *speculative)
    3206                 :             : {
    3207                 :      505449 :   ipa_argagg_value_list avl (avals);
    3208                 :      505449 :   return ipa_get_indirect_edge_target_1 (ie, avals->m_known_vals,
    3209                 :      505449 :                                          avals->m_known_contexts,
    3210                 :      505449 :                                          avl, speculative);
    3211                 :             : }
    3212                 :             : 
    3213                 :             : /* Calculate devirtualization time bonus for NODE, assuming we know information
    3214                 :             :    about arguments stored in AVALS.  */
    3215                 :             : 
    3216                 :             : static int
    3217                 :      871053 : devirtualization_time_bonus (struct cgraph_node *node,
    3218                 :             :                              ipa_auto_call_arg_values *avals)
    3219                 :             : {
    3220                 :      871053 :   struct cgraph_edge *ie;
    3221                 :      871053 :   int res = 0;
    3222                 :             : 
    3223                 :      979646 :   for (ie = node->indirect_calls; ie; ie = ie->next_callee)
    3224                 :             :     {
    3225                 :      108593 :       struct cgraph_node *callee;
    3226                 :      108593 :       class ipa_fn_summary *isummary;
    3227                 :      108593 :       enum availability avail;
    3228                 :      108593 :       tree target;
    3229                 :      108593 :       bool speculative;
    3230                 :             : 
    3231                 :      108593 :       ipa_argagg_value_list avl (avals);
    3232                 :      108593 :       target = ipa_get_indirect_edge_target_1 (ie, avals->m_known_vals,
    3233                 :             :                                                avals->m_known_contexts,
    3234                 :             :                                                avl, &speculative);
    3235                 :      108593 :       if (!target)
    3236                 :      107724 :         continue;
    3237                 :             : 
    3238                 :             :       /* Only bare minimum benefit for clearly un-inlineable targets.  */
    3239                 :        1020 :       res += 1;
    3240                 :        1020 :       callee = cgraph_node::get (target);
    3241                 :        1020 :       if (!callee || !callee->definition)
    3242                 :         101 :         continue;
    3243                 :         919 :       callee = callee->function_symbol (&avail);
    3244                 :         919 :       if (avail < AVAIL_AVAILABLE)
    3245                 :           0 :         continue;
    3246                 :         919 :       isummary = ipa_fn_summaries->get (callee);
    3247                 :         919 :       if (!isummary || !isummary->inlinable)
    3248                 :          50 :         continue;
    3249                 :             : 
    3250                 :         869 :       int size = ipa_size_summaries->get (callee)->size;
    3251                 :             :       /* FIXME: The values below need re-considering and perhaps also
    3252                 :             :          integrating into the cost metrics, at lest in some very basic way.  */
    3253                 :         869 :       int max_inline_insns_auto
    3254                 :         869 :         = opt_for_fn (callee->decl, param_max_inline_insns_auto);
    3255                 :         869 :       if (size <= max_inline_insns_auto / 4)
    3256                 :         183 :         res += 31 / ((int)speculative + 1);
    3257                 :         686 :       else if (size <= max_inline_insns_auto / 2)
    3258                 :         212 :         res += 15 / ((int)speculative + 1);
    3259                 :         474 :       else if (size <= max_inline_insns_auto
    3260                 :         474 :                || DECL_DECLARED_INLINE_P (callee->decl))
    3261                 :          54 :         res += 7 / ((int)speculative + 1);
    3262                 :             :     }
    3263                 :             : 
    3264                 :      871053 :   return res;
    3265                 :             : }
    3266                 :             : 
    3267                 :             : /* Return time bonus incurred because of hints stored in ESTIMATES.  */
    3268                 :             : 
    3269                 :             : static int
    3270                 :      157561 : hint_time_bonus (cgraph_node *node, const ipa_call_estimates &estimates)
    3271                 :             : {
    3272                 :      157561 :   int result = 0;
    3273                 :      157561 :   ipa_hints hints = estimates.hints;
    3274                 :      157561 :   if (hints & (INLINE_HINT_loop_iterations | INLINE_HINT_loop_stride))
    3275                 :       10530 :     result += opt_for_fn (node->decl, param_ipa_cp_loop_hint_bonus);
    3276                 :             : 
    3277                 :      157561 :   sreal bonus_for_one = opt_for_fn (node->decl, param_ipa_cp_loop_hint_bonus);
    3278                 :             : 
    3279                 :      157561 :   if (hints & INLINE_HINT_loop_iterations)
    3280                 :        6958 :     result += (estimates.loops_with_known_iterations * bonus_for_one).to_int ();
    3281                 :             : 
    3282                 :      157561 :   if (hints & INLINE_HINT_loop_stride)
    3283                 :        4701 :     result += (estimates.loops_with_known_strides * bonus_for_one).to_int ();
    3284                 :             : 
    3285                 :      157561 :   return result;
    3286                 :             : }
    3287                 :             : 
    3288                 :             : /* If there is a reason to penalize the function described by INFO in the
    3289                 :             :    cloning goodness evaluation, do so.  */
    3290                 :             : 
    3291                 :             : static inline sreal
    3292                 :       19681 : incorporate_penalties (cgraph_node *node, ipa_node_params *info,
    3293                 :             :                        sreal evaluation)
    3294                 :             : {
    3295                 :       19681 :   if (info->node_within_scc && !info->node_is_self_scc)
    3296                 :         638 :     evaluation = (evaluation
    3297                 :        1914 :                   * (100 - opt_for_fn (node->decl,
    3298                 :         638 :                                        param_ipa_cp_recursion_penalty))) / 100;
    3299                 :             : 
    3300                 :       19681 :   if (info->node_calling_single_call)
    3301                 :         624 :     evaluation = (evaluation
    3302                 :        1872 :                   * (100 - opt_for_fn (node->decl,
    3303                 :         624 :                                        param_ipa_cp_single_call_penalty)))
    3304                 :        1248 :       / 100;
    3305                 :             : 
    3306                 :       19681 :   return evaluation;
    3307                 :             : }
    3308                 :             : 
    3309                 :             : /* Return true if cloning NODE is a good idea, given the estimated TIME_BENEFIT
    3310                 :             :    and SIZE_COST and with the sum of frequencies of incoming edges to the
    3311                 :             :    potential new clone in FREQUENCIES.  */
    3312                 :             : 
    3313                 :             : static bool
    3314                 :      135112 : good_cloning_opportunity_p (struct cgraph_node *node, sreal time_benefit,
    3315                 :             :                             sreal freq_sum, profile_count count_sum,
    3316                 :             :                             int size_cost)
    3317                 :             : {
    3318                 :      135112 :   if (time_benefit == 0
    3319                 :      123133 :       || !opt_for_fn (node->decl, flag_ipa_cp_clone)
    3320                 :       19816 :       || node->optimize_for_size_p ())
    3321                 :      115431 :     return false;
    3322                 :             : 
    3323                 :       19681 :   gcc_assert (size_cost > 0);
    3324                 :             : 
    3325                 :       19681 :   ipa_node_params *info = ipa_node_params_sum->get (node);
    3326                 :       19681 :   int eval_threshold = opt_for_fn (node->decl, param_ipa_cp_eval_threshold);
    3327                 :       19681 :   if (count_sum.nonzero_p ())
    3328                 :             :     {
    3329                 :          78 :       gcc_assert (base_count.nonzero_p ());
    3330                 :          78 :       sreal factor = count_sum.probability_in (base_count).to_sreal ();
    3331                 :          78 :       sreal evaluation = (time_benefit * factor) / size_cost;
    3332                 :          78 :       evaluation = incorporate_penalties (node, info, evaluation);
    3333                 :          78 :       evaluation *= 1000;
    3334                 :             : 
    3335                 :          78 :       if (dump_file && (dump_flags & TDF_DETAILS))
    3336                 :             :         {
    3337                 :           0 :           fprintf (dump_file, "     good_cloning_opportunity_p (time: %g, "
    3338                 :             :                    "size: %i, count_sum: ", time_benefit.to_double (),
    3339                 :             :                    size_cost);
    3340                 :           0 :           count_sum.dump (dump_file);
    3341                 :           0 :           fprintf (dump_file, "%s%s) -> evaluation: %.2f, threshold: %i\n",
    3342                 :           0 :                  info->node_within_scc
    3343                 :           0 :                    ? (info->node_is_self_scc ? ", self_scc" : ", scc") : "",
    3344                 :           0 :                  info->node_calling_single_call ? ", single_call" : "",
    3345                 :             :                    evaluation.to_double (), eval_threshold);
    3346                 :             :         }
    3347                 :             : 
    3348                 :          78 :       return evaluation.to_int () >= eval_threshold;
    3349                 :             :     }
    3350                 :             :   else
    3351                 :             :     {
    3352                 :       19603 :       sreal evaluation = (time_benefit * freq_sum) / size_cost;
    3353                 :       19603 :       evaluation = incorporate_penalties (node, info, evaluation);
    3354                 :       19603 :       evaluation *= 1000;
    3355                 :             : 
    3356                 :       19603 :       if (dump_file && (dump_flags & TDF_DETAILS))
    3357                 :         214 :         fprintf (dump_file, "     good_cloning_opportunity_p (time: %g, "
    3358                 :             :                  "size: %i, freq_sum: %g%s%s) -> evaluation: %.2f, "
    3359                 :             :                  "threshold: %i\n",
    3360                 :             :                  time_benefit.to_double (), size_cost, freq_sum.to_double (),
    3361                 :         107 :                  info->node_within_scc
    3362                 :          26 :                    ? (info->node_is_self_scc ? ", self_scc" : ", scc") : "",
    3363                 :         107 :                  info->node_calling_single_call ? ", single_call" : "",
    3364                 :             :                  evaluation.to_double (), eval_threshold);
    3365                 :             : 
    3366                 :       19603 :       return evaluation.to_int () >= eval_threshold;
    3367                 :             :     }
    3368                 :             : }
    3369                 :             : 
    3370                 :             : /* Grow vectors in AVALS and fill them with information about values of
    3371                 :             :    parameters that are known to be independent of the context.  Only calculate
    3372                 :             :    m_known_aggs if CALCULATE_AGGS is true.  INFO describes the function.  If
    3373                 :             :    REMOVABLE_PARAMS_COST is non-NULL, the movement cost of all removable
    3374                 :             :    parameters will be stored in it.
    3375                 :             : 
    3376                 :             :    TODO: Also grow context independent value range vectors.  */
    3377                 :             : 
    3378                 :             : static bool
    3379                 :     1642730 : gather_context_independent_values (class ipa_node_params *info,
    3380                 :             :                                    ipa_auto_call_arg_values *avals,
    3381                 :             :                                    bool calculate_aggs,
    3382                 :             :                                    int *removable_params_cost)
    3383                 :             : {
    3384                 :     1642730 :   int i, count = ipa_get_param_count (info);
    3385                 :     1642730 :   bool ret = false;
    3386                 :             : 
    3387                 :     1642730 :   avals->m_known_vals.safe_grow_cleared (count, true);
    3388                 :     1642730 :   avals->m_known_contexts.safe_grow_cleared (count, true);
    3389                 :             : 
    3390                 :     1642730 :   if (removable_params_cost)
    3391                 :      812792 :     *removable_params_cost = 0;
    3392                 :             : 
    3393                 :     5476535 :   for (i = 0; i < count; i++)
    3394                 :             :     {
    3395                 :     3833805 :       class ipcp_param_lattices *plats = ipa_get_parm_lattices (info, i);
    3396                 :     3833805 :       ipcp_lattice<tree> *lat = &plats->itself;
    3397                 :             : 
    3398                 :     3833805 :       if (lat->is_single_const ())
    3399                 :             :         {
    3400                 :       50743 :           ipcp_value<tree> *val = lat->values;
    3401                 :       50743 :           gcc_checking_assert (TREE_CODE (val->value) != TREE_BINFO);
    3402                 :       50743 :           avals->m_known_vals[i] = val->value;
    3403                 :       50743 :           if (removable_params_cost)
    3404                 :       33836 :             *removable_params_cost
    3405                 :       16918 :               += estimate_move_cost (TREE_TYPE (val->value), false);
    3406                 :             :           ret = true;
    3407                 :             :         }
    3408                 :     3783062 :       else if (removable_params_cost
    3409                 :     3783062 :                && !ipa_is_param_used (info, i))
    3410                 :      404362 :         *removable_params_cost
    3411                 :      202181 :           += ipa_get_param_move_cost (info, i);
    3412                 :             : 
    3413                 :     3833805 :       if (!ipa_is_param_used (info, i))
    3414                 :      418980 :         continue;
    3415                 :             : 
    3416                 :     3414825 :       ipcp_lattice<ipa_polymorphic_call_context> *ctxlat = &plats->ctxlat;
    3417                 :             :       /* Do not account known context as reason for cloning.  We can see
    3418                 :             :          if it permits devirtualization.  */
    3419                 :     3414825 :       if (ctxlat->is_single_const ())
    3420                 :       11180 :         avals->m_known_contexts[i] = ctxlat->values->value;
    3421                 :             : 
    3422                 :     3414825 :       if (calculate_aggs)
    3423                 :     1688686 :         ret |= push_agg_values_from_plats (plats, i, 0, &avals->m_known_aggs);
    3424                 :             :     }
    3425                 :             : 
    3426                 :     1642730 :   return ret;
    3427                 :             : }
    3428                 :             : 
    3429                 :             : /* Perform time and size measurement of NODE with the context given in AVALS,
    3430                 :             :    calculate the benefit compared to the node without specialization and store
    3431                 :             :    it into VAL.  Take into account REMOVABLE_PARAMS_COST of all
    3432                 :             :    context-independent or unused removable parameters and EST_MOVE_COST, the
    3433                 :             :    estimated movement of the considered parameter.  */
    3434                 :             : 
    3435                 :             : static void
    3436                 :       58297 : perform_estimation_of_a_value (cgraph_node *node,
    3437                 :             :                                ipa_auto_call_arg_values *avals,
    3438                 :             :                                int removable_params_cost, int est_move_cost,
    3439                 :             :                                ipcp_value_base *val)
    3440                 :             : {
    3441                 :       58297 :   sreal time_benefit;
    3442                 :       58297 :   ipa_call_estimates estimates;
    3443                 :             : 
    3444                 :       58297 :   estimate_ipcp_clone_size_and_time (node, avals, &estimates);
    3445                 :             : 
    3446                 :             :   /* Extern inline functions have no cloning local time benefits because they
    3447                 :             :      will be inlined anyway.  The only reason to clone them is if it enables
    3448                 :             :      optimization in any of the functions they call.  */
    3449                 :       58297 :   if (DECL_EXTERNAL (node->decl) && DECL_DECLARED_INLINE_P (node->decl))
    3450                 :          36 :     time_benefit = 0;
    3451                 :             :   else
    3452                 :      174783 :     time_benefit = (estimates.nonspecialized_time - estimates.time)
    3453                 :       58261 :       + (devirtualization_time_bonus (node, avals)
    3454                 :       58261 :          + hint_time_bonus (node, estimates)
    3455                 :       58261 :          + removable_params_cost + est_move_cost);
    3456                 :             : 
    3457                 :       58297 :   int size = estimates.size;
    3458                 :       58297 :   gcc_checking_assert (size >=0);
    3459                 :             :   /* The inliner-heuristics based estimates may think that in certain
    3460                 :             :      contexts some functions do not have any size at all but we want
    3461                 :             :      all specializations to have at least a tiny cost, not least not to
    3462                 :             :      divide by zero.  */
    3463                 :       58297 :   if (size == 0)
    3464                 :           0 :     size = 1;
    3465                 :             : 
    3466                 :       58297 :   val->local_time_benefit = time_benefit;
    3467                 :       58297 :   val->local_size_cost = size;
    3468                 :       58297 : }
    3469                 :             : 
    3470                 :             : /* Get the overall limit oof growth based on parameters extracted from growth.
    3471                 :             :    it does not really make sense to mix functions with different overall growth
    3472                 :             :    limits but it is possible and if it happens, we do not want to select one
    3473                 :             :    limit at random.  */
    3474                 :             : 
    3475                 :             : static long
    3476                 :       71717 : get_max_overall_size (cgraph_node *node)
    3477                 :             : {
    3478                 :       71717 :   long max_new_size = orig_overall_size;
    3479                 :       71717 :   long large_unit = opt_for_fn (node->decl, param_ipa_cp_large_unit_insns);
    3480                 :       71717 :   if (max_new_size < large_unit)
    3481                 :             :     max_new_size = large_unit;
    3482                 :       71717 :   int unit_growth = opt_for_fn (node->decl, param_ipa_cp_unit_growth);
    3483                 :       71717 :   max_new_size += max_new_size * unit_growth / 100 + 1;
    3484                 :       71717 :   return max_new_size;
    3485                 :             : }
    3486                 :             : 
    3487                 :             : /* Return true if NODE should be cloned just for a parameter removal, possibly
    3488                 :             :    dumping a reason if not.  */
    3489                 :             : 
    3490                 :             : static bool
    3491                 :      123215 : clone_for_param_removal_p (cgraph_node *node)
    3492                 :             : {
    3493                 :      123215 :   if (!node->can_change_signature)
    3494                 :             :     {
    3495                 :        2639 :       if (dump_file && (dump_flags & TDF_DETAILS))
    3496                 :           0 :         fprintf (dump_file, "  Not considering cloning to remove parameters, "
    3497                 :             :                  "function cannot change signature.\n");
    3498                 :        2639 :       return false;
    3499                 :             :     }
    3500                 :      120576 :   if (node->can_be_local_p ())
    3501                 :             :     {
    3502                 :       35403 :       if (dump_file && (dump_flags & TDF_DETAILS))
    3503                 :           1 :         fprintf (dump_file, "  Not considering cloning to remove parameters, "
    3504                 :             :                  "IPA-SRA can do it potentially better.\n");
    3505                 :       35403 :       return false;
    3506                 :             :     }
    3507                 :             :   return true;
    3508                 :             : }
    3509                 :             : 
    3510                 :             : /* Iterate over known values of parameters of NODE and estimate the local
    3511                 :             :    effects in terms of time and size they have.  */
    3512                 :             : 
    3513                 :             : static void
    3514                 :     1194647 : estimate_local_effects (struct cgraph_node *node)
    3515                 :             : {
    3516                 :     1194647 :   ipa_node_params *info = ipa_node_params_sum->get (node);
    3517                 :     1194647 :   int count = ipa_get_param_count (info);
    3518                 :      975939 :   bool always_const;
    3519                 :      975939 :   int removable_params_cost;
    3520                 :             : 
    3521                 :      975939 :   if (!count || !ipcp_versionable_function_p (node))
    3522                 :      381855 :     return;
    3523                 :             : 
    3524                 :      812792 :   if (dump_file && (dump_flags & TDF_DETAILS))
    3525                 :         106 :     fprintf (dump_file, "\nEstimating effects for %s.\n", node->dump_name ());
    3526                 :             : 
    3527                 :      812792 :   ipa_auto_call_arg_values avals;
    3528                 :      812792 :   always_const = gather_context_independent_values (info, &avals, true,
    3529                 :             :                                                     &removable_params_cost);
    3530                 :      812792 :   int devirt_bonus = devirtualization_time_bonus (node, &avals);
    3531                 :      812792 :   if (always_const || devirt_bonus
    3532                 :      812792 :       || (removable_params_cost && clone_for_param_removal_p (node)))
    3533                 :             :     {
    3534                 :       99300 :       struct caller_statistics stats;
    3535                 :       99300 :       ipa_call_estimates estimates;
    3536                 :             : 
    3537                 :       99300 :       init_caller_stats (&stats);
    3538                 :       99300 :       node->call_for_symbol_thunks_and_aliases (gather_caller_stats, &stats,
    3539                 :             :                                               false);
    3540                 :       99300 :       estimate_ipcp_clone_size_and_time (node, &avals, &estimates);
    3541                 :       99300 :       sreal time = estimates.nonspecialized_time - estimates.time;
    3542                 :       99300 :       time += devirt_bonus;
    3543                 :       99300 :       time += hint_time_bonus (node, estimates);
    3544                 :       99300 :       time += removable_params_cost;
    3545                 :       99300 :       int size = estimates.size - stats.n_calls * removable_params_cost;
    3546                 :             : 
    3547                 :       99300 :       if (dump_file)
    3548                 :         260 :         fprintf (dump_file, " - context independent values, size: %i, "
    3549                 :             :                  "time_benefit: %f\n", size, (time).to_double ());
    3550                 :             : 
    3551                 :       99300 :       if (size <= 0 || node->local)
    3552                 :             :         {
    3553                 :       16106 :           info->do_clone_for_all_contexts = true;
    3554                 :             : 
    3555                 :       16106 :           if (dump_file)
    3556                 :          95 :             fprintf (dump_file, "     Decided to specialize for all "
    3557                 :             :                      "known contexts, code not going to grow.\n");
    3558                 :             :         }
    3559                 :       83194 :       else if (good_cloning_opportunity_p (node, time, stats.freq_sum,
    3560                 :             :                                            stats.count_sum, size))
    3561                 :             :         {
    3562                 :         232 :           if (size + overall_size <= get_max_overall_size (node))
    3563                 :             :             {
    3564                 :         232 :               info->do_clone_for_all_contexts = true;
    3565                 :         232 :               overall_size += size;
    3566                 :             : 
    3567                 :         232 :               if (dump_file)
    3568                 :           9 :                 fprintf (dump_file, "     Decided to specialize for all "
    3569                 :             :                          "known contexts, growth (to %li) deemed "
    3570                 :             :                          "beneficial.\n", overall_size);
    3571                 :             :             }
    3572                 :           0 :           else if (dump_file && (dump_flags & TDF_DETAILS))
    3573                 :           0 :             fprintf (dump_file, "  Not cloning for all contexts because "
    3574                 :             :                      "maximum unit size would be reached with %li.\n",
    3575                 :             :                      size + overall_size);
    3576                 :             :         }
    3577                 :       82962 :       else if (dump_file && (dump_flags & TDF_DETAILS))
    3578                 :           4 :         fprintf (dump_file, "   Not cloning for all contexts because "
    3579                 :             :                  "!good_cloning_opportunity_p.\n");
    3580                 :             : 
    3581                 :             :     }
    3582                 :             : 
    3583                 :     2706073 :   for (int i = 0; i < count; i++)
    3584                 :             :     {
    3585                 :     1893281 :       class ipcp_param_lattices *plats = ipa_get_parm_lattices (info, i);
    3586                 :     1893281 :       ipcp_lattice<tree> *lat = &plats->itself;
    3587                 :     1893281 :       ipcp_value<tree> *val;
    3588                 :             : 
    3589                 :     3771248 :       if (lat->bottom
    3590                 :      179732 :           || !lat->values
    3591                 :     1925513 :           || avals.m_known_vals[i])
    3592                 :     1877967 :         continue;
    3593                 :             : 
    3594                 :       50706 :       for (val = lat->values; val; val = val->next)
    3595                 :             :         {
    3596                 :       35392 :           gcc_checking_assert (TREE_CODE (val->value) != TREE_BINFO);
    3597                 :       35392 :           avals.m_known_vals[i] = val->value;
    3598                 :             : 
    3599                 :       35392 :           int emc = estimate_move_cost (TREE_TYPE (val->value), true);
    3600                 :       35392 :           perform_estimation_of_a_value (node, &avals, removable_params_cost,
    3601                 :             :                                          emc, val);
    3602                 :             : 
    3603                 :       35392 :           if (dump_file && (dump_flags & TDF_DETAILS))
    3604                 :             :             {
    3605                 :          43 :               fprintf (dump_file, " - estimates for value ");
    3606                 :          43 :               print_ipcp_constant_value (dump_file, val->value);
    3607                 :          43 :               fprintf (dump_file, " for ");
    3608                 :          43 :               ipa_dump_param (dump_file, info, i);
    3609                 :          43 :               fprintf (dump_file, ": time_benefit: %g, size: %i\n",
    3610                 :             :                        val->local_time_benefit.to_double (),
    3611                 :             :                        val->local_size_cost);
    3612                 :             :             }
    3613                 :             :         }
    3614                 :       15314 :       avals.m_known_vals[i] = NULL_TREE;
    3615                 :             :     }
    3616                 :             : 
    3617                 :     2706073 :   for (int i = 0; i < count; i++)
    3618                 :             :     {
    3619                 :     1893281 :       class ipcp_param_lattices *plats = ipa_get_parm_lattices (info, i);
    3620                 :             : 
    3621                 :     1893281 :       if (!plats->virt_call)
    3622                 :     1885620 :         continue;
    3623                 :             : 
    3624                 :        7661 :       ipcp_lattice<ipa_polymorphic_call_context> *ctxlat = &plats->ctxlat;
    3625                 :        7661 :       ipcp_value<ipa_polymorphic_call_context> *val;
    3626                 :             : 
    3627                 :       15121 :       if (ctxlat->bottom
    3628                 :        2758 :           || !ctxlat->values
    3629                 :       10418 :           || !avals.m_known_contexts[i].useless_p ())
    3630                 :        7460 :         continue;
    3631                 :             : 
    3632                 :         526 :       for (val = ctxlat->values; val; val = val->next)
    3633                 :             :         {
    3634                 :         325 :           avals.m_known_contexts[i] = val->value;
    3635                 :         325 :           perform_estimation_of_a_value (node, &avals, removable_params_cost,
    3636                 :             :                                          0, val);
    3637                 :             : 
    3638                 :         325 :           if (dump_file && (dump_flags & TDF_DETAILS))
    3639                 :             :             {
    3640                 :           0 :               fprintf (dump_file, " - estimates for polymorphic context ");
    3641                 :           0 :               print_ipcp_constant_value (dump_file, val->value);
    3642                 :           0 :               fprintf (dump_file, " for ");
    3643                 :           0 :               ipa_dump_param (dump_file, info, i);
    3644                 :           0 :               fprintf (dump_file, ": time_benefit: %g, size: %i\n",
    3645                 :             :                        val->local_time_benefit.to_double (),
    3646                 :             :                        val->local_size_cost);
    3647                 :             :             }
    3648                 :             :         }
    3649                 :         201 :       avals.m_known_contexts[i] = ipa_polymorphic_call_context ();
    3650                 :             :     }
    3651                 :             : 
    3652                 :      812792 :   unsigned all_ctx_len = avals.m_known_aggs.length ();
    3653                 :      812792 :   auto_vec<ipa_argagg_value, 32> all_ctx;
    3654                 :      812792 :   all_ctx.reserve_exact (all_ctx_len);
    3655                 :      812792 :   all_ctx.splice (avals.m_known_aggs);
    3656                 :      812792 :   avals.m_known_aggs.safe_grow_cleared (all_ctx_len + 1);
    3657                 :             : 
    3658                 :      812792 :   unsigned j = 0;
    3659                 :     2706073 :   for (int index = 0; index < count; index++)
    3660                 :             :     {
    3661                 :     1893281 :       class ipcp_param_lattices *plats = ipa_get_parm_lattices (info, index);
    3662                 :             : 
    3663                 :     1893281 :       if (plats->aggs_bottom || !plats->aggs)
    3664                 :     1878601 :         continue;
    3665                 :             : 
    3666                 :       57569 :       for (ipcp_agg_lattice *aglat = plats->aggs; aglat; aglat = aglat->next)
    3667                 :             :         {
    3668                 :       42889 :           ipcp_value<tree> *val;
    3669                 :       42560 :           if (aglat->bottom || !aglat->values
    3670                 :             :               /* If the following is true, the one value is already part of all
    3671                 :             :                  context estimations.  */
    3672                 :       80275 :               || (!plats->aggs_contain_variable
    3673                 :       26329 :                   && aglat->is_single_const ()))
    3674                 :       27781 :             continue;
    3675                 :             : 
    3676                 :       15108 :           unsigned unit_offset = aglat->offset / BITS_PER_UNIT;
    3677                 :       15108 :           while (j < all_ctx_len
    3678                 :       23264 :                  && (all_ctx[j].index < index
    3679                 :        3212 :                      || (all_ctx[j].index == index
    3680                 :        2283 :                          && all_ctx[j].unit_offset < unit_offset)))
    3681                 :             :             {
    3682                 :        3148 :               avals.m_known_aggs[j] = all_ctx[j];
    3683                 :        3148 :               j++;
    3684                 :             :             }
    3685                 :             : 
    3686                 :       24078 :           for (unsigned k = j; k < all_ctx_len; k++)
    3687                 :        8970 :             avals.m_known_aggs[k+1] = all_ctx[k];
    3688                 :             : 
    3689                 :       37688 :           for (val = aglat->values; val; val = val->next)
    3690                 :             :             {
    3691                 :       22580 :               avals.m_known_aggs[j].value = val->value;
    3692                 :       22580 :               avals.m_known_aggs[j].unit_offset = unit_offset;
    3693                 :       22580 :               avals.m_known_aggs[j].index = index;
    3694                 :       22580 :               avals.m_known_aggs[j].by_ref = plats->aggs_by_ref;
    3695                 :       22580 :               avals.m_known_aggs[j].killed = false;
    3696                 :             : 
    3697                 :       22580 :               perform_estimation_of_a_value (node, &avals,
    3698                 :             :                                              removable_params_cost, 0, val);
    3699                 :             : 
    3700                 :       22580 :               if (dump_file && (dump_flags & TDF_DETAILS))
    3701                 :             :                 {
    3702                 :          76 :                   fprintf (dump_file, " - estimates for value ");
    3703                 :          76 :                   print_ipcp_constant_value (dump_file, val->value);
    3704                 :          76 :                   fprintf (dump_file, " for ");
    3705                 :          76 :                   ipa_dump_param (dump_file, info, index);
    3706                 :         152 :                   fprintf (dump_file, "[%soffset: " HOST_WIDE_INT_PRINT_DEC
    3707                 :             :                            "]: time_benefit: %g, size: %i\n",
    3708                 :          76 :                            plats->aggs_by_ref ? "ref " : "",
    3709                 :             :                            aglat->offset,
    3710                 :             :                            val->local_time_benefit.to_double (),
    3711                 :             :                            val->local_size_cost);
    3712                 :             :                 }
    3713                 :             :             }
    3714                 :             :         }
    3715                 :             :     }
    3716                 :      812792 : }
    3717                 :             : 
    3718                 :             : 
    3719                 :             : /* Add value CUR_VAL and all yet-unsorted values it is dependent on to the
    3720                 :             :    topological sort of values.  */
    3721                 :             : 
    3722                 :             : template <typename valtype>
    3723                 :             : void
    3724                 :      116136 : value_topo_info<valtype>::add_val (ipcp_value<valtype> *cur_val)
    3725                 :             : {
    3726                 :             :   ipcp_value_source<valtype> *src;
    3727                 :             : 
    3728                 :      116136 :   if (cur_val->dfs)
    3729                 :             :     return;
    3730                 :             : 
    3731                 :      115969 :   dfs_counter++;
    3732                 :      115969 :   cur_val->dfs = dfs_counter;
    3733                 :      115969 :   cur_val->low_link = dfs_counter;
    3734                 :             : 
    3735                 :      115969 :   cur_val->topo_next = stack;
    3736                 :      115969 :   stack = cur_val;
    3737                 :      115969 :   cur_val->on_stack = true;
    3738                 :             : 
    3739                 :      541641 :   for (src = cur_val->sources; src; src = src->next)
    3740                 :      425672 :     if (src->val)
    3741                 :             :       {
    3742                 :       19178 :         if (src->val->dfs == 0)
    3743                 :             :           {
    3744                 :         191 :             add_val (src->val);
    3745                 :         191 :             if (src->val->low_link < cur_val->low_link)
    3746                 :          19 :               cur_val->low_link = src->val->low_link;
    3747                 :             :           }
    3748                 :       18987 :         else if (src->val->on_stack
    3749                 :        1312 :                  && src->val->dfs < cur_val->low_link)
    3750                 :          78 :           cur_val->low_link = src->val->dfs;
    3751                 :             :       }
    3752                 :             : 
    3753                 :      115969 :   if (cur_val->dfs == cur_val->low_link)
    3754                 :             :     {
    3755                 :             :       ipcp_value<valtype> *v, *scc_list = NULL;
    3756                 :             : 
    3757                 :             :       do
    3758                 :             :         {
    3759                 :      115969 :           v = stack;
    3760                 :      115969 :           stack = v->topo_next;
    3761                 :      115969 :           v->on_stack = false;
    3762                 :      115969 :           v->scc_no = cur_val->dfs;
    3763                 :             : 
    3764                 :      115969 :           v->scc_next = scc_list;
    3765                 :      115969 :           scc_list = v;
    3766                 :             :         }
    3767                 :      115969 :       while (v != cur_val);
    3768                 :             : 
    3769                 :      115876 :       cur_val->topo_next = values_topo;
    3770                 :      115876 :       values_topo = cur_val;
    3771                 :             :     }
    3772                 :             : }
    3773                 :             : 
    3774                 :             : /* Add all values in lattices associated with NODE to the topological sort if
    3775                 :             :    they are not there yet.  */
    3776                 :             : 
    3777                 :             : static void
    3778                 :     1194647 : add_all_node_vals_to_toposort (cgraph_node *node, ipa_topo_info *topo)
    3779                 :             : {
    3780                 :     1194647 :   ipa_node_params *info = ipa_node_params_sum->get (node);
    3781                 :     1194647 :   int i, count = ipa_get_param_count (info);
    3782                 :             : 
    3783                 :     3372776 :   for (i = 0; i < count; i++)
    3784                 :             :     {
    3785                 :     2178129 :       class ipcp_param_lattices *plats = ipa_get_parm_lattices (info, i);
    3786                 :     2178129 :       ipcp_lattice<tree> *lat = &plats->itself;
    3787                 :     2178129 :       struct ipcp_agg_lattice *aglat;
    3788                 :             : 
    3789                 :     2178129 :       if (!lat->bottom)
    3790                 :             :         {
    3791                 :      190230 :           ipcp_value<tree> *val;
    3792                 :      253268 :           for (val = lat->values; val; val = val->next)
    3793                 :       63038 :             topo->constants.add_val (val);
    3794                 :             :         }
    3795                 :             : 
    3796                 :     2178129 :       if (!plats->aggs_bottom)
    3797                 :      234790 :         for (aglat = plats->aggs; aglat; aglat = aglat->next)
    3798                 :       44703 :           if (!aglat->bottom)
    3799                 :             :             {
    3800                 :       44374 :               ipcp_value<tree> *val;
    3801                 :       90395 :               for (val = aglat->values; val; val = val->next)
    3802                 :       46021 :                 topo->constants.add_val (val);
    3803                 :             :             }
    3804                 :             : 
    3805                 :     2178129 :       ipcp_lattice<ipa_polymorphic_call_context> *ctxlat = &plats->ctxlat;
    3806                 :     2178129 :       if (!ctxlat->bottom)
    3807                 :             :         {
    3808                 :      191133 :           ipcp_value<ipa_polymorphic_call_context> *ctxval;
    3809                 :      198019 :           for (ctxval = ctxlat->values; ctxval; ctxval = ctxval->next)
    3810                 :        6886 :             topo->contexts.add_val (ctxval);
    3811                 :             :         }
    3812                 :             :     }
    3813                 :     1194647 : }
    3814                 :             : 
    3815                 :             : /* One pass of constants propagation along the call graph edges, from callers
    3816                 :             :    to callees (requires topological ordering in TOPO), iterate over strongly
    3817                 :             :    connected components.  */
    3818                 :             : 
    3819                 :             : static void
    3820                 :      125030 : propagate_constants_topo (class ipa_topo_info *topo)
    3821                 :             : {
    3822                 :      125030 :   int i;
    3823                 :             : 
    3824                 :     1398806 :   for (i = topo->nnodes - 1; i >= 0; i--)
    3825                 :             :     {
    3826                 :     1273776 :       unsigned j;
    3827                 :     1273776 :       struct cgraph_node *v, *node = topo->order[i];
    3828                 :     1273776 :       vec<cgraph_node *> cycle_nodes = ipa_get_nodes_in_cycle (node);
    3829                 :             : 
    3830                 :             :       /* First, iteratively propagate within the strongly connected component
    3831                 :             :          until all lattices stabilize.  */
    3832                 :     2553409 :       FOR_EACH_VEC_ELT (cycle_nodes, j, v)
    3833                 :     1279633 :         if (v->has_gimple_body_p ())
    3834                 :             :           {
    3835                 :     1205134 :             if (opt_for_fn (v->decl, flag_ipa_cp)
    3836                 :     1205134 :                 && opt_for_fn (v->decl, optimize))
    3837                 :     1194647 :               push_node_to_stack (topo, v);
    3838                 :             :             /* When V is not optimized, we can not push it to stack, but
    3839                 :             :                still we need to set all its callees lattices to bottom.  */
    3840                 :             :             else
    3841                 :             :               {
    3842                 :       24116 :                 for (cgraph_edge *cs = v->callees; cs; cs = cs->next_callee)
    3843                 :       13629 :                    propagate_constants_across_call (cs);
    3844                 :             :               }
    3845                 :             :           }
    3846                 :             : 
    3847                 :     1273776 :       v = pop_node_from_stack (topo);
    3848                 :     3744806 :       while (v)
    3849                 :             :         {
    3850                 :     1197254 :           struct cgraph_edge *cs;
    3851                 :     1197254 :           class ipa_node_params *info = NULL;
    3852                 :     1197254 :           bool self_scc = true;
    3853                 :             : 
    3854                 :     6122002 :           for (cs = v->callees; cs; cs = cs->next_callee)
    3855                 :     4924748 :             if (ipa_edge_within_scc (cs))
    3856                 :             :               {
    3857                 :       31449 :                 cgraph_node *callee = cs->callee->function_symbol ();
    3858                 :             : 
    3859                 :       31449 :                 if (v != callee)
    3860                 :       21159 :                   self_scc = false;
    3861                 :             : 
    3862                 :       31449 :                 if (!info)
    3863                 :             :                   {
    3864                 :       13395 :                     info = ipa_node_params_sum->get (v);
    3865                 :       13395 :                     info->node_within_scc = true;
    3866                 :             :                   }
    3867                 :             : 
    3868                 :       31449 :                 if (propagate_constants_across_call (cs))
    3869                 :        3699 :                   push_node_to_stack (topo, callee);
    3870                 :             :               }
    3871                 :             : 
    3872                 :     1197254 :           if (info)
    3873                 :       13395 :             info->node_is_self_scc = self_scc;
    3874                 :             : 
    3875                 :     1197254 :           v = pop_node_from_stack (topo);
    3876                 :             :         }
    3877                 :             : 
    3878                 :             :       /* Afterwards, propagate along edges leading out of the SCC, calculates
    3879                 :             :          the local effects of the discovered constants and all valid values to
    3880                 :             :          their topological sort.  */
    3881                 :     2553409 :       FOR_EACH_VEC_ELT (cycle_nodes, j, v)
    3882                 :     1279633 :         if (v->has_gimple_body_p ()
    3883                 :     1205134 :             && opt_for_fn (v->decl, flag_ipa_cp)
    3884                 :     2474280 :             && opt_for_fn (v->decl, optimize))
    3885                 :             :           {
    3886                 :     1194647 :             struct cgraph_edge *cs;
    3887                 :             : 
    3888                 :     1194647 :             estimate_local_effects (v);
    3889                 :     1194647 :             add_all_node_vals_to_toposort (v, topo);
    3890                 :     6087982 :             for (cs = v->callees; cs; cs = cs->next_callee)
    3891                 :     4893335 :               if (!ipa_edge_within_scc (cs))
    3892                 :     4868700 :                 propagate_constants_across_call (cs);
    3893                 :             :           }
    3894                 :     1273776 :       cycle_nodes.release ();
    3895                 :             :     }
    3896                 :      125030 : }
    3897                 :             : 
    3898                 :             : /* Propagate the estimated effects of individual values along the topological
    3899                 :             :    from the dependent values to those they depend on.  */
    3900                 :             : 
    3901                 :             : template <typename valtype>
    3902                 :             : void
    3903                 :      250060 : value_topo_info<valtype>::propagate_effects ()
    3904                 :             : {
    3905                 :             :   ipcp_value<valtype> *base;
    3906                 :      250060 :   hash_set<ipcp_value<valtype> *> processed_srcvals;
    3907                 :             : 
    3908                 :      365936 :   for (base = values_topo; base; base = base->topo_next)
    3909                 :             :     {
    3910                 :             :       ipcp_value_source<valtype> *src;
    3911                 :             :       ipcp_value<valtype> *val;
    3912                 :      115876 :       sreal time = 0;
    3913                 :      115876 :       HOST_WIDE_INT size = 0;
    3914                 :             : 
    3915                 :      231845 :       for (val = base; val; val = val->scc_next)
    3916                 :             :         {
    3917                 :      115969 :           time = time + val->local_time_benefit + val->prop_time_benefit;
    3918                 :      115969 :           size = size + val->local_size_cost + val->prop_size_cost;
    3919                 :             :         }
    3920                 :             : 
    3921                 :      231845 :       for (val = base; val; val = val->scc_next)
    3922                 :             :         {
    3923                 :      115969 :           processed_srcvals.empty ();
    3924                 :      541641 :           for (src = val->sources; src; src = src->next)
    3925                 :      425672 :             if (src->val
    3926                 :      425672 :                 && src->cs->maybe_hot_p ())
    3927                 :             :               {
    3928                 :       14055 :                 if (!processed_srcvals.add (src->val))
    3929                 :             :                   {
    3930                 :       10828 :                     HOST_WIDE_INT prop_size = size + src->val->prop_size_cost;
    3931                 :       10828 :                     if (prop_size < INT_MAX)
    3932                 :       10828 :                       src->val->prop_size_cost = prop_size;
    3933                 :             :                     else
    3934                 :           0 :                       continue;
    3935                 :             :                   }
    3936                 :             : 
    3937                 :       14055 :                 int special_factor = 1;
    3938                 :       14055 :                 if (val->same_scc (src->val))
    3939                 :             :                   special_factor
    3940                 :        1317 :                     = opt_for_fn(src->cs->caller->decl,
    3941                 :             :                                  param_ipa_cp_recursive_freq_factor);
    3942                 :       12738 :                 else if (val->self_recursion_generated_p ()
    3943                 :       12738 :                          && (src->cs->callee->function_symbol ()
    3944                 :        1382 :                              == src->cs->caller))
    3945                 :             :                   {
    3946                 :        1382 :                     int max_recur_gen_depth
    3947                 :        1382 :                       = opt_for_fn(src->cs->caller->decl,
    3948                 :             :                                    param_ipa_cp_max_recursive_depth);
    3949                 :        1382 :                     special_factor = max_recur_gen_depth
    3950                 :        1382 :                       - val->self_recursion_generated_level + 1;
    3951                 :             :                   }
    3952                 :             : 
    3953                 :       14055 :                 src->val->prop_time_benefit
    3954                 :       28110 :                   += time * special_factor * src->cs->sreal_frequency ();
    3955                 :             :               }
    3956                 :             : 
    3957                 :      115969 :           if (size < INT_MAX)
    3958                 :             :             {
    3959                 :      115969 :               val->prop_time_benefit = time;
    3960                 :      115969 :               val->prop_size_cost = size;
    3961                 :             :             }
    3962                 :             :           else
    3963                 :             :             {
    3964                 :           0 :               val->prop_time_benefit = 0;
    3965                 :           0 :               val->prop_size_cost = 0;
    3966                 :             :             }
    3967                 :             :         }
    3968                 :             :     }
    3969                 :      250060 : }
    3970                 :             : 
    3971                 :             : /* Callback for qsort to sort counts of all edges.  */
    3972                 :             : 
    3973                 :             : static int
    3974                 :        1614 : compare_edge_profile_counts (const void *a, const void *b)
    3975                 :             : {
    3976                 :        1614 :   const profile_count *cnt1 = (const profile_count *) a;
    3977                 :        1614 :   const profile_count *cnt2 = (const profile_count *) b;
    3978                 :             : 
    3979                 :        1614 :   if (*cnt1 < *cnt2)
    3980                 :             :     return 1;
    3981                 :        1329 :   if (*cnt1 > *cnt2)
    3982                 :         358 :     return -1;
    3983                 :             :   return 0;
    3984                 :             : }
    3985                 :             : 
    3986                 :             : 
    3987                 :             : /* Propagate constants, polymorphic contexts and their effects from the
    3988                 :             :    summaries interprocedurally.  */
    3989                 :             : 
    3990                 :             : static void
    3991                 :      125030 : ipcp_propagate_stage (class ipa_topo_info *topo)
    3992                 :             : {
    3993                 :      125030 :   struct cgraph_node *node;
    3994                 :             : 
    3995                 :      125030 :   if (dump_file)
    3996                 :         153 :     fprintf (dump_file, "\n Propagating constants:\n\n");
    3997                 :             : 
    3998                 :      125030 :   base_count = profile_count::uninitialized ();
    3999                 :             : 
    4000                 :      125030 :   bool compute_count_base = false;
    4001                 :      125030 :   unsigned base_count_pos_percent = 0;
    4002                 :     1404667 :   FOR_EACH_DEFINED_FUNCTION (node)
    4003                 :             :   {
    4004                 :     1279637 :     if (node->has_gimple_body_p ()
    4005                 :     1205134 :         && opt_for_fn (node->decl, flag_ipa_cp)
    4006                 :     2474284 :         && opt_for_fn (node->decl, optimize))
    4007                 :             :       {
    4008                 :     1194647 :         ipa_node_params *info = ipa_node_params_sum->get (node);
    4009                 :     1194647 :         determine_versionability (node, info);
    4010                 :             : 
    4011                 :     1194647 :         unsigned nlattices = ipa_get_param_count (info);
    4012                 :     1194647 :         info->lattices.safe_grow_cleared (nlattices, true);
    4013                 :     1194647 :         initialize_node_lattices (node);
    4014                 :             :       }
    4015                 :     1279637 :     ipa_size_summary *s = ipa_size_summaries->get (node);
    4016                 :     1279637 :     if (node->definition && !node->alias && s != NULL)
    4017                 :     1206099 :       overall_size += s->self_size;
    4018                 :     1279637 :     if (node->count.ipa ().initialized_p ())
    4019                 :             :       {
    4020                 :        4861 :         compute_count_base = true;
    4021                 :        4861 :         unsigned pos_percent = opt_for_fn (node->decl,
    4022                 :             :                                            param_ipa_cp_profile_count_base);
    4023                 :        4861 :         base_count_pos_percent = MAX (base_count_pos_percent, pos_percent);
    4024                 :             :       }
    4025                 :             :   }
    4026                 :             : 
    4027                 :      125030 :   if (compute_count_base)
    4028                 :             :     {
    4029                 :        2718 :       auto_vec<profile_count> all_edge_counts;
    4030                 :        2718 :       all_edge_counts.reserve_exact (symtab->edges_count);
    4031                 :      200359 :       FOR_EACH_DEFINED_FUNCTION (node)
    4032                 :      889780 :         for (cgraph_edge *cs = node->callees; cs; cs = cs->next_callee)
    4033                 :             :           {
    4034                 :      692139 :             profile_count count = cs->count.ipa ();
    4035                 :      692139 :             if (!count.nonzero_p ())
    4036                 :      691782 :               continue;
    4037                 :             : 
    4038                 :         357 :             enum availability avail;
    4039                 :         357 :             cgraph_node *tgt
    4040                 :         357 :               = cs->callee->function_or_virtual_thunk_symbol (&avail);
    4041                 :         357 :             ipa_node_params *info = ipa_node_params_sum->get (tgt);
    4042                 :         357 :             if (info && info->versionable)
    4043                 :         191 :               all_edge_counts.quick_push (count);
    4044                 :             :           }
    4045                 :             : 
    4046                 :        2718 :       if (!all_edge_counts.is_empty ())
    4047                 :             :         {
    4048                 :          60 :           gcc_assert (base_count_pos_percent <= 100);
    4049                 :          60 :           all_edge_counts.qsort (compare_edge_profile_counts);
    4050                 :             : 
    4051                 :          60 :           unsigned base_count_pos
    4052                 :          60 :             = ((all_edge_counts.length () * (base_count_pos_percent)) / 100);
    4053                 :          60 :           base_count = all_edge_counts[base_count_pos];
    4054                 :             : 
    4055                 :          60 :           if (dump_file)
    4056                 :             :             {
    4057                 :           0 :               fprintf (dump_file, "\nSelected base_count from %u edges at "
    4058                 :             :                        "position %u, arriving at: ", all_edge_counts.length (),
    4059                 :             :                        base_count_pos);
    4060                 :           0 :               base_count.dump (dump_file);
    4061                 :           0 :               fprintf (dump_file, "\n");
    4062                 :             :             }
    4063                 :             :         }
    4064                 :        2658 :       else if (dump_file)
    4065                 :           8 :         fprintf (dump_file, "\nNo candidates with non-zero call count found, "
    4066                 :             :                  "continuing as if without profile feedback.\n");
    4067                 :        2718 :     }
    4068                 :             : 
    4069                 :      125030 :   orig_overall_size = overall_size;
    4070                 :             : 
    4071                 :      125030 :   if (dump_file)
    4072                 :         153 :     fprintf (dump_file, "\noverall_size: %li\n", overall_size);
    4073                 :             : 
    4074                 :      125030 :   propagate_constants_topo (topo);
    4075                 :      125030 :   if (flag_checking)
    4076                 :      125022 :     ipcp_verify_propagated_values ();
    4077                 :      125030 :   topo->constants.propagate_effects ();
    4078                 :      125030 :   topo->contexts.propagate_effects ();
    4079                 :             : 
    4080                 :      125030 :   if (dump_file)
    4081                 :             :     {
    4082                 :         153 :       fprintf (dump_file, "\nIPA lattices after all propagation:\n");
    4083                 :         153 :       print_all_lattices (dump_file, (dump_flags & TDF_DETAILS), true);
    4084                 :             :     }
    4085                 :      125030 : }
    4086                 :             : 
    4087                 :             : /* Discover newly direct outgoing edges from NODE which is a new clone with
    4088                 :             :    known KNOWN_CSTS and make them direct.  */
    4089                 :             : 
    4090                 :             : static void
    4091                 :       17348 : ipcp_discover_new_direct_edges (struct cgraph_node *node,
    4092                 :             :                                 vec<tree> known_csts,
    4093                 :             :                                 vec<ipa_polymorphic_call_context>
    4094                 :             :                                 known_contexts,
    4095                 :             :                                 vec<ipa_argagg_value, va_gc> *aggvals)
    4096                 :             : {
    4097                 :       17348 :   struct cgraph_edge *ie, *next_ie;
    4098                 :       17348 :   bool found = false;
    4099                 :             : 
    4100                 :       18925 :   for (ie = node->indirect_calls; ie; ie = next_ie)
    4101                 :             :     {
    4102                 :        1577 :       tree target;
    4103                 :        1577 :       bool speculative;
    4104                 :             : 
    4105                 :        1577 :       next_ie = ie->next_callee;
    4106                 :        1577 :       ipa_argagg_value_list avs (aggvals);
    4107                 :        1577 :       target = ipa_get_indirect_edge_target_1 (ie, known_csts, known_contexts,
    4108                 :             :                                                avs, &speculative);
    4109                 :        1577 :       if (target)
    4110                 :             :         {
    4111                 :         504 :           bool agg_contents = ie->indirect_info->agg_contents;
    4112                 :         504 :           bool polymorphic = ie->indirect_info->polymorphic;
    4113                 :         504 :           int param_index = ie->indirect_info->param_index;
    4114                 :         504 :           struct cgraph_edge *cs = ipa_make_edge_direct_to_target (ie, target,
    4115                 :             :                                                                    speculative);
    4116                 :         504 :           found = true;
    4117                 :             : 
    4118                 :         504 :           if (cs && !agg_contents && !polymorphic)
    4119                 :             :             {
    4120                 :         334 :               ipa_node_params *info = ipa_node_params_sum->get (node);
    4121                 :         334 :               int c = ipa_get_controlled_uses (info, param_index);
    4122                 :         334 :               if (c != IPA_UNDESCRIBED_USE
    4123                 :         334 :                   && !ipa_get_param_load_dereferenced (info, param_index))
    4124                 :             :                 {
    4125                 :         334 :                   struct ipa_ref *to_del;
    4126                 :             : 
    4127                 :         334 :                   c--;
    4128                 :         334 :                   ipa_set_controlled_uses (info, param_index, c);
    4129                 :         334 :                   if (dump_file && (dump_flags & TDF_DETAILS))
    4130                 :           3 :                     fprintf (dump_file, "     controlled uses count of param "
    4131                 :             :                              "%i bumped down to %i\n", param_index, c);
    4132                 :         334 :                   if (c == 0
    4133                 :         334 :                       && (to_del = node->find_reference (cs->callee, NULL, 0,
    4134                 :             :                                                          IPA_REF_ADDR)))
    4135                 :             :                     {
    4136                 :         264 :                       if (dump_file && (dump_flags & TDF_DETAILS))
    4137                 :           3 :                         fprintf (dump_file, "       and even removing its "
    4138                 :             :                                  "cloning-created reference\n");
    4139                 :         264 :                       to_del->remove_reference ();
    4140                 :             :                     }
    4141                 :             :                 }
    4142                 :             :             }
    4143                 :             :         }
    4144                 :             :     }
    4145                 :             :   /* Turning calls to direct calls will improve overall summary.  */
    4146                 :       17348 :   if (found)
    4147                 :         436 :     ipa_update_overall_fn_summary (node);
    4148                 :       17348 : }
    4149                 :             : 
    4150                 :             : class edge_clone_summary;
    4151                 :             : static call_summary <edge_clone_summary *> *edge_clone_summaries = NULL;
    4152                 :             : 
    4153                 :             : /* Edge clone summary.  */
    4154                 :             : 
    4155                 :             : class edge_clone_summary
    4156                 :             : {
    4157                 :             : public:
    4158                 :             :   /* Default constructor.  */
    4159                 :      368445 :   edge_clone_summary (): prev_clone (NULL), next_clone (NULL) {}
    4160                 :             : 
    4161                 :             :   /* Default destructor.  */
    4162                 :      368445 :   ~edge_clone_summary ()
    4163                 :             :   {
    4164                 :      368445 :     if (prev_clone)
    4165                 :       28329 :       edge_clone_summaries->get (prev_clone)->next_clone = next_clone;
    4166                 :      368445 :     if (next_clone)
    4167                 :      157102 :       edge_clone_summaries->get (next_clone)->prev_clone = prev_clone;
    4168                 :      368445 :   }
    4169                 :             : 
    4170                 :             :   cgraph_edge *prev_clone;
    4171                 :             :   cgraph_edge *next_clone;
    4172                 :             : };
    4173                 :             : 
    4174                 :             : class edge_clone_summary_t:
    4175                 :             :   public call_summary <edge_clone_summary *>
    4176                 :             : {
    4177                 :             : public:
    4178                 :      125030 :   edge_clone_summary_t (symbol_table *symtab):
    4179                 :      250060 :     call_summary <edge_clone_summary *> (symtab)
    4180                 :             :     {
    4181                 :      125030 :       m_initialize_when_cloning = true;
    4182                 :             :     }
    4183                 :             : 
    4184                 :             :   void duplicate (cgraph_edge *src_edge, cgraph_edge *dst_edge,
    4185                 :             :                   edge_clone_summary *src_data,
    4186                 :             :                   edge_clone_summary *dst_data) final override;
    4187                 :             : };
    4188                 :             : 
    4189                 :             : /* Edge duplication hook.  */
    4190                 :             : 
    4191                 :             : void
    4192                 :      185126 : edge_clone_summary_t::duplicate (cgraph_edge *src_edge, cgraph_edge *dst_edge,
    4193                 :             :                                  edge_clone_summary *src_data,
    4194                 :             :                                  edge_clone_summary *dst_data)
    4195                 :             : {
    4196                 :      185126 :   if (src_data->next_clone)
    4197                 :        1795 :     edge_clone_summaries->get (src_data->next_clone)->prev_clone = dst_edge;
    4198                 :      185126 :   dst_data->prev_clone = src_edge;
    4199                 :      185126 :   dst_data->next_clone = src_data->next_clone;
    4200                 :      185126 :   src_data->next_clone = dst_edge;
    4201                 :      185126 : }
    4202                 :             : 
    4203                 :             : /* Return true is CS calls DEST or its clone for all contexts.  When
    4204                 :             :    ALLOW_RECURSION_TO_CLONE is false, also return false for self-recursive
    4205                 :             :    edges from/to an all-context clone.  */
    4206                 :             : 
    4207                 :             : static bool
    4208                 :      604522 : calls_same_node_or_its_all_contexts_clone_p (cgraph_edge *cs, cgraph_node *dest,
    4209                 :             :                                              bool allow_recursion_to_clone)
    4210                 :             : {
    4211                 :      604522 :   enum availability availability;
    4212                 :      604522 :   cgraph_node *callee = cs->callee->function_symbol (&availability);
    4213                 :             : 
    4214                 :      604522 :   if (availability <= AVAIL_INTERPOSABLE)
    4215                 :             :     return false;
    4216                 :      604401 :   if (callee == dest)
    4217                 :             :     return true;
    4218                 :       67367 :   if (!allow_recursion_to_clone && cs->caller == callee)
    4219                 :             :     return false;
    4220                 :             : 
    4221                 :       66471 :   ipa_node_params *info = ipa_node_params_sum->get (callee);
    4222                 :       66471 :   return info->is_all_contexts_clone && info->ipcp_orig_node == dest;
    4223                 :             : }
    4224                 :             : 
    4225                 :             : /* Return true if edge CS does bring about the value described by SRC to
    4226                 :             :    DEST_VAL of node DEST or its clone for all contexts.  */
    4227                 :             : 
    4228                 :             : static bool
    4229                 :      602310 : cgraph_edge_brings_value_p (cgraph_edge *cs, ipcp_value_source<tree> *src,
    4230                 :             :                             cgraph_node *dest, ipcp_value<tree> *dest_val)
    4231                 :             : {
    4232                 :      602310 :   ipa_node_params *caller_info = ipa_node_params_sum->get (cs->caller);
    4233                 :             : 
    4234                 :      602310 :   if (!calls_same_node_or_its_all_contexts_clone_p (cs, dest, !src->val)
    4235                 :      602310 :       || caller_info->node_dead)
    4236                 :             :     return false;
    4237                 :             : 
    4238                 :      363124 :   if (!src->val)
    4239                 :             :     return true;
    4240                 :             : 
    4241                 :       18581 :   if (caller_info->ipcp_orig_node)
    4242                 :             :     {
    4243                 :        4525 :       tree t = NULL_TREE;
    4244                 :        4525 :       if (src->offset == -1)
    4245                 :        2695 :         t = caller_info->known_csts[src->index];
    4246                 :        1830 :       else if (ipcp_transformation *ts
    4247                 :        1830 :                = ipcp_get_transformation_summary (cs->caller))
    4248                 :             :         {
    4249                 :        1830 :           ipa_argagg_value_list avl (ts);
    4250                 :        1830 :           t = avl.get_value (src->index, src->offset / BITS_PER_UNIT);
    4251                 :             :         }
    4252                 :        4525 :       return (t != NULL_TREE
    4253                 :        4525 :               && values_equal_for_ipcp_p (src->val->value, t));
    4254                 :             :     }
    4255                 :             :   else
    4256                 :             :     {
    4257                 :       14056 :       if (src->val == dest_val)
    4258                 :             :         return true;
    4259                 :             : 
    4260                 :       13098 :       struct ipcp_agg_lattice *aglat;
    4261                 :       13098 :       class ipcp_param_lattices *plats = ipa_get_parm_lattices (caller_info,
    4262                 :             :                                                                  src->index);
    4263                 :       13098 :       if (src->offset == -1)
    4264                 :       10389 :         return (plats->itself.is_single_const ()
    4265                 :           6 :                 && values_equal_for_ipcp_p (src->val->value,
    4266                 :           6 :                                             plats->itself.values->value));
    4267                 :             :       else
    4268                 :             :         {
    4269                 :        2709 :           if (plats->aggs_bottom || plats->aggs_contain_variable)
    4270                 :             :             return false;
    4271                 :        1356 :           for (aglat = plats->aggs; aglat; aglat = aglat->next)
    4272                 :        1356 :             if (aglat->offset == src->offset)
    4273                 :         645 :               return  (aglat->is_single_const ()
    4274                 :           4 :                        && values_equal_for_ipcp_p (src->val->value,
    4275                 :           4 :                                                    aglat->values->value));
    4276                 :             :         }
    4277                 :             :       return false;
    4278                 :             :     }
    4279                 :             : }
    4280                 :             : 
    4281                 :             : /* Return true if edge CS does bring about the value described by SRC to
    4282                 :             :    DST_VAL of node DEST or its clone for all contexts.  */
    4283                 :             : 
    4284                 :             : static bool
    4285                 :        2212 : cgraph_edge_brings_value_p (cgraph_edge *cs,
    4286                 :             :                             ipcp_value_source<ipa_polymorphic_call_context> *src,
    4287                 :             :                             cgraph_node *dest,
    4288                 :             :                             ipcp_value<ipa_polymorphic_call_context> *)
    4289                 :             : {
    4290                 :        2212 :   ipa_node_params *caller_info = ipa_node_params_sum->get (cs->caller);
    4291                 :             : 
    4292                 :        2212 :   if (!calls_same_node_or_its_all_contexts_clone_p (cs, dest, true)
    4293                 :        2212 :       || caller_info->node_dead)
    4294                 :             :     return false;
    4295                 :        1879 :   if (!src->val)
    4296                 :             :     return true;
    4297                 :             : 
    4298                 :         556 :   if (caller_info->ipcp_orig_node)
    4299                 :         851 :     return (caller_info->known_contexts.length () > (unsigned) src->index)
    4300                 :         162 :       && values_equal_for_ipcp_p (src->val->value,
    4301                 :          81 :                                   caller_info->known_contexts[src->index]);
    4302                 :             : 
    4303                 :         467 :   class ipcp_param_lattices *plats = ipa_get_parm_lattices (caller_info,
    4304                 :             :                                                              src->index);
    4305                 :         467 :   return plats->ctxlat.is_single_const ()
    4306                 :          47 :     && values_equal_for_ipcp_p (src->val->value,
    4307                 :          47 :                                 plats->ctxlat.values->value);
    4308                 :             : }
    4309                 :             : 
    4310                 :             : /* Get the next clone in the linked list of clones of an edge.  */
    4311                 :             : 
    4312                 :             : static inline struct cgraph_edge *
    4313                 :      604935 : get_next_cgraph_edge_clone (struct cgraph_edge *cs)
    4314                 :             : {
    4315                 :      604935 :   edge_clone_summary *s = edge_clone_summaries->get (cs);
    4316                 :      604935 :   return s != NULL ? s->next_clone : NULL;
    4317                 :             : }
    4318                 :             : 
    4319                 :             : /* Given VAL that is intended for DEST, iterate over all its sources and if any
    4320                 :             :    of them is viable and hot, return true.  In that case, for those that still
    4321                 :             :    hold, add their edge frequency and their number and cumulative profile
    4322                 :             :    counts of self-ecursive and other edges into *FREQUENCY, *CALLER_COUNT,
    4323                 :             :    REC_COUNT_SUM and NONREC_COUNT_SUM respectively.  */
    4324                 :             : 
    4325                 :             : template <typename valtype>
    4326                 :             : static bool
    4327                 :       71485 : get_info_about_necessary_edges (ipcp_value<valtype> *val, cgraph_node *dest,
    4328                 :             :                                 sreal *freq_sum, int *caller_count,
    4329                 :             :                                 profile_count *rec_count_sum,
    4330                 :             :                                 profile_count *nonrec_count_sum)
    4331                 :             : {
    4332                 :             :   ipcp_value_source<valtype> *src;
    4333                 :       71485 :   sreal freq = 0;
    4334                 :       71485 :   int count = 0;
    4335                 :       71485 :   profile_count rec_cnt = profile_count::zero ();
    4336                 :       71485 :   profile_count nonrec_cnt = profile_count::zero ();
    4337                 :       71485 :   bool hot = false;
    4338                 :       71485 :   bool non_self_recursive = false;
    4339                 :             : 
    4340                 :      436377 :   for (src = val->sources; src; src = src->next)
    4341                 :             :     {
    4342                 :      364892 :       struct cgraph_edge *cs = src->cs;
    4343                 :      937699 :       while (cs)
    4344                 :             :         {
    4345                 :      572807 :           if (cgraph_edge_brings_value_p (cs, src, dest, val))
    4346                 :             :             {
    4347                 :      345192 :               count++;
    4348                 :      345192 :               freq += cs->sreal_frequency ();
    4349                 :      345192 :               hot |= cs->maybe_hot_p ();
    4350                 :      345192 :               if (cs->caller != dest)
    4351                 :             :                 {
    4352                 :      343400 :                   non_self_recursive = true;
    4353                 :      343400 :                   if (cs->count.ipa ().initialized_p ())
    4354                 :         326 :                     rec_cnt += cs->count.ipa ();
    4355                 :             :                 }
    4356                 :        1792 :               else if (cs->count.ipa ().initialized_p ())
    4357                 :           0 :                 nonrec_cnt += cs->count.ipa ();
    4358                 :             :             }
    4359                 :      572807 :           cs = get_next_cgraph_edge_clone (cs);
    4360                 :             :         }
    4361                 :             :     }
    4362                 :             : 
    4363                 :             :   /* If the only edges bringing a value are self-recursive ones, do not bother
    4364                 :             :      evaluating it.  */
    4365                 :       71485 :   if (!non_self_recursive)
    4366                 :             :     return false;
    4367                 :             : 
    4368                 :       61961 :   *freq_sum = freq;
    4369                 :       61961 :   *caller_count = count;
    4370                 :       61961 :   *rec_count_sum = rec_cnt;
    4371                 :       61961 :   *nonrec_count_sum = nonrec_cnt;
    4372                 :             : 
    4373                 :       61961 :   if (!hot && ipa_node_params_sum->get (dest)->node_within_scc)
    4374                 :             :     {
    4375                 :             :       struct cgraph_edge *cs;
    4376                 :             : 
    4377                 :             :       /* Cold non-SCC source edge could trigger hot recursive execution of
    4378                 :             :          function. Consider the case as hot and rely on following cost model
    4379                 :             :          computation to further select right one.  */
    4380                 :        4006 :       for (cs = dest->callers; cs; cs = cs->next_caller)
    4381                 :        3575 :         if (cs->caller == dest && cs->maybe_hot_p ())
    4382                 :             :           return true;
    4383                 :             :     }
    4384                 :             : 
    4385                 :             :   return hot;
    4386                 :             : }
    4387                 :             : 
    4388                 :             : /* Given a NODE, and a set of its CALLERS, try to adjust order of the callers
    4389                 :             :    to let a non-self-recursive caller be the first element.  Thus, we can
    4390                 :             :    simplify intersecting operations on values that arrive from all of these
    4391                 :             :    callers, especially when there exists self-recursive call.  Return true if
    4392                 :             :    this kind of adjustment is possible.  */
    4393                 :             : 
    4394                 :             : static bool
    4395                 :       16791 : adjust_callers_for_value_intersection (vec<cgraph_edge *> &callers,
    4396                 :             :                                        cgraph_node *node)
    4397                 :             : {
    4398                 :       16835 :   for (unsigned i = 0; i < callers.length (); i++)
    4399                 :             :     {
    4400                 :       16782 :       cgraph_edge *cs = callers[i];
    4401                 :             : 
    4402                 :       16782 :       if (cs->caller != node)
    4403                 :             :         {
    4404                 :       16738 :           if (i > 0)
    4405                 :             :             {
    4406                 :          34 :               callers[i] = callers[0];
    4407                 :          34 :               callers[0] = cs;
    4408                 :             :             }
    4409                 :       16738 :           return true;
    4410                 :             :         }
    4411                 :             :     }
    4412                 :             :   return false;
    4413                 :             : }
    4414                 :             : 
    4415                 :             : /* Return a vector of incoming edges that do bring value VAL to node DEST.  It
    4416                 :             :    is assumed their number is known and equal to CALLER_COUNT.  */
    4417                 :             : 
    4418                 :             : template <typename valtype>
    4419                 :             : static vec<cgraph_edge *>
    4420                 :        1063 : gather_edges_for_value (ipcp_value<valtype> *val, cgraph_node *dest,
    4421                 :             :                         int caller_count)
    4422                 :             : {
    4423                 :             :   ipcp_value_source<valtype> *src;
    4424                 :             :   vec<cgraph_edge *> ret;
    4425                 :             : 
    4426                 :        1063 :   ret.create (caller_count);
    4427                 :        5342 :   for (src = val->sources; src; src = src->next)
    4428                 :             :     {
    4429                 :        4279 :       struct cgraph_edge *cs = src->cs;
    4430                 :       16371 :       while (cs)
    4431                 :             :         {
    4432                 :       12092 :           if (cgraph_edge_brings_value_p (cs, src, dest, val))
    4433                 :        4031 :             ret.quick_push (cs);
    4434                 :       12092 :           cs = get_next_cgraph_edge_clone (cs);
    4435                 :             :         }
    4436                 :             :     }
    4437                 :             : 
    4438                 :        1063 :   if (caller_count > 1)
    4439                 :         453 :     adjust_callers_for_value_intersection (ret, dest);
    4440                 :             : 
    4441                 :        1063 :   return ret;
    4442                 :             : }
    4443                 :             : 
    4444                 :             : /* Construct a replacement map for a know VALUE for a formal parameter PARAM.
    4445                 :             :    Return it or NULL if for some reason it cannot be created.  FORCE_LOAD_REF
    4446                 :             :    should be set to true when the reference created for the constant should be
    4447                 :             :    a load one and not an address one because the corresponding parameter p is
    4448                 :             :    only used as *p.  */
    4449                 :             : 
    4450                 :             : static struct ipa_replace_map *
    4451                 :       18016 : get_replacement_map (class ipa_node_params *info, tree value, int parm_num,
    4452                 :             :                      bool force_load_ref)
    4453                 :             : {
    4454                 :       18016 :   struct ipa_replace_map *replace_map;
    4455                 :             : 
    4456                 :       18016 :   replace_map = ggc_alloc<ipa_replace_map> ();
    4457                 :       18016 :   if (dump_file)
    4458                 :             :     {
    4459                 :         164 :       fprintf (dump_file, "    replacing ");
    4460                 :         164 :       ipa_dump_param (dump_file, info, parm_num);
    4461                 :             : 
    4462                 :         164 :       fprintf (dump_file, " with const ");
    4463                 :         164 :       print_generic_expr (dump_file, value);
    4464                 :             : 
    4465                 :         164 :       if (force_load_ref)
    4466                 :           8 :         fprintf (dump_file, " - forcing load reference\n");
    4467                 :             :       else
    4468                 :         156 :         fprintf (dump_file, "\n");
    4469                 :             :     }
    4470                 :       18016 :   replace_map->parm_num = parm_num;
    4471                 :       18016 :   replace_map->new_tree = value;
    4472                 :       18016 :   replace_map->force_load_ref = force_load_ref;
    4473                 :       18016 :   return replace_map;
    4474                 :             : }
    4475                 :             : 
    4476                 :             : /* Dump new profiling counts of NODE.  SPEC is true when NODE is a specialzied
    4477                 :             :    one, otherwise it will be referred to as the original node.  */
    4478                 :             : 
    4479                 :             : static void
    4480                 :           0 : dump_profile_updates (cgraph_node *node, bool spec)
    4481                 :             : {
    4482                 :           0 :   if (spec)
    4483                 :           0 :     fprintf (dump_file, "     setting count of the specialized node %s to ",
    4484                 :             :              node->dump_name ());
    4485                 :             :   else
    4486                 :           0 :     fprintf (dump_file, "     setting count of the original node %s to ",
    4487                 :             :              node->dump_name ());
    4488                 :             : 
    4489                 :           0 :   node->count.dump (dump_file);
    4490                 :           0 :   fprintf (dump_file, "\n");
    4491                 :           0 :   for (cgraph_edge *cs = node->callees; cs; cs = cs->next_callee)
    4492                 :             :     {
    4493                 :           0 :       fprintf (dump_file, "       edge to %s has count ",
    4494                 :           0 :                cs->callee->dump_name ());
    4495                 :           0 :       cs->count.dump (dump_file);
    4496                 :           0 :       fprintf (dump_file, "\n");
    4497                 :             :     }
    4498                 :           0 : }
    4499                 :             : 
    4500                 :             : /* With partial train run we do not want to assume that original's count is
    4501                 :             :    zero whenever we redurect all executed edges to clone.  Simply drop profile
    4502                 :             :    to local one in this case.  In eany case, return the new value.  ORIG_NODE
    4503                 :             :    is the original node and its count has not been updaed yet.  */
    4504                 :             : 
    4505                 :             : profile_count
    4506                 :          17 : lenient_count_portion_handling (profile_count remainder, cgraph_node *orig_node)
    4507                 :             : {
    4508                 :          34 :   if (remainder.ipa_p () && !remainder.ipa ().nonzero_p ()
    4509                 :          21 :       && orig_node->count.ipa_p () && orig_node->count.ipa ().nonzero_p ()
    4510                 :           2 :       && opt_for_fn (orig_node->decl, flag_profile_partial_training))
    4511                 :           0 :     remainder = remainder.guessed_local ();
    4512                 :             : 
    4513                 :          17 :   return remainder;
    4514                 :             : }
    4515                 :             : 
    4516                 :             : /* Structure to sum counts coming from nodes other than the original node and
    4517                 :             :    its clones.  */
    4518                 :             : 
    4519                 :             : struct gather_other_count_struct
    4520                 :             : {
    4521                 :             :   cgraph_node *orig;
    4522                 :             :   profile_count other_count;
    4523                 :             : };
    4524                 :             : 
    4525                 :             : /* Worker callback of call_for_symbol_thunks_and_aliases summing the number of
    4526                 :             :    counts that come from non-self-recursive calls..  */
    4527                 :             : 
    4528                 :             : static bool
    4529                 :          12 : gather_count_of_non_rec_edges (cgraph_node *node, void *data)
    4530                 :             : {
    4531                 :          12 :   gather_other_count_struct *desc = (gather_other_count_struct *) data;
    4532                 :          26 :   for (cgraph_edge *cs = node->callers; cs; cs = cs->next_caller)
    4533                 :          14 :     if (cs->caller != desc->orig && cs->caller->clone_of != desc->orig)
    4534                 :           0 :       desc->other_count += cs->count.ipa ();
    4535                 :          12 :   return false;
    4536                 :             : }
    4537                 :             : 
    4538                 :             : /* Structure to help analyze if we need to boost counts of some clones of some
    4539                 :             :    non-recursive edges to match the new callee count.  */
    4540                 :             : 
    4541                 :             : struct desc_incoming_count_struct
    4542                 :             : {
    4543                 :             :   cgraph_node *orig;
    4544                 :             :   hash_set <cgraph_edge *> *processed_edges;
    4545                 :             :   profile_count count;
    4546                 :             :   unsigned unproc_orig_rec_edges;
    4547                 :             : };
    4548                 :             : 
    4549                 :             : /* Go over edges calling NODE and its thunks and gather information about
    4550                 :             :    incoming counts so that we know if we need to make any adjustments.  */
    4551                 :             : 
    4552                 :             : static void
    4553                 :          12 : analyze_clone_icoming_counts (cgraph_node *node,
    4554                 :             :                               desc_incoming_count_struct *desc)
    4555                 :             : {
    4556                 :          26 :   for (cgraph_edge *cs = node->callers; cs; cs = cs->next_caller)
    4557                 :          14 :     if (cs->caller->thunk)
    4558                 :             :       {
    4559                 :           0 :         analyze_clone_icoming_counts (cs->caller, desc);
    4560                 :           0 :         continue;
    4561                 :             :       }
    4562                 :             :     else
    4563                 :             :       {
    4564                 :          14 :         if (cs->count.initialized_p ())
    4565                 :          14 :           desc->count += cs->count.ipa ();
    4566                 :          14 :         if (!desc->processed_edges->contains (cs)
    4567                 :          14 :             && cs->caller->clone_of == desc->orig)
    4568                 :           2 :           desc->unproc_orig_rec_edges++;
    4569                 :             :       }
    4570                 :          12 : }
    4571                 :             : 
    4572                 :             : /* If caller edge counts of a clone created for a self-recursive arithmetic
    4573                 :             :    jump function must be adjusted because it is coming from a the "seed" clone
    4574                 :             :    for the first value and so has been excessively scaled back as if it was not
    4575                 :             :    a recursive call, adjust it so that the incoming counts of NODE match its
    4576                 :             :    count. NODE is the node or its thunk.  */
    4577                 :             : 
    4578                 :             : static void
    4579                 :           0 : adjust_clone_incoming_counts (cgraph_node *node,
    4580                 :             :                               desc_incoming_count_struct *desc)
    4581                 :             : {
    4582                 :           0 :   for (cgraph_edge *cs = node->callers; cs; cs = cs->next_caller)
    4583                 :           0 :     if (cs->caller->thunk)
    4584                 :             :       {
    4585                 :           0 :         adjust_clone_incoming_counts (cs->caller, desc);
    4586                 :           0 :         profile_count sum = profile_count::zero ();
    4587                 :           0 :         for (cgraph_edge *e = cs->caller->callers; e; e = e->next_caller)
    4588                 :           0 :           if (e->count.initialized_p ())
    4589                 :           0 :             sum += e->count.ipa ();
    4590                 :           0 :         cs->count = cs->count.combine_with_ipa_count (sum);
    4591                 :             :       }
    4592                 :           0 :     else if (!desc->processed_edges->contains (cs)
    4593                 :           0 :              && cs->caller->clone_of == desc->orig)
    4594                 :             :       {
    4595                 :           0 :         cs->count += desc->count;
    4596                 :           0 :         if (dump_file)
    4597                 :             :           {
    4598                 :           0 :             fprintf (dump_file, "       Adjusted count of an incoming edge of "
    4599                 :           0 :                      "a clone %s -> %s to ", cs->caller->dump_name (),
    4600                 :           0 :                      cs->callee->dump_name ());
    4601                 :           0 :             cs->count.dump (dump_file);
    4602                 :           0 :             fprintf (dump_file, "\n");
    4603                 :             :           }
    4604                 :             :       }
    4605                 :           0 : }
    4606                 :             : 
    4607                 :             : /* When ORIG_NODE has been cloned for values which have been generated fora
    4608                 :             :    self-recursive call as a result of an arithmetic pass-through
    4609                 :             :    jump-functions, adjust its count together with counts of all such clones in
    4610                 :             :    SELF_GEN_CLONES which also at this point contains ORIG_NODE itself.
    4611                 :             : 
    4612                 :             :    The function sums the counts of the original node and all its clones that
    4613                 :             :    cannot be attributed to a specific clone because it comes from a
    4614                 :             :    non-recursive edge.  This sum is then evenly divided between the clones and
    4615                 :             :    on top of that each one gets all the counts which can be attributed directly
    4616                 :             :    to it.  */
    4617                 :             : 
    4618                 :             : static void
    4619                 :          24 : update_counts_for_self_gen_clones (cgraph_node *orig_node,
    4620                 :             :                                    const vec<cgraph_node *> &self_gen_clones)
    4621                 :             : {
    4622                 :          24 :   profile_count redist_sum = orig_node->count.ipa ();
    4623                 :          24 :   if (!(redist_sum > profile_count::zero ()))
    4624                 :             :     return;
    4625                 :             : 
    4626                 :           2 :   if (dump_file)
    4627                 :           0 :     fprintf (dump_file, "     Updating profile of self recursive clone "
    4628                 :             :              "series\n");
    4629                 :             : 
    4630                 :           2 :   gather_other_count_struct gocs;
    4631                 :           2 :   gocs.orig = orig_node;
    4632                 :           2 :   gocs.other_count = profile_count::zero ();
    4633                 :             : 
    4634                 :           2 :   auto_vec <profile_count, 8> other_edges_count;
    4635                 :          18 :   for (cgraph_node *n : self_gen_clones)
    4636                 :             :     {
    4637                 :          12 :       gocs.other_count = profile_count::zero ();
    4638                 :          12 :       n->call_for_symbol_thunks_and_aliases (gather_count_of_non_rec_edges,
    4639                 :             :                                              &gocs, false);
    4640                 :          12 :       other_edges_count.safe_push (gocs.other_count);
    4641                 :          12 :       redist_sum -= gocs.other_count;
    4642                 :             :     }
    4643                 :             : 
    4644                 :           2 :   hash_set<cgraph_edge *> processed_edges;
    4645                 :           2 :   unsigned i = 0;
    4646                 :          18 :   for (cgraph_node *n : self_gen_clones)
    4647                 :             :     {
    4648                 :          12 :       profile_count orig_count = n->count;
    4649                 :          12 :       profile_count new_count
    4650                 :          24 :         = (redist_sum / self_gen_clones.length () + other_edges_count[i]);
    4651                 :          12 :       new_count = lenient_count_portion_handling (new_count, orig_node);
    4652                 :          12 :       n->count = new_count;
    4653                 :          12 :       profile_count::adjust_for_ipa_scaling (&new_count, &orig_count);
    4654                 :          24 :       for (cgraph_edge *cs = n->callees; cs; cs = cs->next_callee)
    4655                 :             :         {
    4656                 :          12 :           cs->count = cs->count.apply_scale (new_count, orig_count);
    4657                 :          12 :           processed_edges.add (cs);
    4658                 :             :         }
    4659                 :          12 :       for (cgraph_edge *cs = n->indirect_calls; cs; cs = cs->next_callee)
    4660                 :           0 :         cs->count = cs->count.apply_scale (new_count, orig_count);
    4661                 :             : 
    4662                 :          12 :       i++;
    4663                 :             :     }
    4664                 :             : 
    4665                 :             :   /* There are still going to be edges to ORIG_NODE that have one or more
    4666                 :             :      clones coming from another node clone in SELF_GEN_CLONES and which we
    4667                 :             :      scaled by the same amount, which means that the total incoming sum of
    4668                 :             :      counts to ORIG_NODE will be too high, scale such edges back.  */
    4669                 :           4 :   for (cgraph_edge *cs = orig_node->callees; cs; cs = cs->next_callee)
    4670                 :             :     {
    4671                 :           2 :       if (cs->callee->ultimate_alias_target () == orig_node)
    4672                 :             :         {
    4673                 :           2 :           unsigned den = 0;
    4674                 :          16 :           for (cgraph_edge *e = cs; e; e = get_next_cgraph_edge_clone (e))
    4675                 :          14 :             if (e->callee->ultimate_alias_target () == orig_node
    4676                 :          14 :                 && processed_edges.contains (e))
    4677                 :           4 :               den++;
    4678                 :           2 :           if (den > 0)
    4679                 :          16 :             for (cgraph_edge *e = cs; e; e = get_next_cgraph_edge_clone (e))
    4680                 :          14 :               if (e->callee->ultimate_alias_target () == orig_node
    4681                 :          14 :                   && processed_edges.contains (e))
    4682                 :           4 :                 e->count /= den;
    4683                 :             :         }
    4684                 :             :     }
    4685                 :             : 
    4686                 :             :   /* Edges from the seeds of the valus generated for arithmetic jump-functions
    4687                 :             :      along self-recursive edges are likely to have fairly low count and so
    4688                 :             :      edges from them to nodes in the self_gen_clones do not correspond to the
    4689                 :             :      artificially distributed count of the nodes, the total sum of incoming
    4690                 :             :      edges to some clones might be too low.  Detect this situation and correct
    4691                 :             :      it.  */
    4692                 :          18 :   for (cgraph_node *n : self_gen_clones)
    4693                 :             :     {
    4694                 :          12 :       if (!(n->count.ipa () > profile_count::zero ()))
    4695                 :           0 :         continue;
    4696                 :             : 
    4697                 :          12 :       desc_incoming_count_struct desc;
    4698                 :          12 :       desc.orig = orig_node;
    4699                 :          12 :       desc.processed_edges = &processed_edges;
    4700                 :          12 :       desc.count = profile_count::zero ();
    4701                 :          12 :       desc.unproc_orig_rec_edges = 0;
    4702                 :          12 :       analyze_clone_icoming_counts (n, &desc);
    4703                 :             : 
    4704                 :          12 :       if (n->count.differs_from_p (desc.count))
    4705                 :             :         {
    4706                 :           0 :           if (n->count > desc.count
    4707                 :           0 :               && desc.unproc_orig_rec_edges > 0)
    4708                 :             :             {
    4709                 :           0 :               desc.count = n->count - desc.count;
    4710                 :           0 :               desc.count = desc.count /= desc.unproc_orig_rec_edges;
    4711                 :           0 :               adjust_clone_incoming_counts (n, &desc);
    4712                 :             :             }
    4713                 :           0 :           else if (dump_file)
    4714                 :           0 :             fprintf (dump_file,
    4715                 :             :                      "       Unable to fix up incoming counts for %s.\n",
    4716                 :             :                      n->dump_name ());
    4717                 :             :         }
    4718                 :             :     }
    4719                 :             : 
    4720                 :           2 :   if (dump_file)
    4721                 :           0 :     for (cgraph_node *n : self_gen_clones)
    4722                 :           0 :       dump_profile_updates (n, n != orig_node);
    4723                 :           2 :   return;
    4724                 :           2 : }
    4725                 :             : 
    4726                 :             : /* After a specialized NEW_NODE version of ORIG_NODE has been created, update
    4727                 :             :    their profile information to reflect this.  This function should not be used
    4728                 :             :    for clones generated for arithmetic pass-through jump functions on a
    4729                 :             :    self-recursive call graph edge, that situation is handled by
    4730                 :             :    update_counts_for_self_gen_clones.  */
    4731                 :             : 
    4732                 :             : static void
    4733                 :         889 : update_profiling_info (struct cgraph_node *orig_node,
    4734                 :             :                        struct cgraph_node *new_node)
    4735                 :             : {
    4736                 :         889 :   struct caller_statistics stats;
    4737                 :         889 :   profile_count new_sum;
    4738                 :         889 :   profile_count remainder, orig_node_count = orig_node->count.ipa ();
    4739                 :             : 
    4740                 :         889 :   if (!(orig_node_count > profile_count::zero ()))
    4741                 :         884 :     return;
    4742                 :             : 
    4743                 :           5 :   if (dump_file)
    4744                 :             :     {
    4745                 :           0 :       fprintf (dump_file, "     Updating profile from original count: ");
    4746                 :           0 :       orig_node_count.dump (dump_file);
    4747                 :           0 :       fprintf (dump_file, "\n");
    4748                 :             :     }
    4749                 :             : 
    4750                 :           5 :   init_caller_stats (&stats, new_node);
    4751                 :           5 :   new_node->call_for_symbol_thunks_and_aliases (gather_caller_stats, &stats,
    4752                 :             :                                               false);
    4753                 :           5 :   new_sum = stats.count_sum;
    4754                 :             : 
    4755                 :           5 :   bool orig_edges_processed = false;
    4756                 :           5 :   if (new_sum > orig_node_count)
    4757                 :             :     {
    4758                 :             :       /* TODO: Profile has alreay gone astray, keep what we have but lower it
    4759                 :             :          to global0 category.  */
    4760                 :           0 :       remainder = orig_node->count.global0 ();
    4761                 :             : 
    4762                 :           0 :       for (cgraph_edge *cs = orig_node->callees; cs; cs = cs->next_callee)
    4763                 :           0 :         cs->count = cs->count.global0 ();
    4764                 :           0 :       for (cgraph_edge *cs = orig_node->indirect_calls;
    4765                 :           0 :            cs;
    4766                 :           0 :            cs = cs->next_callee)
    4767                 :           0 :         cs->count = cs->count.global0 ();
    4768                 :             :       orig_edges_processed = true;
    4769                 :             :     }
    4770                 :           5 :   else if (stats.rec_count_sum.nonzero_p ())
    4771                 :             :     {
    4772                 :           0 :       int new_nonrec_calls = stats.n_nonrec_calls;
    4773                 :             :       /* There are self-recursive edges which are likely to bring in the
    4774                 :             :          majority of calls but which we must divide in between the original and
    4775                 :             :          new node.  */
    4776                 :           0 :       init_caller_stats (&stats, orig_node);
    4777                 :           0 :       orig_node->call_for_symbol_thunks_and_aliases (gather_caller_stats,
    4778                 :             :                                                      &stats, false);
    4779                 :           0 :       int orig_nonrec_calls = stats.n_nonrec_calls;
    4780                 :           0 :       profile_count orig_nonrec_call_count = stats.count_sum;
    4781                 :             : 
    4782                 :           0 :       if (orig_node->local)
    4783                 :             :         {
    4784                 :           0 :           if (!orig_nonrec_call_count.nonzero_p ())
    4785                 :             :             {
    4786                 :           0 :               if (dump_file)
    4787                 :           0 :                 fprintf (dump_file, "       The original is local and the only "
    4788                 :             :                          "incoming edges from non-dead callers with nonzero "
    4789                 :             :                          "counts are self-recursive, assuming it is cold.\n");
    4790                 :             :               /* The NEW_NODE count and counts of all its outgoing edges
    4791                 :             :                  are still unmodified copies of ORIG_NODE's.  Just clear
    4792                 :             :                  the latter and bail out.  */
    4793                 :           0 :               profile_count zero;
    4794                 :           0 :               if (opt_for_fn (orig_node->decl, flag_profile_partial_training))
    4795                 :           0 :                 zero = profile_count::zero ().guessed_local ();
    4796                 :             :               else
    4797                 :             :                 zero = profile_count::adjusted_zero ();
    4798                 :           0 :               orig_node->count = zero;
    4799                 :           0 :               for (cgraph_edge *cs = orig_node->callees;
    4800                 :           0 :                    cs;
    4801                 :           0 :                    cs = cs->next_callee)
    4802                 :           0 :                 cs->count = zero;
    4803                 :           0 :               for (cgraph_edge *cs = orig_node->indirect_calls;
    4804                 :           0 :                    cs;
    4805                 :           0 :                    cs = cs->next_callee)
    4806                 :           0 :                 cs->count = zero;
    4807                 :           0 :               return;
    4808                 :             :             }
    4809                 :             :         }
    4810                 :             :       else
    4811                 :             :         {
    4812                 :             :           /* Let's behave as if there was another caller that accounts for all
    4813                 :             :              the calls that were either indirect or from other compilation
    4814                 :             :              units. */
    4815                 :           0 :           orig_nonrec_calls++;
    4816                 :           0 :           profile_count pretend_caller_count
    4817                 :           0 :             = (orig_node_count - new_sum - orig_nonrec_call_count
    4818                 :           0 :                - stats.rec_count_sum);
    4819                 :           0 :           orig_nonrec_call_count += pretend_caller_count;
    4820                 :             :         }
    4821                 :             : 
    4822                 :             :       /* Divide all "unexplained" counts roughly proportionally to sums of
    4823                 :             :          counts of non-recursive calls.
    4824                 :             : 
    4825                 :             :          We put rather arbitrary limits on how many counts we claim because the
    4826                 :             :          number of non-self-recursive incoming count is only a rough guideline
    4827                 :             :          and there are cases (such as mcf) where using it blindly just takes
    4828                 :             :          too many.  And if lattices are considered in the opposite order we
    4829                 :             :          could also take too few.  */
    4830                 :           0 :       profile_count unexp = orig_node_count - new_sum - orig_nonrec_call_count;
    4831                 :             : 
    4832                 :           0 :       int limit_den = 2 * (orig_nonrec_calls + new_nonrec_calls);
    4833                 :           0 :       profile_count new_part
    4834                 :           0 :         = MAX(MIN (unexp.apply_scale (new_sum,
    4835                 :             :                                       new_sum + orig_nonrec_call_count),
    4836                 :             :                    unexp.apply_scale (limit_den - 1, limit_den)),
    4837                 :             :               unexp.apply_scale (new_nonrec_calls, limit_den));
    4838                 :           0 :       if (dump_file)
    4839                 :             :         {
    4840                 :           0 :           fprintf (dump_file, "       Claiming ");
    4841                 :           0 :           new_part.dump (dump_file);
    4842                 :           0 :           fprintf (dump_file, " of unexplained ");
    4843                 :           0 :           unexp.dump (dump_file);
    4844                 :           0 :           fprintf (dump_file, " counts because of self-recursive "
    4845                 :             :                    "calls\n");
    4846                 :             :         }
    4847                 :           0 :       new_sum += new_part;
    4848                 :           0 :       remainder = lenient_count_portion_handling (orig_node_count - new_sum,
    4849                 :             :                                                   orig_node);
    4850                 :             :     }
    4851                 :             :   else
    4852                 :           5 :     remainder = lenient_count_portion_handling (orig_node_count - new_sum,
    4853                 :             :                                                 orig_node);
    4854                 :             : 
    4855                 :           5 :   new_sum = orig_node_count.combine_with_ipa_count (new_sum);
    4856                 :           5 :   new_node->count = new_sum;
    4857                 :           5 :   orig_node->count = remainder;
    4858                 :             : 
    4859                 :           5 :   profile_count orig_new_node_count = orig_node_count;
    4860                 :           5 :   profile_count::adjust_for_ipa_scaling (&new_sum, &orig_new_node_count);
    4861                 :           9 :   for (cgraph_edge *cs = new_node->callees; cs; cs = cs->next_callee)
    4862                 :           4 :     cs->count = cs->count.apply_scale (new_sum, orig_new_node_count);
    4863                 :           5 :   for (cgraph_edge *cs = new_node->indirect_calls; cs; cs = cs->next_callee)
    4864                 :           0 :     cs->count = cs->count.apply_scale (new_sum, orig_new_node_count);
    4865                 :             : 
    4866                 :           5 :   if (!orig_edges_processed)
    4867                 :             :     {
    4868                 :           5 :       profile_count::adjust_for_ipa_scaling (&remainder, &orig_node_count);
    4869                 :          11 :       for (cgraph_edge *cs = orig_node->callees; cs; cs = cs->next_callee)
    4870                 :           6 :         cs->count = cs->count.apply_scale (remainder, orig_node_count);
    4871                 :           5 :       for (cgraph_edge *cs = orig_node->indirect_calls;
    4872                 :           7 :            cs;
    4873                 :           2 :            cs = cs->next_callee)
    4874                 :           2 :         cs->count = cs->count.apply_scale (remainder, orig_node_count);
    4875                 :             :     }
    4876                 :             : 
    4877                 :           5 :   if (dump_file)
    4878                 :             :     {
    4879                 :           0 :       dump_profile_updates (new_node, true);
    4880                 :           0 :       dump_profile_updates (orig_node, false);
    4881                 :             :     }
    4882                 :             : }
    4883                 :             : 
    4884                 :             : /* Update the respective profile of specialized NEW_NODE and the original
    4885                 :             :    ORIG_NODE after additional edges with cumulative count sum REDIRECTED_SUM
    4886                 :             :    have been redirected to the specialized version.  */
    4887                 :             : 
    4888                 :             : static void
    4889                 :           0 : update_specialized_profile (struct cgraph_node *new_node,
    4890                 :             :                             struct cgraph_node *orig_node,
    4891                 :             :                             profile_count redirected_sum)
    4892                 :             : {
    4893                 :           0 :   struct cgraph_edge *cs;
    4894                 :           0 :   profile_count new_node_count, orig_node_count = orig_node->count.ipa ();
    4895                 :             : 
    4896                 :           0 :   if (dump_file)
    4897                 :             :     {
    4898                 :           0 :       fprintf (dump_file, "    the sum of counts of redirected  edges is ");
    4899                 :           0 :       redirected_sum.dump (dump_file);
    4900                 :           0 :       fprintf (dump_file, "\n    old ipa count of the original node is ");
    4901                 :           0 :       orig_node_count.dump (dump_file);
    4902                 :           0 :       fprintf (dump_file, "\n");
    4903                 :             :     }
    4904                 :           0 :   if (!(orig_node_count > profile_count::zero ()))
    4905                 :           0 :     return;
    4906                 :             : 
    4907                 :           0 :   new_node_count = new_node->count;
    4908                 :           0 :   new_node->count += redirected_sum;
    4909                 :           0 :   orig_node->count
    4910                 :           0 :     = lenient_count_portion_handling (orig_node->count - redirected_sum,
    4911                 :             :                                       orig_node);
    4912                 :             : 
    4913                 :           0 :   for (cs = new_node->callees; cs; cs = cs->next_callee)
    4914                 :           0 :     cs->count += cs->count.apply_scale (redirected_sum, new_node_count);
    4915                 :             : 
    4916                 :           0 :   for (cs = orig_node->callees; cs; cs = cs->next_callee)
    4917                 :             :     {
    4918                 :           0 :       profile_count dec = cs->count.apply_scale (redirected_sum,
    4919                 :             :                                                  orig_node_count);
    4920                 :           0 :       cs->count -= dec;
    4921                 :             :     }
    4922                 :             : 
    4923                 :           0 :   if (dump_file)
    4924                 :             :     {
    4925                 :           0 :       dump_profile_updates (new_node, true);
    4926                 :           0 :       dump_profile_updates (orig_node, false);
    4927                 :             :     }
    4928                 :             : }
    4929                 :             : 
    4930                 :             : static void adjust_references_in_caller (cgraph_edge *cs,
    4931                 :             :                                          symtab_node *symbol, int index);
    4932                 :             : 
    4933                 :             : /* Simple structure to pass a symbol and index (with same meaning as parameters
    4934                 :             :    of adjust_references_in_caller) through a void* parameter of a
    4935                 :             :    call_for_symbol_thunks_and_aliases callback. */
    4936                 :             : struct symbol_and_index_together
    4937                 :             : {
    4938                 :             :   symtab_node *symbol;
    4939                 :             :   int index;
    4940                 :             : };
    4941                 :             : 
    4942                 :             : /* Worker callback of call_for_symbol_thunks_and_aliases to recursively call
    4943                 :             :    adjust_references_in_caller on edges up in the call-graph, if necessary. */
    4944                 :             : static bool
    4945                 :           8 : adjust_refs_in_act_callers (struct cgraph_node *node, void *data)
    4946                 :             : {
    4947                 :           8 :   symbol_and_index_together *pack = (symbol_and_index_together *) data;
    4948                 :          38 :   for (cgraph_edge *cs = node->callers; cs; cs = cs->next_caller)
    4949                 :          30 :     if (!cs->caller->thunk)
    4950                 :          30 :       adjust_references_in_caller (cs, pack->symbol, pack->index);
    4951                 :           8 :   return false;
    4952                 :             : }
    4953                 :             : 
    4954                 :             : /* At INDEX of a function being called by CS there is an ADDR_EXPR of a
    4955                 :             :    variable which is only dereferenced and which is represented by SYMBOL.  See
    4956                 :             :    if we can remove ADDR reference in callers assosiated witht the call. */
    4957                 :             : 
    4958                 :             : static void
    4959                 :         343 : adjust_references_in_caller (cgraph_edge *cs, symtab_node *symbol, int index)
    4960                 :             : {
    4961                 :         343 :   ipa_edge_args *args = ipa_edge_args_sum->get (cs);
    4962                 :         343 :   ipa_jump_func *jfunc = ipa_get_ith_jump_func (args, index);
    4963                 :         343 :   if (jfunc->type == IPA_JF_CONST)
    4964                 :             :     {
    4965                 :         327 :       ipa_ref *to_del = cs->caller->find_reference (symbol, cs->call_stmt,
    4966                 :             :                                                     cs->lto_stmt_uid,
    4967                 :             :                                                     IPA_REF_ADDR);
    4968                 :         327 :       if (!to_del)
    4969                 :         335 :         return;
    4970                 :         327 :       to_del->remove_reference ();
    4971                 :         327 :       ipa_zap_jf_refdesc (jfunc);
    4972                 :         327 :       if (dump_file)
    4973                 :          16 :         fprintf (dump_file, "    Removed a reference from %s to %s.\n",
    4974                 :           8 :                  cs->caller->dump_name (), symbol->dump_name ());
    4975                 :         327 :       return;
    4976                 :             :     }
    4977                 :             : 
    4978                 :          16 :   if (jfunc->type != IPA_JF_PASS_THROUGH
    4979                 :          16 :       || ipa_get_jf_pass_through_operation (jfunc) != NOP_EXPR
    4980                 :          32 :       || ipa_get_jf_pass_through_refdesc_decremented (jfunc))
    4981                 :             :     return;
    4982                 :             : 
    4983                 :          16 :   int fidx = ipa_get_jf_pass_through_formal_id (jfunc);
    4984                 :          16 :   cgraph_node *caller = cs->caller;
    4985                 :          16 :   ipa_node_params *caller_info = ipa_node_params_sum->get (caller);
    4986                 :             :   /* TODO: This consistency check may be too big and not really
    4987                 :             :      that useful.  Consider removing it.  */
    4988                 :          16 :   tree cst;
    4989                 :          16 :   if (caller_info->ipcp_orig_node)
    4990                 :          15 :     cst = caller_info->known_csts[fidx];
    4991                 :             :   else
    4992                 :             :     {
    4993                 :           1 :       ipcp_lattice<tree> *lat = ipa_get_scalar_lat (caller_info, fidx);
    4994                 :           1 :       gcc_assert (lat->is_single_const ());
    4995                 :           1 :       cst = lat->values->value;
    4996                 :             :     }
    4997                 :          16 :   gcc_assert (TREE_CODE (cst) == ADDR_EXPR
    4998                 :             :               && (symtab_node::get (get_base_address (TREE_OPERAND (cst, 0)))
    4999                 :             :                   == symbol));
    5000                 :             : 
    5001                 :          16 :   int cuses = ipa_get_controlled_uses (caller_info, fidx);
    5002                 :          16 :   if (cuses == IPA_UNDESCRIBED_USE)
    5003                 :             :     return;
    5004                 :          16 :   gcc_assert (cuses > 0);
    5005                 :          16 :   cuses--;
    5006                 :          16 :   ipa_set_controlled_uses (caller_info, fidx, cuses);
    5007                 :          16 :   ipa_set_jf_pass_through_refdesc_decremented (jfunc, true);
    5008                 :          16 :   if (dump_file && (dump_flags & TDF_DETAILS))
    5009                 :           3 :     fprintf (dump_file, "    Controlled uses of parameter %i of %s dropped "
    5010                 :             :              "to %i.\n", fidx, caller->dump_name (), cuses);
    5011                 :          16 :   if (cuses)
    5012                 :             :     return;
    5013                 :             : 
    5014                 :           8 :   if (caller_info->ipcp_orig_node)
    5015                 :             :     {
    5016                 :             :       /* Cloning machinery has created a reference here, we need to either
    5017                 :             :          remove it or change it to a read one.  */
    5018                 :           7 :       ipa_ref *to_del = caller->find_reference (symbol, NULL, 0, IPA_REF_ADDR);
    5019                 :           7 :       if (to_del)
    5020                 :             :         {
    5021                 :           7 :           to_del->remove_reference ();
    5022                 :           7 :           if (dump_file)
    5023                 :           6 :             fprintf (dump_file, "    Removed a reference from %s to %s.\n",
    5024                 :           3 :                      cs->caller->dump_name (), symbol->dump_name ());
    5025                 :           7 :           if (ipa_get_param_load_dereferenced (caller_info, fidx))
    5026                 :             :             {
    5027                 :           5 :               caller->create_reference (symbol, IPA_REF_LOAD, NULL);
    5028                 :           5 :               if (dump_file)
    5029                 :           2 :                 fprintf (dump_file,
    5030                 :             :                          "      ...and replaced it with LOAD one.\n");
    5031                 :             :             }
    5032                 :             :         }
    5033                 :             :     }
    5034                 :             : 
    5035                 :           8 :   symbol_and_index_together pack;
    5036                 :           8 :   pack.symbol = symbol;
    5037                 :           8 :   pack.index = fidx;
    5038                 :           8 :   if (caller->can_change_signature)
    5039                 :           8 :     caller->call_for_symbol_thunks_and_aliases (adjust_refs_in_act_callers,
    5040                 :             :                                                 &pack, true);
    5041                 :             : }
    5042                 :             : 
    5043                 :             : 
    5044                 :             : /* Return true if we would like to remove a parameter from NODE when cloning it
    5045                 :             :    with KNOWN_CSTS scalar constants.  */
    5046                 :             : 
    5047                 :             : static bool
    5048                 :       16210 : want_remove_some_param_p (cgraph_node *node, vec<tree> known_csts)
    5049                 :             : {
    5050                 :       16210 :   auto_vec<bool, 16> surviving;
    5051                 :       16210 :   bool filled_vec = false;
    5052                 :       16210 :   ipa_node_params *info = ipa_node_params_sum->get (node);
    5053                 :       16210 :   int i, count = ipa_get_param_count (info);
    5054                 :             : 
    5055                 :       32434 :   for (i = 0; i < count; i++)
    5056                 :             :     {
    5057                 :       28424 :       if (!known_csts[i] && ipa_is_param_used (info, i))
    5058                 :       16224 :        continue;
    5059                 :             : 
    5060                 :       12200 :       if (!filled_vec)
    5061                 :             :        {
    5062                 :       12200 :          clone_info *info = clone_info::get (node);
    5063                 :       12200 :          if (!info || !info->param_adjustments)
    5064                 :             :            return true;
    5065                 :           0 :          info->param_adjustments->get_surviving_params (&surviving);
    5066                 :           0 :          filled_vec = true;
    5067                 :             :        }
    5068                 :           0 :       if (surviving.length() < (unsigned) i &&  surviving[i])
    5069                 :             :        return true;
    5070                 :             :     }
    5071                 :             :   return false;
    5072                 :       16210 : }
    5073                 :             : 
    5074                 :             : /* Create a specialized version of NODE with known constants in KNOWN_CSTS,
    5075                 :             :    known contexts in KNOWN_CONTEXTS and known aggregate values in AGGVALS and
    5076                 :             :    redirect all edges in CALLERS to it.  */
    5077                 :             : 
    5078                 :             : static struct cgraph_node *
    5079                 :       17348 : create_specialized_node (struct cgraph_node *node,
    5080                 :             :                          vec<tree> known_csts,
    5081                 :             :                          vec<ipa_polymorphic_call_context> known_contexts,
    5082                 :             :                          vec<ipa_argagg_value, va_gc> *aggvals,
    5083                 :             :                          vec<cgraph_edge *> &callers)
    5084                 :             : {
    5085                 :       17348 :   ipa_node_params *new_info, *info = ipa_node_params_sum->get (node);
    5086                 :       17348 :   vec<ipa_replace_map *, va_gc> *replace_trees = NULL;
    5087                 :       17348 :   vec<ipa_adjusted_param, va_gc> *new_params = NULL;
    5088                 :       17348 :   struct cgraph_node *new_node;
    5089                 :       17348 :   int i, count = ipa_get_param_count (info);
    5090                 :       17348 :   clone_info *cinfo = clone_info::get (node);
    5091                 :       34696 :   ipa_param_adjustments *old_adjustments = cinfo
    5092                 :       17348 :                                            ? cinfo->param_adjustments : NULL;
    5093                 :       17348 :   ipa_param_adjustments *new_adjustments;
    5094                 :       17348 :   gcc_assert (!info->ipcp_orig_node);
    5095                 :       17348 :   gcc_assert (node->can_change_signature
    5096                 :             :               || !old_adjustments);
    5097                 :             : 
    5098                 :       16210 :   if (old_adjustments)
    5099                 :             :     {
    5100                 :             :       /* At the moment all IPA optimizations should use the number of
    5101                 :             :          parameters of the prevailing decl as the m_always_copy_start.
    5102                 :             :          Handling any other value would complicate the code below, so for the
    5103                 :             :          time bing let's only assert it is so.  */
    5104                 :           0 :       gcc_assert (old_adjustments->m_always_copy_start == count
    5105                 :             :                   || old_adjustments->m_always_copy_start < 0);
    5106                 :           0 :       int old_adj_count = vec_safe_length (old_adjustments->m_adj_params);
    5107                 :           0 :       for (i = 0; i < old_adj_count; i++)
    5108                 :             :         {
    5109                 :           0 :           ipa_adjusted_param *old_adj = &(*old_adjustments->m_adj_params)[i];
    5110                 :           0 :           if (!node->can_change_signature
    5111                 :           0 :               || old_adj->op != IPA_PARAM_OP_COPY
    5112                 :           0 :               || (!known_csts[old_adj->base_index]
    5113                 :           0 :                   && ipa_is_param_used (info, old_adj->base_index)))
    5114                 :             :             {
    5115                 :           0 :               ipa_adjusted_param new_adj = *old_adj;
    5116                 :             : 
    5117                 :           0 :               new_adj.prev_clone_adjustment = true;
    5118                 :           0 :               new_adj.prev_clone_index = i;
    5119                 :           0 :               vec_safe_push (new_params, new_adj);
    5120                 :             :             }
    5121                 :             :         }
    5122                 :           0 :       bool skip_return = old_adjustments->m_skip_return;
    5123                 :           0 :       new_adjustments = (new (ggc_alloc <ipa_param_adjustments> ())
    5124                 :             :                          ipa_param_adjustments (new_params, count,
    5125                 :           0 :                                                 skip_return));
    5126                 :             :     }
    5127                 :       17348 :   else if (node->can_change_signature
    5128                 :       17348 :            && want_remove_some_param_p (node, known_csts))
    5129                 :             :     {
    5130                 :       12200 :       ipa_adjusted_param adj;
    5131                 :       12200 :       memset (&adj, 0, sizeof (adj));
    5132                 :       12200 :       adj.op = IPA_PARAM_OP_COPY;
    5133                 :       46948 :       for (i = 0; i < count; i++)
    5134                 :       34748 :         if (!known_csts[i] && ipa_is_param_used (info, i))
    5135                 :             :           {
    5136                 :       12600 :             adj.base_index = i;
    5137                 :       12600 :             adj.prev_clone_index = i;
    5138                 :       12600 :             vec_safe_push (new_params, adj);
    5139                 :             :           }
    5140                 :       12200 :       new_adjustments = (new (ggc_alloc <ipa_param_adjustments> ())
    5141                 :       12200 :                          ipa_param_adjustments (new_params, count, false));
    5142                 :             :     }
    5143                 :             :   else
    5144                 :             :     new_adjustments = NULL;
    5145                 :             : 
    5146                 :       17348 :   auto_vec<cgraph_edge *, 2> self_recursive_calls;
    5147                 :       84089 :   for (i = callers.length () - 1; i >= 0; i--)
    5148                 :             :     {
    5149                 :       49393 :       cgraph_edge *cs = callers[i];
    5150                 :       49393 :       if (cs->caller == node)
    5151                 :             :         {
    5152                 :         193 :           self_recursive_calls.safe_push (cs);
    5153                 :         193 :           callers.unordered_remove (i);
    5154                 :             :         }
    5155                 :             :     }
    5156                 :       17348 :   replace_trees = cinfo ? vec_safe_copy (cinfo->tree_map) : NULL;
    5157                 :       65320 :   for (i = 0; i < count; i++)
    5158                 :             :     {
    5159                 :       47972 :       tree t = known_csts[i];
    5160                 :       47972 :       if (!t)
    5161                 :       29956 :         continue;
    5162                 :             : 
    5163                 :       18016 :       gcc_checking_assert (TREE_CODE (t) != TREE_BINFO);
    5164                 :             : 
    5165                 :       18016 :       bool load_ref = false;
    5166                 :       18016 :       symtab_node *ref_symbol;
    5167                 :       18016 :       if (TREE_CODE (t) == ADDR_EXPR)
    5168                 :             :         {
    5169                 :        5474 :           tree base = get_base_address (TREE_OPERAND (t, 0));
    5170                 :        5474 :           if (TREE_CODE (base) == VAR_DECL
    5171                 :        2469 :               && ipa_get_controlled_uses (info, i) == 0
    5172                 :         685 :               && ipa_get_param_load_dereferenced (info, i)
    5173                 :        5774 :               && (ref_symbol = symtab_node::get (base)))
    5174                 :             :             {
    5175                 :         300 :               load_ref = true;
    5176                 :         300 :               if (node->can_change_signature)
    5177                 :        1177 :                 for (cgraph_edge *caller : callers)
    5178                 :         313 :                   adjust_references_in_caller (caller, ref_symbol, i);
    5179                 :             :             }
    5180                 :             :         }
    5181                 :             : 
    5182                 :       18016 :       ipa_replace_map *replace_map = get_replacement_map (info, t, i, load_ref);
    5183                 :       18016 :       if (replace_map)
    5184                 :       18016 :         vec_safe_push (replace_trees, replace_map);
    5185                 :             :     }
    5186                 :             : 
    5187                 :       52044 :   unsigned &suffix_counter = clone_num_suffixes->get_or_insert (
    5188                 :       17348 :                                IDENTIFIER_POINTER (DECL_ASSEMBLER_NAME (
    5189                 :             :                                  node->decl)));
    5190                 :       17348 :   new_node = node->create_virtual_clone (callers, replace_trees,
    5191                 :             :                                          new_adjustments, "constprop",
    5192                 :             :                                          suffix_counter);
    5193                 :       17348 :   suffix_counter++;
    5194                 :             : 
    5195                 :       17348 :   bool have_self_recursive_calls = !self_recursive_calls.is_empty ();
    5196                 :       17541 :   for (unsigned j = 0; j < self_recursive_calls.length (); j++)
    5197                 :             :     {
    5198                 :         193 :       cgraph_edge *cs = get_next_cgraph_edge_clone (self_recursive_calls[j]);
    5199                 :             :       /* Cloned edges can disappear during cloning as speculation can be
    5200                 :             :          resolved, check that we have one and that it comes from the last
    5201                 :             :          cloning.  */
    5202                 :         193 :       if (cs && cs->caller == new_node)
    5203                 :         192 :         cs->redirect_callee_duplicating_thunks (new_node);
    5204                 :             :       /* Any future code that would make more than one clone of an outgoing
    5205                 :             :          edge would confuse this mechanism, so let's check that does not
    5206                 :             :          happen.  */
    5207                 :         192 :       gcc_checking_assert (!cs
    5208                 :             :                            || !get_next_cgraph_edge_clone (cs)
    5209                 :             :                            || get_next_cgraph_edge_clone (cs)->caller != new_node);
    5210                 :             :     }
    5211                 :       17348 :   if (have_self_recursive_calls)
    5212                 :         105 :     new_node->expand_all_artificial_thunks ();
    5213                 :             : 
    5214                 :       17348 :   ipa_set_node_agg_value_chain (new_node, aggvals);
    5215                 :       40738 :   for (const ipa_argagg_value &av : aggvals)
    5216                 :       23390 :     new_node->maybe_create_reference (av.value, NULL);
    5217                 :             : 
    5218                 :       17348 :   if (dump_file && (dump_flags & TDF_DETAILS))
    5219                 :             :     {
    5220                 :          86 :       fprintf (dump_file, "     the new node is %s.\n", new_node->dump_name ());
    5221                 :          86 :       if (known_contexts.exists ())
    5222                 :             :         {
    5223                 :           0 :           for (i = 0; i < count; i++)
    5224                 :           0 :             if (!known_contexts[i].useless_p ())
    5225                 :             :               {
    5226                 :           0 :                 fprintf (dump_file, "     known ctx %i is ", i);
    5227                 :           0 :                 known_contexts[i].dump (dump_file);
    5228                 :             :               }
    5229                 :             :         }
    5230                 :          86 :       if (aggvals)
    5231                 :             :         {
    5232                 :          45 :           fprintf (dump_file, "     Aggregate replacements:");
    5233                 :          45 :           ipa_argagg_value_list avs (aggvals);
    5234                 :          45 :           avs.dump (dump_file);
    5235                 :             :         }
    5236                 :             :     }
    5237                 :             : 
    5238                 :       17348 :   new_info = ipa_node_params_sum->get (new_node);
    5239                 :       17348 :   new_info->ipcp_orig_node = node;
    5240                 :       17348 :   new_node->ipcp_clone = true;
    5241                 :       17348 :   new_info->known_csts = known_csts;
    5242                 :       17348 :   new_info->known_contexts = known_contexts;
    5243                 :             : 
    5244                 :       17348 :   ipcp_discover_new_direct_edges (new_node, known_csts, known_contexts,
    5245                 :             :                                   aggvals);
    5246                 :             : 
    5247                 :       17348 :   return new_node;
    5248                 :       17348 : }
    5249                 :             : 
    5250                 :             : /* Return true if JFUNC, which describes a i-th parameter of call CS, is a
    5251                 :             :    pass-through function to itself when the cgraph_node involved is not an
    5252                 :             :    IPA-CP clone.  When SIMPLE is true, further check if JFUNC is a simple
    5253                 :             :    no-operation pass-through.  */
    5254                 :             : 
    5255                 :             : static bool
    5256                 :       31569 : self_recursive_pass_through_p (cgraph_edge *cs, ipa_jump_func *jfunc, int i,
    5257                 :             :                                bool simple = true)
    5258                 :             : {
    5259                 :       31569 :   enum availability availability;
    5260                 :       31569 :   if (cs->caller == cs->callee->function_symbol (&availability)
    5261                 :         115 :       && availability > AVAIL_INTERPOSABLE
    5262                 :         115 :       && jfunc->type == IPA_JF_PASS_THROUGH
    5263                 :          51 :       && (!simple || ipa_get_jf_pass_through_operation (jfunc) == NOP_EXPR)
    5264                 :          51 :       && ipa_get_jf_pass_through_formal_id (jfunc) == i
    5265                 :          51 :       && ipa_node_params_sum->get (cs->caller)
    5266                 :       31620 :       && !ipa_node_params_sum->get (cs->caller)->ipcp_orig_node)
    5267                 :          47 :     return true;
    5268                 :             :   return false;
    5269                 :             : }
    5270                 :             : 
    5271                 :             : /* Return true if JFUNC, which describes a part of an aggregate represented or
    5272                 :             :    pointed to by the i-th parameter of call CS, is a pass-through function to
    5273                 :             :    itself when the cgraph_node involved is not an IPA-CP clone..  When
    5274                 :             :    SIMPLE is true, further check if JFUNC is a simple no-operation
    5275                 :             :    pass-through.  */
    5276                 :             : 
    5277                 :             : static bool
    5278                 :       17783 : self_recursive_agg_pass_through_p (const cgraph_edge *cs,
    5279                 :             :                                    const ipa_agg_jf_item *jfunc,
    5280                 :             :                                    int i, bool simple = true)
    5281                 :             : {
    5282                 :       17783 :   enum availability availability;
    5283                 :       17783 :   if (cs->caller == cs->callee->function_symbol (&availability)
    5284                 :          69 :       && availability > AVAIL_INTERPOSABLE
    5285                 :          69 :       && jfunc->jftype == IPA_JF_LOAD_AGG
    5286                 :           1 :       && jfunc->offset == jfunc->value.load_agg.offset
    5287                 :           1 :       && (!simple || jfunc->value.pass_through.operation == NOP_EXPR)
    5288                 :           1 :       && jfunc->value.pass_through.formal_id == i
    5289                 :           1 :       && useless_type_conversion_p (jfunc->value.load_agg.type, jfunc->type)
    5290                 :           1 :       && ipa_node_params_sum->get (cs->caller)
    5291                 :       17784 :       && !ipa_node_params_sum->get (cs->caller)->ipcp_orig_node)
    5292                 :             :     return true;
    5293                 :             :   return false;
    5294                 :             : }
    5295                 :             : 
    5296                 :             : /* Given a NODE, and a subset of its CALLERS, try to populate blanks slots in
    5297                 :             :    KNOWN_CSTS with constants that are also known for all of the CALLERS.  */
    5298                 :             : 
    5299                 :             : static void
    5300                 :       17348 : find_more_scalar_values_for_callers_subset (struct cgraph_node *node,
    5301                 :             :                                             vec<tree> &known_csts,
    5302                 :             :                                             const vec<cgraph_edge *> &callers)
    5303                 :             : {
    5304                 :       17348 :   ipa_node_params *info = ipa_node_params_sum->get (node);
    5305                 :       17348 :   int i, count = ipa_get_param_count (info);
    5306                 :             : 
    5307                 :       65320 :   for (i = 0; i < count; i++)
    5308                 :             :     {
    5309                 :       47972 :       struct cgraph_edge *cs;
    5310                 :       47972 :       tree newval = NULL_TREE;
    5311                 :       47972 :       int j;
    5312                 :       47972 :       bool first = true;
    5313                 :       47972 :       tree type = ipa_get_type (info, i);
    5314                 :             : 
    5315                 :       47972 :       if (ipa_get_scalar_lat (info, i)->bottom || known_csts[i])
    5316                 :       21784 :         continue;
    5317                 :             : 
    5318                 :       32010 :       FOR_EACH_VEC_ELT (callers, j, cs)
    5319                 :             :         {
    5320                 :       31591 :           struct ipa_jump_func *jump_func;
    5321                 :       31591 :           tree t;
    5322                 :             : 
    5323                 :       31591 :           ipa_edge_args *args = ipa_edge_args_sum->get (cs);
    5324                 :       31591 :           if (!args
    5325                 :       31591 :               || i >= ipa_get_cs_argument_count (args)
    5326                 :       63173 :               || (i == 0
    5327                 :       11108 :                   && call_passes_through_thunk (cs)))
    5328                 :             :             {
    5329                 :             :               newval = NULL_TREE;
    5330                 :             :               break;
    5331                 :             :             }
    5332                 :       31548 :           jump_func = ipa_get_ith_jump_func (args, i);
    5333                 :             : 
    5334                 :             :           /* Besides simple pass-through jump function, arithmetic jump
    5335                 :             :              function could also introduce argument-direct-pass-through for
    5336                 :             :              self-feeding recursive call.  For example,
    5337                 :             : 
    5338                 :             :                 fn (int i)
    5339                 :             :                 {
    5340                 :             :                   fn (i & 1);
    5341                 :             :                 }
    5342                 :             : 
    5343                 :             :              Given that i is 0, recursive propagation via (i & 1) also gets
    5344                 :             :              0.  */
    5345                 :       31548 :           if (self_recursive_pass_through_p (cs, jump_func, i, false))
    5346                 :             :             {
    5347                 :          29 :               gcc_assert (newval);
    5348                 :          29 :               t = ipa_get_jf_arith_result (
    5349                 :             :                                 ipa_get_jf_pass_through_operation (jump_func),
    5350                 :             :                                 newval,
    5351                 :             :                                 ipa_get_jf_pass_through_operand (jump_func),
    5352                 :             :                                 type);
    5353                 :             :             }
    5354                 :             :           else
    5355                 :       31519 :             t = ipa_value_from_jfunc (ipa_node_params_sum->get (cs->caller),
    5356                 :             :                                       jump_func, type);
    5357                 :       31548 :           if (!t
    5358                 :        7561 :               || (newval
    5359                 :        5122 :                   && !values_equal_for_ipcp_p (t, newval))
    5360                 :       37370 :               || (!first && !newval))
    5361                 :             :             {
    5362                 :             :               newval = NULL_TREE;
    5363                 :             :               break;
    5364                 :             :             }
    5365                 :             :           else
    5366                 :        5822 :             newval = t;
    5367                 :        5822 :           first = false;
    5368                 :             :         }
    5369                 :             : 
    5370                 :       26188 :       if (newval)
    5371                 :             :         {
    5372                 :         419 :           if (dump_file && (dump_flags & TDF_DETAILS))
    5373                 :             :             {
    5374                 :           1 :               fprintf (dump_file, "    adding an extra known scalar value ");
    5375                 :           1 :               print_ipcp_constant_value (dump_file, newval);
    5376                 :           1 :               fprintf (dump_file, " for ");
    5377                 :           1 :               ipa_dump_param (dump_file, info, i);
    5378                 :           1 :               fprintf (dump_file, "\n");
    5379                 :             :             }
    5380                 :             : 
    5381                 :         419 :           known_csts[i] = newval;
    5382                 :             :         }
    5383                 :             :     }
    5384                 :       17348 : }
    5385                 :             : 
    5386                 :             : /* Given a NODE and a subset of its CALLERS, try to populate plank slots in
    5387                 :             :    KNOWN_CONTEXTS with polymorphic contexts that are also known for all of the
    5388                 :             :    CALLERS.  */
    5389                 :             : 
    5390                 :             : static void
    5391                 :       17348 : find_more_contexts_for_caller_subset (cgraph_node *node,
    5392                 :             :                                       vec<ipa_polymorphic_call_context>
    5393                 :             :                                       *known_contexts,
    5394                 :             :                                       const vec<cgraph_edge *> &callers)
    5395                 :             : {
    5396                 :       17348 :   ipa_node_params *info = ipa_node_params_sum->get (node);
    5397                 :       17348 :   int i, count = ipa_get_param_count (info);
    5398                 :             : 
    5399                 :       65311 :   for (i = 0; i < count; i++)
    5400                 :             :     {
    5401                 :       47972 :       cgraph_edge *cs;
    5402                 :             : 
    5403                 :       47972 :       if (ipa_get_poly_ctx_lat (info, i)->bottom
    5404                 :       47972 :           || (known_contexts->exists ()
    5405                 :        1096 :               && !(*known_contexts)[i].useless_p ()))
    5406                 :        4416 :         continue;
    5407                 :             : 
    5408                 :       43556 :       ipa_polymorphic_call_context newval;
    5409                 :       43556 :       bool first = true;
    5410                 :       43556 :       int j;
    5411                 :             : 
    5412                 :       43734 :       FOR_EACH_VEC_ELT (callers, j, cs)
    5413                 :             :         {
    5414                 :       43626 :           ipa_edge_args *args = ipa_edge_args_sum->get (cs);
    5415                 :       43626 :           if (!args
    5416                 :       87252 :               || i >= ipa_get_cs_argument_count (args))
    5417                 :           9 :             return;
    5418                 :       43617 :           ipa_jump_func *jfunc = ipa_get_ith_jump_func (args, i);
    5419                 :       43617 :           ipa_polymorphic_call_context ctx;
    5420                 :       43617 :           ctx = ipa_context_from_jfunc (ipa_node_params_sum->get (cs->caller),
    5421                 :             :                                         cs, i, jfunc);
    5422                 :       43617 :           if (first)
    5423                 :             :             {
    5424                 :       43547 :               newval = ctx;
    5425                 :       43547 :               first = false;
    5426                 :             :             }
    5427                 :             :           else
    5428                 :          70 :             newval.meet_with (ctx);
    5429                 :       87124 :           if (newval.useless_p ())
    5430                 :             :             break;
    5431                 :             :         }
    5432                 :             : 
    5433                 :       87094 :       if (!newval.useless_p ())
    5434                 :             :         {
    5435                 :         108 :           if (dump_file && (dump_flags & TDF_DETAILS))
    5436                 :             :             {
    5437                 :           0 :               fprintf (dump_file, "    adding an extra known polymorphic "
    5438                 :             :                        "context ");
    5439                 :           0 :               print_ipcp_constant_value (dump_file, newval);
    5440                 :           0 :               fprintf (dump_file, " for ");
    5441                 :           0 :               ipa_dump_param (dump_file, info, i);
    5442                 :           0 :               fprintf (dump_file, "\n");
    5443                 :             :             }
    5444                 :             : 
    5445                 :         108 :           if (!known_contexts->exists ())
    5446                 :         186 :             known_contexts->safe_grow_cleared (ipa_get_param_count (info),
    5447                 :             :                                                true);
    5448                 :         108 :           (*known_contexts)[i] = newval;
    5449                 :             :         }
    5450                 :             : 
    5451                 :             :     }
    5452                 :             : }
    5453                 :             : 
    5454                 :             : /* Push all aggregate values coming along edge CS for parameter number INDEX to
    5455                 :             :    RES.  If INTERIM is non-NULL, it contains the current interim state of
    5456                 :             :    collected aggregate values which can be used to compute values passed over
    5457                 :             :    self-recursive edges.
    5458                 :             : 
    5459                 :             :    This basically one iteration of push_agg_values_from_edge over one
    5460                 :             :    parameter, which allows for simpler early returns.  */
    5461                 :             : 
    5462                 :             : static void
    5463                 :       42980 : push_agg_values_for_index_from_edge (struct cgraph_edge *cs, int index,
    5464                 :             :                                      vec<ipa_argagg_value> *res,
    5465                 :             :                                      const ipa_argagg_value_list *interim)
    5466                 :             : {
    5467                 :       42980 :   bool agg_values_from_caller = false;
    5468                 :       42980 :   bool agg_jf_preserved = false;
    5469                 :       42980 :   unsigned unit_delta = UINT_MAX;
    5470                 :       42980 :   int src_idx = -1;
    5471                 :       42980 :   ipa_jump_func *jfunc = ipa_get_ith_jump_func (ipa_edge_args_sum->get (cs),
    5472                 :             :                                                 index);
    5473                 :             : 
    5474                 :       42980 :   if (jfunc->type == IPA_JF_PASS_THROUGH
    5475                 :       42980 :       && ipa_get_jf_pass_through_operation (jfunc) == NOP_EXPR)
    5476                 :             :     {
    5477                 :        4088 :       agg_values_from_caller = true;
    5478                 :        4088 :       agg_jf_preserved = ipa_get_jf_pass_through_agg_preserved (jfunc);
    5479                 :        4088 :       src_idx = ipa_get_jf_pass_through_formal_id (jfunc);
    5480                 :        4088 :       unit_delta = 0;
    5481                 :             :     }
    5482                 :       38892 :   else if (jfunc->type == IPA_JF_ANCESTOR
    5483                 :       38892 :            && ipa_get_jf_ancestor_agg_preserved (jfunc))
    5484                 :             :     {
    5485                 :          34 :       agg_values_from_caller = true;
    5486                 :          34 :       agg_jf_preserved = true;
    5487                 :          34 :       src_idx = ipa_get_jf_ancestor_formal_id (jfunc);
    5488                 :          34 :       unit_delta = ipa_get_jf_ancestor_offset (jfunc) / BITS_PER_UNIT;
    5489                 :             :     }
    5490                 :             : 
    5491                 :       42980 :   ipa_node_params *caller_info = ipa_node_params_sum->get (cs->caller);
    5492                 :       42980 :   if (agg_values_from_caller)
    5493                 :             :     {
    5494                 :        4122 :       if (caller_info->ipcp_orig_node)
    5495                 :             :         {
    5496                 :        2286 :           struct cgraph_node *orig_node = caller_info->ipcp_orig_node;
    5497                 :        2286 :           ipcp_transformation *ts
    5498                 :        2286 :             = ipcp_get_transformation_summary (cs->caller);
    5499                 :        2286 :           ipa_node_params *orig_info = ipa_node_params_sum->get (orig_node);
    5500                 :        2286 :           ipcp_param_lattices *orig_plats
    5501                 :        2286 :             = ipa_get_parm_lattices (orig_info, src_idx);
    5502                 :        2286 :           if (ts
    5503                 :        2286 :               && orig_plats->aggs
    5504                 :         470 :               && (agg_jf_preserved || !orig_plats->aggs_by_ref))
    5505                 :             :             {
    5506                 :         388 :               ipa_argagg_value_list src (ts);
    5507                 :         388 :               src.push_adjusted_values (src_idx, index, unit_delta, res);
    5508                 :         388 :               return;
    5509                 :             :             }
    5510                 :             :         }
    5511                 :             :       else
    5512                 :             :         {
    5513                 :        1836 :           ipcp_param_lattices *src_plats
    5514                 :        1836 :             = ipa_get_parm_lattices (caller_info, src_idx);
    5515                 :        1836 :           if (src_plats->aggs
    5516                 :          63 :               && !src_plats->aggs_bottom
    5517                 :          63 :               && (agg_jf_preserved || !src_plats->aggs_by_ref))
    5518                 :             :             {
    5519                 :          41 :               if (interim && self_recursive_pass_through_p (cs, jfunc, index))
    5520                 :             :                 {
    5521                 :          18 :                   interim->push_adjusted_values (src_idx, index, unit_delta,
    5522                 :             :                                                  res);
    5523                 :          18 :                   return;
    5524                 :             :                 }
    5525                 :          23 :               if (!src_plats->aggs_contain_variable)
    5526                 :             :                 {
    5527                 :          19 :                   push_agg_values_from_plats (src_plats, index, unit_delta,
    5528                 :             :                                               res);
    5529                 :          19 :                   return;
    5530                 :             :                 }
    5531                 :             :             }
    5532                 :             :         }
    5533                 :             :     }
    5534                 :             : 
    5535                 :       42555 :   if (!jfunc->agg.items)
    5536                 :             :     return;
    5537                 :       12029 :   bool first = true;
    5538                 :       12029 :   unsigned prev_unit_offset = 0;
    5539                 :       55695 :   for (const ipa_agg_jf_item &agg_jf : *jfunc->agg.items)
    5540                 :             :     {
    5541                 :       43666 :       tree value, srcvalue;
    5542                 :             :       /* Besides simple pass-through aggregate jump function, arithmetic
    5543                 :             :          aggregate jump function could also bring same aggregate value as
    5544                 :             :          parameter passed-in for self-feeding recursive call.  For example,
    5545                 :             : 
    5546                 :             :          fn (int *i)
    5547                 :             :          {
    5548                 :             :            int j = *i & 1;
    5549                 :             :            fn (&j);
    5550                 :             :          }
    5551                 :             : 
    5552                 :             :          Given that *i is 0, recursive propagation via (*i & 1) also gets 0.  */
    5553                 :       43666 :       if (interim
    5554                 :       17783 :           && self_recursive_agg_pass_through_p (cs, &agg_jf, index, false)
    5555                 :       43667 :           && (srcvalue = interim->get_value(index,
    5556                 :           1 :                                             agg_jf.offset / BITS_PER_UNIT)))
    5557                 :           1 :         value = ipa_get_jf_arith_result (agg_jf.value.pass_through.operation,
    5558                 :             :                                          srcvalue,
    5559                 :           1 :                                          agg_jf.value.pass_through.operand,
    5560                 :           1 :                                          agg_jf.type);
    5561                 :             :       else
    5562                 :       43665 :         value = ipa_agg_value_from_jfunc (caller_info, cs->caller,
    5563                 :             :                                           &agg_jf);
    5564                 :       43666 :       if (value)
    5565                 :             :         {
    5566                 :       42488 :           struct ipa_argagg_value iav;
    5567                 :       42488 :           iav.value = value;
    5568                 :       42488 :           iav.unit_offset = agg_jf.offset / BITS_PER_UNIT;
    5569                 :       42488 :           iav.index = index;
    5570                 :       42488 :           iav.by_ref = jfunc->agg.by_ref;
    5571                 :       42488 :           iav.killed = false;
    5572                 :             : 
    5573                 :       42488 :           gcc_assert (first
    5574                 :             :                       || iav.unit_offset > prev_unit_offset);
    5575                 :       42488 :           prev_unit_offset = iav.unit_offset;
    5576                 :       42488 :           first = false;
    5577                 :             : 
    5578                 :       42488 :           res->safe_push (iav);
    5579                 :             :         }
    5580                 :             :     }
    5581                 :             :   return;
    5582                 :             : }
    5583                 :             : 
    5584                 :             : /* Push all aggregate values coming along edge CS to RES.  DEST_INFO is the
    5585                 :             :    description of ultimate callee of CS or the one it was cloned from (the
    5586                 :             :    summary where lattices are).  If INTERIM is non-NULL, it contains the
    5587                 :             :    current interim state of collected aggregate values which can be used to
    5588                 :             :    compute values passed over self-recursive edges (if OPTIMIZE_SELF_RECURSION
    5589                 :             :    is true) and to skip values which clearly will not be part of intersection
    5590                 :             :    with INTERIM.  */
    5591                 :             : 
    5592                 :             : static void
    5593                 :       20710 : push_agg_values_from_edge (struct cgraph_edge *cs,
    5594                 :             :                            ipa_node_params *dest_info,
    5595                 :             :                            vec<ipa_argagg_value> *res,
    5596                 :             :                            const ipa_argagg_value_list *interim,
    5597                 :             :                            bool optimize_self_recursion)
    5598                 :             : {
    5599                 :       20710 :   ipa_edge_args *args = ipa_edge_args_sum->get (cs);
    5600                 :       20710 :   if (!args)
    5601                 :             :     return;
    5602                 :             : 
    5603                 :       41420 :   int count = MIN (ipa_get_param_count (dest_info),
    5604                 :             :                    ipa_get_cs_argument_count (args));
    5605                 :             : 
    5606                 :       20710 :   unsigned interim_index = 0;
    5607                 :       78757 :   for (int index = 0; index < count; index++)
    5608                 :             :     {
    5609                 :       58047 :       if (interim)
    5610                 :             :         {
    5611                 :       18787 :           while (interim_index < interim->m_elts.size ()
    5612                 :       16896 :                  && interim->m_elts[interim_index].value
    5613                 :       32986 :                  && interim->m_elts[interim_index].index < index)
    5614                 :        8703 :             interim_index++;
    5615                 :       14510 :           if (interim_index >= interim->m_elts.size ()
    5616                 :       10084 :               || interim->m_elts[interim_index].index > index)
    5617                 :        4426 :             continue;
    5618                 :             :         }
    5619                 :             : 
    5620                 :       53621 :       ipcp_param_lattices *plats = ipa_get_parm_lattices (dest_info, index);
    5621                 :       53621 :       if (!ipa_is_param_used (dest_info, index)
    5622                 :       53621 :           || plats->aggs_bottom)
    5623                 :       10641 :         continue;
    5624                 :       42992 :       push_agg_values_for_index_from_edge (cs, index, res,
    5625                 :             :                                            optimize_self_recursion ? interim
    5626                 :             :                                            : NULL);
    5627                 :             :     }
    5628                 :             : }
    5629                 :             : 
    5630                 :             : 
    5631                 :             : /* Look at edges in CALLERS and collect all known aggregate values that arrive
    5632                 :             :    from all of them.  Return nullptr if there are none.  */
    5633                 :             : 
    5634                 :             : static struct vec<ipa_argagg_value, va_gc> *
    5635                 :       17348 : find_aggregate_values_for_callers_subset (struct cgraph_node *node,
    5636                 :             :                                           const vec<cgraph_edge *> &callers)
    5637                 :             : {
    5638                 :       17348 :   ipa_node_params *dest_info = ipa_node_params_sum->get (node);
    5639                 :       17348 :   if (dest_info->ipcp_orig_node)
    5640                 :           0 :     dest_info = ipa_node_params_sum->get (dest_info->ipcp_orig_node);
    5641                 :             : 
    5642                 :             :   /* gather_edges_for_value puts a non-recursive call into the first element of
    5643                 :             :      callers if it can.  */
    5644                 :       17348 :   auto_vec<ipa_argagg_value, 32> interim;
    5645                 :       17348 :   push_agg_values_from_edge (callers[0], dest_info, &interim, NULL, true);
    5646                 :             : 
    5647                 :       29079 :   unsigned valid_entries = interim.length ();
    5648                 :       17348 :   if (!valid_entries)
    5649                 :             :     return nullptr;
    5650                 :             : 
    5651                 :        5749 :   unsigned caller_count = callers.length();
    5652                 :        8967 :   for (unsigned i = 1; i < caller_count; i++)
    5653                 :             :     {
    5654                 :        3350 :       auto_vec<ipa_argagg_value, 32> last;
    5655                 :        3350 :       ipa_argagg_value_list avs (&interim);
    5656                 :        3350 :       push_agg_values_from_edge (callers[i], dest_info, &last, &avs, true);
    5657                 :             : 
    5658                 :        3350 :       valid_entries = intersect_argaggs_with (interim, last);
    5659                 :        3350 :       if (!valid_entries)
    5660                 :         132 :         return nullptr;
    5661                 :        3350 :     }
    5662                 :             : 
    5663                 :        5617 :   vec<ipa_argagg_value, va_gc> *res = NULL;
    5664                 :        5617 :   vec_safe_reserve_exact (res, valid_entries);
    5665                 :       42014 :   for (const ipa_argagg_value &av : interim)
    5666                 :       25163 :     if (av.value)
    5667                 :       23390 :       res->quick_push(av);
    5668                 :        5617 :   gcc_checking_assert (res->length () == valid_entries);
    5669                 :             :   return res;
    5670                 :       17348 : }
    5671                 :             : 
    5672                 :             : /* Determine whether CS also brings all scalar values that the NODE is
    5673                 :             :    specialized for.  */
    5674                 :             : 
    5675                 :             : static bool
    5676                 :          38 : cgraph_edge_brings_all_scalars_for_node (struct cgraph_edge *cs,
    5677                 :             :                                          struct cgraph_node *node)
    5678                 :             : {
    5679                 :          38 :   ipa_node_params *dest_info = ipa_node_params_sum->get (node);
    5680                 :          38 :   int count = ipa_get_param_count (dest_info);
    5681                 :          38 :   class ipa_node_params *caller_info;
    5682                 :          38 :   class ipa_edge_args *args;
    5683                 :          38 :   int i;
    5684                 :             : 
    5685                 :          38 :   caller_info = ipa_node_params_sum->get (cs->caller);
    5686                 :          38 :   args = ipa_edge_args_sum->get (cs);
    5687                 :         115 :   for (i = 0; i < count; i++)
    5688                 :             :     {
    5689                 :          88 :       struct ipa_jump_func *jump_func;
    5690                 :          88 :       tree val, t;
    5691                 :             : 
    5692                 :          88 :       val = dest_info->known_csts[i];
    5693                 :          88 :       if (!val)
    5694                 :          41 :         continue;
    5695                 :             : 
    5696                 :          94 :       if (i >= ipa_get_cs_argument_count (args))
    5697                 :             :         return false;
    5698                 :          47 :       jump_func = ipa_get_ith_jump_func (args, i);
    5699                 :          47 :       t = ipa_value_from_jfunc (caller_info, jump_func,
    5700                 :             :                                 ipa_get_type (dest_info, i));
    5701                 :          47 :       if (!t || !values_equal_for_ipcp_p (val, t))
    5702                 :          11 :         return false;
    5703                 :             :     }
    5704                 :             :   return true;
    5705                 :             : }
    5706                 :             : 
    5707                 :             : /* Determine whether CS also brings all aggregate values that NODE is
    5708                 :             :    specialized for.  */
    5709                 :             : 
    5710                 :             : static bool
    5711                 :          27 : cgraph_edge_brings_all_agg_vals_for_node (struct cgraph_edge *cs,
    5712                 :             :                                           struct cgraph_node *node)
    5713                 :             : {
    5714                 :          27 :   ipcp_transformation *ts = ipcp_get_transformation_summary (node);
    5715                 :          27 :   if (!ts || vec_safe_is_empty (ts->m_agg_values))
    5716                 :             :     return true;
    5717                 :             : 
    5718                 :          12 :   const ipa_argagg_value_list existing (ts->m_agg_values);
    5719                 :          12 :   auto_vec<ipa_argagg_value, 32> edge_values;
    5720                 :          12 :   ipa_node_params *dest_info = ipa_node_params_sum->get (node);
    5721                 :          12 :   gcc_checking_assert (dest_info->ipcp_orig_node);
    5722                 :          12 :   dest_info = ipa_node_params_sum->get (dest_info->ipcp_orig_node);
    5723                 :          12 :   push_agg_values_from_edge (cs, dest_info, &edge_values, &existing, false);
    5724                 :          12 :   const ipa_argagg_value_list avl (&edge_values);
    5725                 :          12 :   return avl.superset_of_p (existing);
    5726                 :          12 : }
    5727                 :             : 
    5728                 :             : /* Given an original NODE and a VAL for which we have already created a
    5729                 :             :    specialized clone, look whether there are incoming edges that still lead
    5730                 :             :    into the old node but now also bring the requested value and also conform to
    5731                 :             :    all other criteria such that they can be redirected the special node.
    5732                 :             :    This function can therefore redirect the final edge in a SCC.  */
    5733                 :             : 
    5734                 :             : template <typename valtype>
    5735                 :             : static void
    5736                 :        1068 : perhaps_add_new_callers (cgraph_node *node, ipcp_value<valtype> *val)
    5737                 :             : {
    5738                 :             :   ipcp_value_source<valtype> *src;
    5739                 :        1068 :   profile_count redirected_sum = profile_count::zero ();
    5740                 :             : 
    5741                 :        5354 :   for (src = val->sources; src; src = src->next)
    5742                 :             :     {
    5743                 :        4286 :       struct cgraph_edge *cs = src->cs;
    5744                 :       23909 :       while (cs)
    5745                 :             :         {
    5746                 :       19623 :           if (cgraph_edge_brings_value_p (cs, src, node, val)
    5747                 :          38 :               && cgraph_edge_brings_all_scalars_for_node (cs, val->spec_node)
    5748                 :       19650 :               && cgraph_edge_brings_all_agg_vals_for_node (cs, val->spec_node))
    5749                 :             :             {
    5750                 :          20 :               if (dump_file)
    5751                 :           4 :                 fprintf (dump_file, " - adding an extra caller %s of %s\n",
    5752                 :           4 :                          cs->caller->dump_name (),
    5753                 :           4 :                          val->spec_node->dump_name ());
    5754                 :             : 
    5755                 :          20 :               cs->redirect_callee_duplicating_thunks (val->spec_node);
    5756                 :          20 :               val->spec_node->expand_all_artificial_thunks ();
    5757                 :          20 :               if (cs->count.ipa ().initialized_p ())
    5758                 :           0 :                 redirected_sum = redirected_sum + cs->count.ipa ();
    5759                 :             :             }
    5760                 :       19623 :           cs = get_next_cgraph_edge_clone (cs);
    5761                 :             :         }
    5762                 :             :     }
    5763                 :             : 
    5764                 :        1068 :   if (redirected_sum.nonzero_p ())
    5765                 :           0 :     update_specialized_profile (val->spec_node, node, redirected_sum);
    5766                 :        1068 : }
    5767                 :             : 
    5768                 :             : /* Return true if KNOWN_CONTEXTS contain at least one useful context.  */
    5769                 :             : 
    5770                 :             : static bool
    5771                 :       33590 : known_contexts_useful_p (vec<ipa_polymorphic_call_context> known_contexts)
    5772                 :             : {
    5773                 :       33590 :   ipa_polymorphic_call_context *ctx;
    5774                 :       33590 :   int i;
    5775                 :             : 
    5776                 :       80690 :   FOR_EACH_VEC_ELT (known_contexts, i, ctx)
    5777                 :       95003 :     if (!ctx->useless_p ())
    5778                 :             :       return true;
    5779                 :             :   return false;
    5780                 :             : }
    5781                 :             : 
    5782                 :             : /* Return a copy of KNOWN_CSTS if it is not empty, otherwise return vNULL.  */
    5783                 :             : 
    5784                 :             : static vec<ipa_polymorphic_call_context>
    5785                 :       17305 : copy_useful_known_contexts (const vec<ipa_polymorphic_call_context> &known_contexts)
    5786                 :             : {
    5787                 :       17305 :   if (known_contexts_useful_p (known_contexts))
    5788                 :         384 :     return known_contexts.copy ();
    5789                 :             :   else
    5790                 :       16921 :     return vNULL;
    5791                 :             : }
    5792                 :             : 
    5793                 :             : /* Copy known scalar values from AVALS into KNOWN_CSTS and modify the copy
    5794                 :             :    according to VAL and INDEX.  If non-empty, replace KNOWN_CONTEXTS with its
    5795                 :             :    copy too.  */
    5796                 :             : 
    5797                 :             : static void
    5798                 :         654 : copy_known_vectors_add_val (ipa_auto_call_arg_values *avals,
    5799                 :             :                             vec<tree> *known_csts,
    5800                 :             :                             vec<ipa_polymorphic_call_context> *known_contexts,
    5801                 :             :                             ipcp_value<tree> *val, int index)
    5802                 :             : {
    5803                 :         654 :   *known_csts = avals->m_known_vals.copy ();
    5804                 :         654 :   *known_contexts = copy_useful_known_contexts (avals->m_known_contexts);
    5805                 :         654 :   (*known_csts)[index] = val->value;
    5806                 :         654 : }
    5807                 :             : 
    5808                 :             : /* Copy known scalar values from AVALS into KNOWN_CSTS.  Similarly, copy
    5809                 :             :    contexts to KNOWN_CONTEXTS and modify the copy according to VAL and
    5810                 :             :    INDEX.  */
    5811                 :             : 
    5812                 :             : static void
    5813                 :          43 : copy_known_vectors_add_val (ipa_auto_call_arg_values *avals,
    5814                 :             :                             vec<tree> *known_csts,
    5815                 :             :                             vec<ipa_polymorphic_call_context> *known_contexts,
    5816                 :             :                             ipcp_value<ipa_polymorphic_call_context> *val,
    5817                 :             :                             int index)
    5818                 :             : {
    5819                 :          43 :   *known_csts = avals->m_known_vals.copy ();
    5820                 :          43 :   *known_contexts = avals->m_known_contexts.copy ();
    5821                 :          43 :   (*known_contexts)[index] = val->value;
    5822                 :          43 : }
    5823                 :             : 
    5824                 :             : /* Return true if OFFSET indicates this was not an aggregate value or there is
    5825                 :             :    a replacement equivalent to VALUE, INDEX and OFFSET among those in the
    5826                 :             :    AGGVALS list.  */
    5827                 :             : 
    5828                 :             : DEBUG_FUNCTION bool
    5829                 :        1020 : ipcp_val_agg_replacement_ok_p (vec<ipa_argagg_value, va_gc> *aggvals,
    5830                 :             :                                int index, HOST_WIDE_INT offset, tree value)
    5831                 :             : {
    5832                 :        1020 :   if (offset == -1)
    5833                 :             :     return true;
    5834                 :             : 
    5835                 :         366 :   const ipa_argagg_value_list avl (aggvals);
    5836                 :         366 :   tree v = avl.get_value (index, offset / BITS_PER_UNIT);
    5837                 :         366 :   return v && values_equal_for_ipcp_p (v, value);
    5838                 :             : }
    5839                 :             : 
    5840                 :             : /* Return true if offset is minus one because source of a polymorphic context
    5841                 :             :    cannot be an aggregate value.  */
    5842                 :             : 
    5843                 :             : DEBUG_FUNCTION bool
    5844                 :          43 : ipcp_val_agg_replacement_ok_p (vec<ipa_argagg_value, va_gc> *,
    5845                 :             :                                int , HOST_WIDE_INT offset,
    5846                 :             :                                ipa_polymorphic_call_context)
    5847                 :             : {
    5848                 :          43 :   return offset == -1;
    5849                 :             : }
    5850                 :             : 
    5851                 :             : /* Decide whether to create a special version of NODE for value VAL of
    5852                 :             :    parameter at the given INDEX.  If OFFSET is -1, the value is for the
    5853                 :             :    parameter itself, otherwise it is stored at the given OFFSET of the
    5854                 :             :    parameter.  AVALS describes the other already known values.  SELF_GEN_CLONES
    5855                 :             :    is a vector which contains clones created for self-recursive calls with an
    5856                 :             :    arithmetic pass-through jump function.  */
    5857                 :             : 
    5858                 :             : template <typename valtype>
    5859                 :             : static bool
    5860                 :       72553 : decide_about_value (struct cgraph_node *node, int index, HOST_WIDE_INT offset,
    5861                 :             :                     ipcp_value<valtype> *val, ipa_auto_call_arg_values *avals,
    5862                 :             :                     vec<cgraph_node *> *self_gen_clones)
    5863                 :             : {
    5864                 :             :   int caller_count;
    5865                 :       72553 :   sreal freq_sum;
    5866                 :             :   profile_count count_sum, rec_count_sum;
    5867                 :             :   vec<cgraph_edge *> callers;
    5868                 :             : 
    5869                 :       72553 :   if (val->spec_node)
    5870                 :             :     {
    5871                 :        1068 :       perhaps_add_new_callers (node, val);
    5872                 :        1068 :       return false;
    5873                 :             :     }
    5874                 :       71485 :   else if (val->local_size_cost + overall_size > get_max_overall_size (node))
    5875                 :             :     {
    5876                 :           0 :       if (dump_file && (dump_flags & TDF_DETAILS))
    5877                 :           0 :         fprintf (dump_file, "   Ignoring candidate value because "
    5878                 :             :                  "maximum unit size would be reached with %li.\n",
    5879                 :             :                  val->local_size_cost + overall_size);
    5880                 :           0 :       return false;
    5881                 :             :     }
    5882                 :       71485 :   else if (!get_info_about_necessary_edges (val, node, &freq_sum, &caller_count,
    5883                 :             :                                             &rec_count_sum, &count_sum))
    5884                 :             :     return false;
    5885                 :             : 
    5886                 :       26401 :   if (!dbg_cnt (ipa_cp_values))
    5887                 :             :     return false;
    5888                 :             : 
    5889                 :       26401 :   if (val->self_recursion_generated_p ())
    5890                 :             :     {
    5891                 :             :       /* The edge counts in this case might not have been adjusted yet.
    5892                 :             :          Nevertleless, even if they were it would be only a guesswork which we
    5893                 :             :          can do now.  The recursive part of the counts can be derived from the
    5894                 :             :          count of the original node anyway.  */
    5895                 :         231 :       if (node->count.ipa ().nonzero_p ())
    5896                 :             :         {
    5897                 :          14 :           unsigned dem = self_gen_clones->length () + 1;
    5898                 :          14 :           rec_count_sum = node->count.ipa () / dem;
    5899                 :             :         }
    5900                 :             :       else
    5901                 :         203 :         rec_count_sum = profile_count::zero ();
    5902                 :             :     }
    5903                 :             : 
    5904                 :             :   /* get_info_about_necessary_edges only sums up ipa counts.  */
    5905                 :       26401 :   count_sum += rec_count_sum;
    5906                 :             : 
    5907                 :       26401 :   if (dump_file && (dump_flags & TDF_DETAILS))
    5908                 :             :     {
    5909                 :          91 :       fprintf (dump_file, " - considering value ");
    5910                 :          91 :       print_ipcp_constant_value (dump_file, val->value);
    5911                 :          91 :       fprintf (dump_file, " for ");
    5912                 :          91 :       ipa_dump_param (dump_file, ipa_node_params_sum->get (node), index);
    5913                 :          91 :       if (offset != -1)
    5914                 :          51 :         fprintf (dump_file, ", offset: " HOST_WIDE_INT_PRINT_DEC, offset);
    5915                 :          91 :       fprintf (dump_file, " (caller_count: %i)\n", caller_count);
    5916                 :             :     }
    5917                 :             : 
    5918                 :       26401 :   if (!good_cloning_opportunity_p (node, val->local_time_benefit,
    5919                 :             :                                    freq_sum, count_sum,
    5920                 :             :                                    val->local_size_cost)
    5921                 :       26401 :       && !good_cloning_opportunity_p (node, val->prop_time_benefit,
    5922                 :             :                                       freq_sum, count_sum, val->prop_size_cost))
    5923                 :             :     return false;
    5924                 :             : 
    5925                 :        1063 :   if (dump_file)
    5926                 :         120 :     fprintf (dump_file, "  Creating a specialized node of %s.\n",
    5927                 :             :              node->dump_name ());
    5928                 :             : 
    5929                 :             :   vec<tree> known_csts;
    5930                 :             :   vec<ipa_polymorphic_call_context> known_contexts;
    5931                 :             : 
    5932                 :        1063 :   callers = gather_edges_for_value (val, node, caller_count);
    5933                 :        1063 :   if (offset == -1)
    5934                 :         697 :     copy_known_vectors_add_val (avals, &known_csts, &known_contexts, val, index);
    5935                 :             :   else
    5936                 :             :     {
    5937                 :         366 :       known_csts = avals->m_known_vals.copy ();
    5938                 :         366 :       known_contexts = copy_useful_known_contexts (avals->m_known_contexts);
    5939                 :             :     }
    5940                 :        1063 :   find_more_scalar_values_for_callers_subset (node, known_csts, callers);
    5941                 :        1063 :   find_more_contexts_for_caller_subset (node, &known_contexts, callers);
    5942                 :             :   vec<ipa_argagg_value, va_gc> *aggvals
    5943                 :        1063 :     = find_aggregate_values_for_callers_subset (node, callers);
    5944                 :        1063 :   gcc_checking_assert (ipcp_val_agg_replacement_ok_p (aggvals, index,
    5945                 :             :                                                       offset, val->value));
    5946                 :        1063 :   val->spec_node = create_specialized_node (node, known_csts, known_contexts,
    5947                 :             :                                             aggvals, callers);
    5948                 :             : 
    5949                 :        1063 :   if (val->self_recursion_generated_p ())
    5950                 :         174 :     self_gen_clones->safe_push (val->spec_node);
    5951                 :             :   else
    5952                 :         889 :     update_profiling_info (node, val->spec_node);
    5953                 :             : 
    5954                 :        1063 :   callers.release ();
    5955                 :        1063 :   overall_size += val->local_size_cost;
    5956                 :        1063 :   if (dump_file && (dump_flags & TDF_DETAILS))
    5957                 :          61 :     fprintf (dump_file, "     overall size reached %li\n",
    5958                 :             :              overall_size);
    5959                 :             : 
    5960                 :             :   /* TODO: If for some lattice there is only one other known value
    5961                 :             :      left, make a special node for it too. */
    5962                 :             : 
    5963                 :             :   return true;
    5964                 :             : }
    5965                 :             : 
    5966                 :             : /* Like irange::contains_p(), but convert VAL to the range of R if
    5967                 :             :    necessary.  */
    5968                 :             : 
    5969                 :             : static inline bool
    5970                 :       15524 : ipa_range_contains_p (const vrange &r, tree val)
    5971                 :             : {
    5972                 :       15524 :   if (r.undefined_p ())
    5973                 :             :     return false;
    5974                 :             : 
    5975                 :       15524 :   tree type = r.type ();
    5976                 :       15524 :   if (!wi::fits_to_tree_p (wi::to_wide (val), type))
    5977                 :             :     return false;
    5978                 :             : 
    5979                 :       15523 :   val = fold_convert (type, val);
    5980                 :       15523 :   return r.contains_p (val);
    5981                 :             : }
    5982                 :             : 
    5983                 :             : /* Decide whether and what specialized clones of NODE should be created.  */
    5984                 :             : 
    5985                 :             : static bool
    5986                 :     1016034 : decide_whether_version_node (struct cgraph_node *node)
    5987                 :             : {
    5988                 :     1016034 :   ipa_node_params *info = ipa_node_params_sum->get (node);
    5989                 :     1016034 :   int i, count = ipa_get_param_count (info);
    5990                 :     1845972 :   bool ret = false;
    5991                 :             : 
    5992                 :      829938 :   if (count == 0)
    5993                 :             :     return false;
    5994                 :             : 
    5995                 :      829938 :   if (dump_file && (dump_flags & TDF_DETAILS))
    5996                 :         161 :     fprintf (dump_file, "\nEvaluating opportunities for %s.\n",
    5997                 :             :              node->dump_name ());
    5998                 :             : 
    5999                 :      829938 :   auto_vec <cgraph_node *, 9> self_gen_clones;
    6000                 :      829938 :   ipa_auto_call_arg_values avals;
    6001                 :      829938 :   gather_context_independent_values (info, &avals, false, NULL);
    6002                 :             : 
    6003                 :     2770462 :   for (i = 0; i < count;i++)
    6004                 :             :     {
    6005                 :     1940524 :       if (!ipa_is_param_used (info, i))
    6006                 :      214385 :         continue;
    6007                 :             : 
    6008                 :     1726139 :       class ipcp_param_lattices *plats = ipa_get_parm_lattices (info, i);
    6009                 :     1726139 :       ipcp_lattice<tree> *lat = &plats->itself;
    6010                 :     1726139 :       ipcp_lattice<ipa_polymorphic_call_context> *ctxlat = &plats->ctxlat;
    6011                 :             : 
    6012                 :     1726139 :       if (!lat->bottom
    6013                 :     1726139 :           && !avals.m_known_vals[i])
    6014                 :             :         {
    6015                 :      176991 :           ipcp_value<tree> *val;
    6016                 :      217347 :           for (val = lat->values; val; val = val->next)
    6017                 :             :             {
    6018                 :             :               /* If some values generated for self-recursive calls with
    6019                 :             :                  arithmetic jump functions fall outside of the known
    6020                 :             :                  range for the parameter, we can skip them.  */
    6021                 :       40384 :               if (TREE_CODE (val->value) == INTEGER_CST
    6022                 :       24698 :                   && !plats->m_value_range.bottom_p ()
    6023                 :       55880 :                   && !ipa_range_contains_p (plats->m_value_range.m_vr,
    6024                 :             :                                             val->value))
    6025                 :             :                 {
    6026                 :             :                   /* This can happen also if a constant present in the source
    6027                 :             :                      code falls outside of the range of parameter's type, so we
    6028                 :             :                      cannot assert.  */
    6029                 :          28 :                   if (dump_file && (dump_flags & TDF_DETAILS))
    6030                 :             :                     {
    6031                 :           2 :                       fprintf (dump_file, " - skipping%s value ",
    6032                 :           1 :                                val->self_recursion_generated_p ()
    6033                 :             :                                ? " self_recursion_generated" : "");
    6034                 :           1 :                       print_ipcp_constant_value (dump_file, val->value);
    6035                 :           1 :                       fprintf (dump_file, " because it is outside known "
    6036                 :             :                                "value range.\n");
    6037                 :             :                     }
    6038                 :          28 :                   continue;
    6039                 :             :                 }
    6040                 :       40328 :               ret |= decide_about_value (node, i, -1, val, &avals,
    6041                 :             :                                          &self_gen_clones);
    6042                 :             :             }
    6043                 :             :         }
    6044                 :             : 
    6045                 :     1726139 :       if (!plats->aggs_bottom)
    6046                 :             :         {
    6047                 :      205965 :           struct ipcp_agg_lattice *aglat;
    6048                 :      205965 :           ipcp_value<tree> *val;
    6049                 :      277270 :           for (aglat = plats->aggs; aglat; aglat = aglat->next)
    6050                 :       70897 :             if (!aglat->bottom && aglat->values
    6051                 :             :                 /* If the following is false, the one value has been considered
    6052                 :             :                    for cloning for all contexts.  */
    6053                 :      136103 :                 && (plats->aggs_contain_variable
    6054                 :      122045 :                     || !aglat->is_single_const ()))
    6055                 :       51175 :               for (val = aglat->values; val; val = val->next)
    6056                 :       30837 :                 ret |= decide_about_value (node, i, aglat->offset, val, &avals,
    6057                 :             :                                            &self_gen_clones);
    6058                 :             :         }
    6059                 :             : 
    6060                 :     1726139 :       if (!ctxlat->bottom
    6061                 :     2143013 :           && avals.m_known_contexts[i].useless_p ())
    6062                 :             :         {
    6063                 :      201172 :           ipcp_value<ipa_polymorphic_call_context> *val;
    6064                 :      202560 :           for (val = ctxlat->values; val; val = val->next)
    6065                 :        1388 :             ret |= decide_about_value (node, i, -1, val, &avals,
    6066                 :             :                                        &self_gen_clones);
    6067                 :             :         }
    6068                 :             :     }
    6069                 :             : 
    6070                 :      829938 :   if (!self_gen_clones.is_empty ())
    6071                 :             :     {
    6072                 :          24 :       self_gen_clones.safe_push (node);
    6073                 :          24 :       update_counts_for_self_gen_clones (node, self_gen_clones);
    6074                 :             :     }
    6075                 :             : 
    6076                 :      829938 :   if (info->do_clone_for_all_contexts)
    6077                 :             :     {
    6078                 :       16338 :       if (!dbg_cnt (ipa_cp_values))
    6079                 :             :         {
    6080                 :           0 :           info->do_clone_for_all_contexts = false;
    6081                 :          53 :           return ret;
    6082                 :             :         }
    6083                 :             : 
    6084                 :       16338 :       struct cgraph_node *clone;
    6085                 :       16338 :       auto_vec<cgraph_edge *> callers = node->collect_callers ();
    6086                 :             : 
    6087                 :       80672 :       for (int i = callers.length () - 1; i >= 0; i--)
    6088                 :             :         {
    6089                 :       48023 :           cgraph_edge *cs = callers[i];
    6090                 :       48023 :           ipa_node_params *caller_info = ipa_node_params_sum->get (cs->caller);
    6091                 :             : 
    6092                 :       48023 :           if (caller_info && caller_info->node_dead)
    6093                 :        2653 :             callers.unordered_remove (i);
    6094                 :             :         }
    6095                 :             : 
    6096                 :       16338 :       if (!adjust_callers_for_value_intersection (callers, node))
    6097                 :             :         {
    6098                 :             :           /* If node is not called by anyone, or all its caller edges are
    6099                 :             :              self-recursive, the node is not really in use, no need to do
    6100                 :             :              cloning.  */
    6101                 :          53 :           info->do_clone_for_all_contexts = false;
    6102                 :          53 :           return ret;
    6103                 :             :         }
    6104                 :             : 
    6105                 :       16285 :       if (dump_file)
    6106                 :         102 :         fprintf (dump_file, " - Creating a specialized node of %s "
    6107                 :             :                  "for all known contexts.\n", node->dump_name ());
    6108                 :             : 
    6109                 :       16285 :       vec<tree> known_csts = avals.m_known_vals.copy ();
    6110                 :       16285 :       vec<ipa_polymorphic_call_context> known_contexts
    6111                 :       16285 :         = copy_useful_known_contexts (avals.m_known_contexts);
    6112                 :       16285 :       find_more_scalar_values_for_callers_subset (node, known_csts, callers);
    6113                 :       16285 :       find_more_contexts_for_caller_subset (node, &known_contexts, callers);
    6114                 :       16285 :       vec<ipa_argagg_value, va_gc> *aggvals
    6115                 :       16285 :         = find_aggregate_values_for_callers_subset (node, callers);
    6116                 :             : 
    6117                 :       16285 :       if (!known_contexts_useful_p (known_contexts))
    6118                 :             :         {
    6119                 :       15866 :           known_contexts.release ();
    6120                 :       15866 :           known_contexts = vNULL;
    6121                 :             :         }
    6122                 :       16285 :       clone = create_specialized_node (node, known_csts, known_contexts,
    6123                 :             :                                        aggvals, callers);
    6124                 :       16285 :       info->do_clone_for_all_contexts = false;
    6125                 :       16285 :       ipa_node_params_sum->get (clone)->is_all_contexts_clone = true;
    6126                 :       16285 :       ret = true;
    6127                 :       16338 :     }
    6128                 :             : 
    6129                 :             :   return ret;
    6130                 :      829938 : }
    6131                 :             : 
    6132                 :             : /* Transitively mark all callees of NODE within the same SCC as not dead.  */
    6133                 :             : 
    6134                 :             : static void
    6135                 :        3090 : spread_undeadness (struct cgraph_node *node)
    6136                 :             : {
    6137                 :        3090 :   struct cgraph_edge *cs;
    6138                 :             : 
    6139                 :        8586 :   for (cs = node->callees; cs; cs = cs->next_callee)
    6140                 :        5496 :     if (ipa_edge_within_scc (cs))
    6141                 :             :       {
    6142                 :         795 :         struct cgraph_node *callee;
    6143                 :         795 :         class ipa_node_params *info;
    6144                 :             : 
    6145                 :         795 :         callee = cs->callee->function_symbol (NULL);
    6146                 :         795 :         info = ipa_node_params_sum->get (callee);
    6147                 :             : 
    6148                 :         795 :         if (info && info->node_dead)
    6149                 :             :           {
    6150                 :          66 :             info->node_dead = 0;
    6151                 :          66 :             spread_undeadness (callee);
    6152                 :             :           }
    6153                 :             :       }
    6154                 :        3090 : }
    6155                 :             : 
    6156                 :             : /* Return true if NODE has a caller from outside of its SCC that is not
    6157                 :             :    dead.  Worker callback for cgraph_for_node_and_aliases.  */
    6158                 :             : 
    6159                 :             : static bool
    6160                 :       14717 : has_undead_caller_from_outside_scc_p (struct cgraph_node *node,
    6161                 :             :                                       void *data ATTRIBUTE_UNUSED)
    6162                 :             : {
    6163                 :       14717 :   struct cgraph_edge *cs;
    6164                 :             : 
    6165                 :       17669 :   for (cs = node->callers; cs; cs = cs->next_caller)
    6166                 :        3161 :     if (cs->caller->thunk
    6167                 :        3161 :         && cs->caller->call_for_symbol_thunks_and_aliases
    6168                 :           0 :           (has_undead_caller_from_outside_scc_p, NULL, true))
    6169                 :             :       return true;
    6170                 :        3161 :     else if (!ipa_edge_within_scc (cs))
    6171                 :             :       {
    6172                 :        2835 :         ipa_node_params *caller_info = ipa_node_params_sum->get (cs->caller);
    6173                 :        2835 :         if (!caller_info /* Unoptimized caller are like dead ones.  */
    6174                 :        2833 :             || !caller_info->node_dead)
    6175                 :             :           return true;
    6176                 :             :       }
    6177                 :             :   return false;
    6178                 :             : }
    6179                 :             : 
    6180                 :             : 
    6181                 :             : /* Identify nodes within the same SCC as NODE which are no longer needed
    6182                 :             :    because of new clones and will be removed as unreachable.  */
    6183                 :             : 
    6184                 :             : static void
    6185                 :       16915 : identify_dead_nodes (struct cgraph_node *node)
    6186                 :             : {
    6187                 :       16915 :   struct cgraph_node *v;
    6188                 :       34093 :   for (v = node; v; v = ((struct ipa_dfs_info *) v->aux)->next_cycle)
    6189                 :       17178 :     if (v->local)
    6190                 :             :       {
    6191                 :       14420 :         ipa_node_params *info = ipa_node_params_sum->get (v);
    6192                 :       14420 :         if (info
    6193                 :       28840 :             && !v->call_for_symbol_thunks_and_aliases
    6194                 :       14420 :               (has_undead_caller_from_outside_scc_p, NULL, true))
    6195                 :       14211 :           info->node_dead = 1;
    6196                 :             :       }
    6197                 :             : 
    6198                 :       34093 :   for (v = node; v; v = ((struct ipa_dfs_info *) v->aux)->next_cycle)
    6199                 :             :     {
    6200                 :       17178 :       ipa_node_params *info = ipa_node_params_sum->get (v);
    6201                 :       17178 :       if (info && !info->node_dead)
    6202                 :        3024 :         spread_undeadness (v);
    6203                 :             :     }
    6204                 :             : 
    6205                 :       16915 :   if (dump_file && (dump_flags & TDF_DETAILS))
    6206                 :             :     {
    6207                 :         101 :       for (v = node; v; v = ((struct ipa_dfs_info *) v->aux)->next_cycle)
    6208                 :          52 :         if (ipa_node_params_sum->get (v)
    6209                 :          52 :             && ipa_node_params_sum->get (v)->node_dead)
    6210                 :          32 :           fprintf (dump_file, "  Marking node as dead: %s.\n",
    6211                 :             :                    v->dump_name ());
    6212                 :             :     }
    6213                 :       16915 : }
    6214                 :             : 
    6215                 :             : /* The decision stage.  Iterate over the topological order of call graph nodes
    6216                 :             :    TOPO and make specialized clones if deemed beneficial.  */
    6217                 :             : 
    6218                 :             : static void
    6219                 :      125030 : ipcp_decision_stage (class ipa_topo_info *topo)
    6220                 :             : {
    6221                 :      125030 :   int i;
    6222                 :             : 
    6223                 :      125030 :   if (dump_file)
    6224                 :         153 :     fprintf (dump_file, "\nIPA decision stage:\n\n");
    6225                 :             : 
    6226                 :     1398806 :   for (i = topo->nnodes - 1; i >= 0; i--)
    6227                 :             :     {
    6228                 :     1273776 :       struct cgraph_node *node = topo->order[i];
    6229                 :     1273776 :       bool change = false, iterate = true;
    6230                 :             : 
    6231                 :     2564473 :       while (iterate)
    6232                 :             :         {
    6233                 :             :           struct cgraph_node *v;
    6234                 :             :           iterate = false;
    6235                 :     2587522 :           for (v = node; v; v = ((struct ipa_dfs_info *) v->aux)->next_cycle)
    6236                 :     1296825 :             if (v->has_gimple_body_p ()
    6237                 :     1296825 :                 && ipcp_versionable_function_p (v))
    6238                 :     1016034 :               iterate |= decide_whether_version_node (v);
    6239                 :             : 
    6240                 :     1290697 :           change |= iterate;
    6241                 :             :         }
    6242                 :     1273776 :       if (change)
    6243                 :       16915 :         identify_dead_nodes (node);
    6244                 :             :     }
    6245                 :      125030 : }
    6246                 :             : 
    6247                 :             : /* Look up all VR and bits information that we have discovered and copy it
    6248                 :             :    over to the transformation summary.  */
    6249                 :             : 
    6250                 :             : static void
    6251                 :      125030 : ipcp_store_vr_results (void)
    6252                 :             : {
    6253                 :      125030 :   cgraph_node *node;
    6254                 :             : 
    6255                 :     1347512 :   FOR_EACH_FUNCTION_WITH_GIMPLE_BODY (node)
    6256                 :             :     {
    6257                 :     1222482 :       ipa_node_params *info = ipa_node_params_sum->get (node);
    6258                 :     1222482 :       bool dumped_sth = false;
    6259                 :     1222482 :       bool found_useful_result = false;
    6260                 :     1222482 :       bool do_vr = true;
    6261                 :     1222482 :       bool do_bits = true;
    6262                 :             : 
    6263                 :     1222482 :       if (!info || !opt_for_fn (node->decl, flag_ipa_vrp))
    6264                 :             :         {
    6265                 :       11106 :           if (dump_file)
    6266                 :          33 :             fprintf (dump_file, "Not considering %s for VR discovery "
    6267                 :             :                      "and propagate; -fipa-ipa-vrp: disabled.\n",
    6268                 :             :                      node->dump_name ());
    6269                 :             :           do_vr = false;
    6270                 :             :         }
    6271                 :     1222482 :       if (!info || !opt_for_fn (node->decl, flag_ipa_bit_cp))
    6272                 :             :         {
    6273                 :       10883 :           if (dump_file)
    6274                 :           4 :             fprintf (dump_file, "Not considering %s for ipa bitwise "
    6275                 :             :                                 "propagation ; -fipa-bit-cp: disabled.\n",
    6276                 :             :                                 node->dump_name ());
    6277                 :       10883 :           do_bits = false;
    6278                 :             :         }
    6279                 :       10883 :       if (!do_bits && !do_vr)
    6280                 :       10874 :         continue;
    6281                 :             : 
    6282                 :     1211608 :       if (info->ipcp_orig_node)
    6283                 :       17215 :         info = ipa_node_params_sum->get (info->ipcp_orig_node);
    6284                 :     1211608 :       if (info->lattices.is_empty ())
    6285                 :             :         /* Newly expanded artificial thunks do not have lattices.  */
    6286                 :      218640 :         continue;
    6287                 :             : 
    6288                 :      992968 :       unsigned count = ipa_get_param_count (info);
    6289                 :     3096216 :       for (unsigned i = 0; i < count; i++)
    6290                 :             :         {
    6291                 :     2156997 :           ipcp_param_lattices *plats = ipa_get_parm_lattices (info, i);
    6292                 :     2156997 :           if (do_vr
    6293                 :     2156850 :               && !plats->m_value_range.bottom_p ()
    6294                 :     2208905 :               && !plats->m_value_range.top_p ())
    6295                 :             :             {
    6296                 :             :               found_useful_result = true;
    6297                 :             :               break;
    6298                 :             :             }
    6299                 :     2105089 :           if (do_bits && plats->bits_lattice.constant_p ())
    6300                 :             :             {
    6301                 :             :               found_useful_result = true;
    6302                 :             :               break;
    6303                 :             :             }
    6304                 :             :         }
    6305                 :      992968 :       if (!found_useful_result)
    6306                 :      939219 :         continue;
    6307                 :             : 
    6308                 :       53749 :       ipcp_transformation_initialize ();
    6309                 :       53749 :       ipcp_transformation *ts = ipcp_transformation_sum->get_create (node);
    6310                 :       53749 :       vec_safe_reserve_exact (ts->m_vr, count);
    6311                 :             : 
    6312                 :      195094 :       for (unsigned i = 0; i < count; i++)
    6313                 :             :         {
    6314                 :      141345 :           ipcp_param_lattices *plats = ipa_get_parm_lattices (info, i);
    6315                 :      141345 :           ipcp_bits_lattice *bits = NULL;
    6316                 :             : 
    6317                 :      141345 :           if (do_bits
    6318                 :      141341 :               && plats->bits_lattice.constant_p ()
    6319                 :      225009 :               && dbg_cnt (ipa_cp_bits))
    6320                 :       83664 :             bits = &plats->bits_lattice;
    6321                 :             : 
    6322                 :      141345 :           if (do_vr
    6323                 :      141327 :               && !plats->m_value_range.bottom_p ()
    6324                 :      100178 :               && !plats->m_value_range.top_p ()
    6325                 :      241523 :               && dbg_cnt (ipa_cp_vr))
    6326                 :             :             {
    6327                 :      100178 :               if (bits)
    6328                 :             :                 {
    6329                 :       79280 :                   value_range tmp = plats->m_value_range.m_vr;
    6330                 :       79280 :                   tree type = ipa_get_type (info, i);
    6331                 :      158560 :                   irange_bitmask bm (wide_int::from (bits->get_value (),
    6332                 :       79280 :                                                      TYPE_PRECISION (type),
    6333                 :       79280 :                                                      TYPE_SIGN (type)),
    6334                 :      158560 :                                      wide_int::from (bits->get_mask (),
    6335                 :       79280 :                                                      TYPE_PRECISION (type),
    6336                 :      158560 :                                                      TYPE_SIGN (type)));
    6337                 :       79280 :                   tmp.update_bitmask (bm);
    6338                 :       79280 :                   ipa_vr vr (tmp);
    6339                 :       79280 :                   ts->m_vr->quick_push (vr);
    6340                 :       79280 :                 }
    6341                 :             :               else
    6342                 :             :                 {
    6343                 :       20898 :                   ipa_vr vr (plats->m_value_range.m_vr);
    6344                 :       20898 :                   ts->m_vr->quick_push (vr);
    6345                 :             :                 }
    6346                 :             :             }
    6347                 :       41167 :           else if (bits)
    6348                 :             :             {
    6349                 :        4384 :               tree type = ipa_get_type (info, i);
    6350                 :        4384 :               value_range tmp;
    6351                 :        4384 :               tmp.set_varying (type);
    6352                 :        8768 :               irange_bitmask bm (wide_int::from (bits->get_value (),
    6353                 :        4384 :                                                  TYPE_PRECISION (type),
    6354                 :        4384 :                                                  TYPE_SIGN (type)),
    6355                 :        8768 :                                  wide_int::from (bits->get_mask (),
    6356                 :        4384 :                                                  TYPE_PRECISION (type),
    6357                 :        8768 :                                                  TYPE_SIGN (type)));
    6358                 :        4384 :               tmp.update_bitmask (bm);
    6359                 :        4384 :               ipa_vr vr (tmp);
    6360                 :        4384 :               ts->m_vr->quick_push (vr);
    6361                 :        4384 :             }
    6362                 :             :           else
    6363                 :             :             {
    6364                 :       36783 :               ipa_vr vr;
    6365                 :       36783 :               ts->m_vr->quick_push (vr);
    6366                 :             :             }
    6367                 :             : 
    6368                 :      141345 :           if (!dump_file || !bits)
    6369                 :      141009 :             continue;
    6370                 :             : 
    6371                 :         336 :           if (!dumped_sth)
    6372                 :             :             {
    6373                 :         236 :               fprintf (dump_file, "Propagated bits info for function %s:\n",
    6374                 :             :                        node->dump_name ());
    6375                 :         236 :               dumped_sth = true;
    6376                 :             :             }
    6377                 :         336 :           fprintf (dump_file, " param %i: value = ", i);
    6378                 :         336 :           print_hex (bits->get_value (), dump_file);
    6379                 :         336 :           fprintf (dump_file, ", mask = ");
    6380                 :         336 :           print_hex (bits->get_mask (), dump_file);
    6381                 :         336 :           fprintf (dump_file, "\n");
    6382                 :             :         }
    6383                 :             :     }
    6384                 :      125030 : }
    6385                 :             : 
    6386                 :             : /* The IPCP driver.  */
    6387                 :             : 
    6388                 :             : static unsigned int
    6389                 :      125030 : ipcp_driver (void)
    6390                 :             : {
    6391                 :      125030 :   class ipa_topo_info topo;
    6392                 :             : 
    6393                 :      125030 :   if (edge_clone_summaries == NULL)
    6394                 :      125030 :     edge_clone_summaries = new edge_clone_summary_t (symtab);
    6395                 :             : 
    6396                 :      125030 :   ipa_check_create_node_params ();
    6397                 :      125030 :   ipa_check_create_edge_args ();
    6398                 :      125030 :   clone_num_suffixes = new hash_map<const char *, unsigned>;
    6399                 :             : 
    6400                 :      125030 :   if (dump_file)
    6401                 :             :     {
    6402                 :         153 :       fprintf (dump_file, "\nIPA structures before propagation:\n");
    6403                 :         153 :       if (dump_flags & TDF_DETAILS)
    6404                 :          43 :         ipa_print_all_params (dump_file);
    6405                 :         153 :       ipa_print_all_jump_functions (dump_file);
    6406                 :             :     }
    6407                 :             : 
    6408                 :             :   /* Topological sort.  */
    6409                 :      125030 :   build_toporder_info (&topo);
    6410                 :             :   /* Do the interprocedural propagation.  */
    6411                 :      125030 :   ipcp_propagate_stage (&topo);
    6412                 :             :   /* Decide what constant propagation and cloning should be performed.  */
    6413                 :      125030 :   ipcp_decision_stage (&topo);
    6414                 :             :   /* Store results of value range and bits propagation.  */
    6415                 :      125030 :   ipcp_store_vr_results ();
    6416                 :             : 
    6417                 :             :   /* Free all IPCP structures.  */
    6418                 :      250060 :   delete clone_num_suffixes;
    6419                 :      125030 :   free_toporder_info (&topo);
    6420                 :      125030 :   delete edge_clone_summaries;
    6421                 :      125030 :   edge_clone_summaries = NULL;
    6422                 :      125030 :   ipa_free_all_structures_after_ipa_cp ();
    6423                 :      125030 :   if (dump_file)
    6424                 :         153 :     fprintf (dump_file, "\nIPA constant propagation end\n");
    6425                 :      125030 :   return 0;
    6426                 :             : }
    6427                 :             : 
    6428                 :             : /* Initialization and computation of IPCP data structures.  This is the initial
    6429                 :             :    intraprocedural analysis of functions, which gathers information to be
    6430                 :             :    propagated later on.  */
    6431                 :             : 
    6432                 :             : static void
    6433                 :      120641 : ipcp_generate_summary (void)
    6434                 :             : {
    6435                 :      120641 :   struct cgraph_node *node;
    6436                 :             : 
    6437                 :      120641 :   if (dump_file)
    6438                 :         155 :     fprintf (dump_file, "\nIPA constant propagation start:\n");
    6439                 :      120641 :   ipa_register_cgraph_hooks ();
    6440                 :             : 
    6441                 :     1301660 :   FOR_EACH_FUNCTION_WITH_GIMPLE_BODY (node)
    6442                 :     1181019 :     ipa_analyze_node (node);
    6443                 :      120641 : }
    6444                 :             : 
    6445                 :             : namespace {
    6446                 :             : 
    6447                 :             : const pass_data pass_data_ipa_cp =
    6448                 :             : {
    6449                 :             :   IPA_PASS, /* type */
    6450                 :             :   "cp", /* name */
    6451                 :             :   OPTGROUP_NONE, /* optinfo_flags */
    6452                 :             :   TV_IPA_CONSTANT_PROP, /* tv_id */
    6453                 :             :   0, /* properties_required */
    6454                 :             :   0, /* properties_provided */
    6455                 :             :   0, /* properties_destroyed */
    6456                 :             :   0, /* todo_flags_start */
    6457                 :             :   ( TODO_dump_symtab | TODO_remove_functions ), /* todo_flags_finish */
    6458                 :             : };
    6459                 :             : 
    6460                 :             : class pass_ipa_cp : public ipa_opt_pass_d
    6461                 :             : {
    6462                 :             : public:
    6463                 :      280114 :   pass_ipa_cp (gcc::context *ctxt)
    6464                 :             :     : ipa_opt_pass_d (pass_data_ipa_cp, ctxt,
    6465                 :             :                       ipcp_generate_summary, /* generate_summary */
    6466                 :             :                       NULL, /* write_summary */
    6467                 :             :                       NULL, /* read_summary */
    6468                 :             :                       ipcp_write_transformation_summaries, /*
    6469                 :             :                       write_optimization_summary */
    6470                 :             :                       ipcp_read_transformation_summaries, /*
    6471                 :             :                       read_optimization_summary */
    6472                 :             :                       NULL, /* stmt_fixup */
    6473                 :             :                       0, /* function_transform_todo_flags_start */
    6474                 :             :                       ipcp_transform_function, /* function_transform */
    6475                 :      280114 :                       NULL) /* variable_transform */
    6476                 :      280114 :   {}
    6477                 :             : 
    6478                 :             :   /* opt_pass methods: */
    6479                 :      562995 :   bool gate (function *) final override
    6480                 :             :     {
    6481                 :             :       /* FIXME: We should remove the optimize check after we ensure we never run
    6482                 :             :          IPA passes when not optimizing.  */
    6483                 :      562995 :       return (flag_ipa_cp && optimize) || in_lto_p;
    6484                 :             :     }
    6485                 :             : 
    6486                 :      125030 :   unsigned int execute (function *) final override { return ipcp_driver (); }
    6487                 :             : 
    6488                 :             : }; // class pass_ipa_cp
    6489                 :             : 
    6490                 :             : } // anon namespace
    6491                 :             : 
    6492                 :             : ipa_opt_pass_d *
    6493                 :      280114 : make_pass_ipa_cp (gcc::context *ctxt)
    6494                 :             : {
    6495                 :      280114 :   return new pass_ipa_cp (ctxt);
    6496                 :             : }
    6497                 :             : 
    6498                 :             : /* Reset all state within ipa-cp.cc so that we can rerun the compiler
    6499                 :             :    within the same process.  For use by toplev::finalize.  */
    6500                 :             : 
    6501                 :             : void
    6502                 :      252466 : ipa_cp_cc_finalize (void)
    6503                 :             : {
    6504                 :      252466 :   base_count = profile_count::uninitialized ();
    6505                 :      252466 :   overall_size = 0;
    6506                 :      252466 :   orig_overall_size = 0;
    6507                 :      252466 :   ipcp_free_transformation_sum ();
    6508                 :      252466 : }
    6509                 :             : 
    6510                 :             : /* Given PARAM which must be a parameter of function FNDECL described by THIS,
    6511                 :             :    return its index in the DECL_ARGUMENTS chain, using a pre-computed
    6512                 :             :    DECL_UID-sorted vector if available (which is pre-computed only if there are
    6513                 :             :    many parameters).  Can return -1 if param is static chain not represented
    6514                 :             :    among DECL_ARGUMENTS. */
    6515                 :             : 
    6516                 :             : int
    6517                 :      118099 : ipcp_transformation::get_param_index (const_tree fndecl, const_tree param) const
    6518                 :             : {
    6519                 :      118099 :   gcc_assert (TREE_CODE (param) == PARM_DECL);
    6520                 :      118099 :   if (m_uid_to_idx)
    6521                 :             :     {
    6522                 :           0 :       unsigned puid = DECL_UID (param);
    6523                 :           0 :       const ipa_uid_to_idx_map_elt *res
    6524                 :           0 :         = std::lower_bound (m_uid_to_idx->begin(), m_uid_to_idx->end (), puid,
    6525                 :           0 :                             [] (const ipa_uid_to_idx_map_elt &elt, unsigned uid)
    6526                 :             :                             {
    6527                 :           0 :                               return elt.uid < uid;
    6528                 :             :                             });
    6529                 :           0 :       if (res == m_uid_to_idx->end ()
    6530                 :           0 :           || res->uid != puid)
    6531                 :             :         {
    6532                 :           0 :           gcc_assert (DECL_STATIC_CHAIN (fndecl));
    6533                 :             :           return -1;
    6534                 :             :         }
    6535                 :           0 :       return res->index;
    6536                 :             :     }
    6537                 :             : 
    6538                 :      118099 :   unsigned index = 0;
    6539                 :      271966 :   for (tree p = DECL_ARGUMENTS (fndecl); p; p = DECL_CHAIN (p), index++)
    6540                 :      270563 :     if (p == param)
    6541                 :      116696 :       return (int) index;
    6542                 :             : 
    6543                 :        1403 :   gcc_assert (DECL_STATIC_CHAIN (fndecl));
    6544                 :             :   return -1;
    6545                 :             : }
    6546                 :             : 
    6547                 :             : /* Helper function to qsort a vector of ipa_uid_to_idx_map_elt elements
    6548                 :             :    according to the uid.  */
    6549                 :             : 
    6550                 :             : static int
    6551                 :           0 : compare_uids (const void *a, const void *b)
    6552                 :             : {
    6553                 :           0 :   const ipa_uid_to_idx_map_elt *e1 = (const ipa_uid_to_idx_map_elt *) a;
    6554                 :           0 :   const ipa_uid_to_idx_map_elt *e2 = (const ipa_uid_to_idx_map_elt *) b;
    6555                 :           0 :   if (e1->uid < e2->uid)
    6556                 :             :     return -1;
    6557                 :           0 :   if (e1->uid > e2->uid)
    6558                 :             :     return 1;
    6559                 :           0 :   gcc_unreachable ();
    6560                 :             : }
    6561                 :             : 
    6562                 :             : /* Assuming THIS describes FNDECL and it has sufficiently many parameters to
    6563                 :             :    justify the overhead, create a DECL_UID-sorted vector to speed up mapping
    6564                 :             :    from parameters to their indices in DECL_ARGUMENTS chain.  */
    6565                 :             : 
    6566                 :             : void
    6567                 :       20352 : ipcp_transformation::maybe_create_parm_idx_map (tree fndecl)
    6568                 :             : {
    6569                 :       20352 :   int c = count_formal_params (fndecl);
    6570                 :       20352 :   if (c < 32)
    6571                 :             :     return;
    6572                 :             : 
    6573                 :           0 :   m_uid_to_idx = NULL;
    6574                 :           0 :   vec_safe_reserve (m_uid_to_idx, c, true);
    6575                 :           0 :   unsigned index = 0;
    6576                 :           0 :   for (tree p = DECL_ARGUMENTS (fndecl); p; p = DECL_CHAIN (p), index++)
    6577                 :             :     {
    6578                 :           0 :       ipa_uid_to_idx_map_elt elt;
    6579                 :           0 :       elt.uid = DECL_UID (p);
    6580                 :           0 :       elt.index = index;
    6581                 :           0 :       m_uid_to_idx->quick_push (elt);
    6582                 :             :     }
    6583                 :           0 :   m_uid_to_idx->qsort (compare_uids);
    6584                 :             : }
        

Generated by: LCOV version 2.1-beta

LCOV profile is generated on x86_64 machine using following configure options: configure --disable-bootstrap --enable-coverage=opt --enable-languages=c,c++,fortran,go,jit,lto,rust,m2 --enable-host-shared. GCC test suite is run with the built compiler.