sexta-feira, 29 de abril de 2016

Mentindo com Estatísticas: O Salário Mínimo e o Desemprego

 Lying with Statistics: The Minimum Wage and the Unemployment

No passado 19 de Abril publicou o JN uma notícia com o título «Alta do salário mínimo vai prolongar o desemprego». Aí se papagueava o pensamento neoliberal de Bruxelas sobre o assunto. Todos os grandes jornais pertencem a monopólios da comunicação social, tornando-se meros divulgadores das directizes do grande capital. Estas, por definição, apoiam os interesses do capital e rebaixam ou negam os direitos dos trabalhadores. Vários meios são utilizados com esse objectivo. Estatísticas erradas e mentirosas, embora apelativas para o leitor comum criticamente desarmado, fazem parte desses meios.
   
Neste caso concreto, o JN publicou a figura 1 abaixo, comentando no texto: «em 2015, esse contingente de desempregados crónicos abarcava ainda 410,7 mil pessoas, mais 44,7 mil do que em 2011». Os «desempregados crónicos» são os desempregados há mais de um ano. Os dados são de fontes oficiais (INE, PORDATA).
The Jornal de Notícias (JN) published last April 19 an article entitled “The minimum wage hike will prolong unemployment” The article parroted the Brussels neo-liberal thought on the matter. All large audience newspapers are owned by media monopolies, hence they are mere popularizers of the big capital directives. By definition, such directives uphold the interests of the capital and debase or deny the workers rights. In achieving such purpose various methods are applied. Wrong and mystifying statistics, albeit evocative to the common and critically unarmed reader, are an integral part of such methods.
   
In this concrete case the JN published the Figure 1 below, with the text comment: “in 2015, the contingent of chronic unemployment still comprehended over 410.7 thousand people, 44.7 thousand more than in 2011”. By “chronic unemployment” is meant those that are unemployed for over one year. The data are from official sources (INE, PORDATA).

Fig. 1. Salário mínimo mensal (vermelho) e desempregados de longa duração (mais de um ano) em milhares de indivíduos (preto). Minimum monthly wage (red) and long term (over one year) unemployed individuals in thousands (black).

Os erros e mentiras nucleares da notícia são vários. Passamos a comentar.
The article contains several kernel mistakes and lies. We now comment them.

A) Comparações pontuais isoladas de processos temporais não dizem nada
    
A notícia pretende que o leitor fique com a impressão de que o salário mínimo mensal (SM) tem crescido, mas que infelizmente isso traduziu-se num aumento do desemprego de longa duração (D): «em 2015, esse contingente de desempregados crónicos [era ainda] mais 44,7 mil do que em 2011». Contudo, se só olharmos para instantâneos das variáveis – neste caso, os valores de 2011 e 2015 – não podemos tirar quaisquer conclusões válidas.
   
A figura 2 mostra duas evoluções alternativas hipotéticas de D (azul e magenta) com os mesmos valores pontuais. Temos assim três alternativas de D: uma (a preto), em que sobe durante dois anos e desce nos dois anos seguintes; outra (a azul), em que sobe uniformemente nos quatro anos; outra ainda (a magenta) em que desce em três anos e só sobe no último ano. É óbvio que não é possível inferir uma regra geral de evoluções tão diversas e contraditórias apesar de terem os mesmos valores terminais.
A) Isolated point comparisons of temporal processes are of no value
    
The article purports to instill in the reader the idea that though the minimum monthly wage (SM) has grown, this was unfortunately at the cost of a rise of long term unemployment (D): “in 2015, that contingent of chronic unemployment still comprehended […] 44.7 thousand more than in 2011”. However, if we only look to snapshots of the variables – in this case the values for 2011 and 2015 – we are unable to draw any valid conclusion.
   
Figure 2 shows two alternative hypothetical evolutions of D (blue and magenta) with the same point values. We thus have three alternatives for D: one (black), where it grows along two years and then declines in the following two; another (blue), where it uniformly grows during the four years; yet another (magenta) where it declines during three years and only in the last year it increases. It is obviously impossible to infer a general rule from such diverse and contradicting evolutions, though they have the same end-interval values.


Fig. 2. Duas alternativas hipotéticas de evolução de D (azul e magenta) com os mesmos valores terminais em 2011 e 2015. Two hypothetical alternatives for the time evolution of D (blue and magenta) with the same end values in 2011 and 2015.

B) Comparações de tendências lineares de processos temporais podem induzir em erro
    
A figura do JN também mostra duas rectas de «tendência», pouco visíveis: uma, a cinzento, une os pontos terminais de D; outra, a vermelho claro, une os pontos terminais de SM. Estas rectas não são referidas no texto da notícia. Destinam-se ao leitor mais atento que gosta de inspeccionar figuras e a mensagem é clara: Vêem? A tendência de D é de crescimento, tal como a de SM, logo ambas as evoluções estão relacionadas.
   
Contudo, esta mensagem não é válida. A comparação de evoluções temporais de duas variáveis exige medir o grau de relacionamento entre elas em todos os intervalos de tempo (anos). Essa medição, assumindo um modelo de relação linear (o mais usual e também o mais adequado neste caso), é feita somando os produtos cruzados dos desvios de cada valor face à respectiva média. A média de SM é 489 € e a de D é 447,2. Estamos, portanto, a falar da seguinte soma: (485 - 489)x(366 - 447,2) + (485 - 489)x(452,7 - 447,2) + etc. Esta soma, devidamente normalizada, é conhecida por (coeficiente de) correlação (linear). Varia entre -1 e 1 com valores positivos indicando uma relação no mesmo sentido (D e SM sobem ou descem conjuntamente) e valores negativos em sentidos opostos (quando D sobe SM desce e vice-versa). A grandeza absoluta da correlação mede a sua intensidade.
   
No caso presente, temos a seguinte correlação entre SM e a
   
recta de tendência de D do JN:          +0,71
evolução real de D:                            - 0,33
   
Portanto, o tipo de relação entre D e SM não é de subida conjunta, como sugeria a recta de tendência de D. Pelo contrário, é de relação oposta: D essencialmente desce quando SM sobe. A intensidade da relação tambám não é a mesma.
   
(A medida de correlação está disponível em muitas aplicações, incluindo o Excel.)
    
C) As rectas de tendência não devem ser obtidas como fez o JN
    
Efectivamente, comparar rectas de tendência obtidas como as do JN (ligando pontos terminais) pode levar a conclusões inteiramente falsas. Por exemplo, na figura 2, quer a evolução de D (preto) quer a sua evolução hipotética a magenta, têm a mesma recta de tendência JN. Contudo, como é óbvio, reflectem realidades muito distintas.
   
Para determinarmos a recta de tendência correcta teremos de usar um método dito de regressão linear (também disponível em muitas aplicações, incluindo o Excel).
   
A figura 3 é igual à anterior mas com a recta de regressão – a verdadeira recta de tendência linear – da evolução a magenta. Note-se como, enquanto a tendência JN é crescente, agora a verdadeira tendência é decrescente.
   
Enquanto a correlação da evolução a magenta com SM é de +0,67 – crescem conjuntamente em 2014-2015 e nos anos em que SM é constante não influencia a correlação –, a correlação de SM com a recta de tendência da evolução magenta é de -0,71!
B) Comparisons of linear trends of temporal processes may be misleading
    
Two barely visible “trend” lines are also shown in the JN’s graph: a grey one, joining the endpoints of D; a light red one, joining de endpoints of SM. These lines are not mentioned in the article text. They are intended to the attentive reader who likes to inspect pictures, and the conveyed message is clear: See? D has a growth trend, in the same way as SM, therefore the two evolutions are related.
   
However, this is an invalid message. The comparison of the temporal evolution of two variables demands measuring the degree of relationship between them in all time intervals (years). Such measurement, assuming a linear relation model (the most common one and also the most adequate one in this case), is carried out by adding cross-products of the deviations of each value from the respective average. The average of SM is 489 € and of D is 447.2. We then carry out the summation: (485 - 489)x(366 - 447,2) + (485 - 489)x(452,7 - 447,2) + etc. Duly standardized this summation is known as the (linear) correlation (coefficient). It varies between -1 and 1 with positive values indicating a relation in the same direction (D and SM increase or decrease jointly) and negative values in opposite directions (when D increases SM decreases and vice-versa). The absolute magnitude of the correlation measures its intensity.
   
In our case we obtain the following correlation between SM and
   
the JN trend line of D:            +0,71
the real D:                               - 0,33
   
We conclude that the relation between D and SM is not one of joint rise, as suggested by the trend line of D. On the contrary, it is an opposite relation: D essentially drops when SM rises. The intensity of the relation is also not the same.
   
(Several applications provide the computation of the correlation, including Excel.)
    
C) Trend lines should not be derived in the way  JN did
    
As a point of fact, comparing trend lines derived in the way JN did (by endpoint joining) may lead to entirely false conclusions. Take, for instance, Figure 2, where either the evolution of D (black) or its hypothetical evolution in magenta have the same JN trend line. Both evolutions represent, however, quite distinct realities.
   
In order to determine the correct trend line we must use a method named linear regression (also available in many applications, including Excel).
   
Figure 3 is the same as the previous one but with the regression line – the true linear trend line – of the magenta evolution. Note that whereas the JN trend is an increasing one the true trend is a decreasing one.
   
Whereas the correlation of the magenta evolution with SM is +0.67 – they grow together in 2014-2015 and in the years SM is constant it has no influence on the correlation –, the correlation of SM with the trend line of the magenta evolution is -0.71!


Fig. 3. O mesmo que 2 com a recta de regressão (cinzento) da curva a magenta. The same as Figure 2 with the regression line (grey) of the magenta curve.

D) O SM deve ser expresso em valor real e não em valor nominal
    
Este é um dos erros frequentes dos que não possuem uma literacia básica em economia: o uso incorrecto de variáveis económicas.
   
Os valores dos salários, como os de quaisquer preços, sofrem alterações (normalmente, depreciações) ao longo do tempo. Por conseguinte, se queremos efectuar comparações em igualdade de condições, teremos, por vezes, de ter em conta o factor de depreciação ao longo do tempo. No caso presente, os valores indicados de SM são valores nominais – os valores expressos no valor corrente da moeda, sem ter em conta a inflação-deflação; logo, sem ter em conta o que um dado valor monetário pode realmente adquirir. Se estivéssemos a comparar duas séries temporais de preços nominais, poderíamos prescindir do factor de depreciação – estaríamos a comparar nas mesmas condições. Não é o caso aqui. Teremos de usar os valores reais do SM. (O INE e PORDATA fornecem os factores de depreciação do índice de preços no consumidor.)
   
A figura 4 mostra os valores reais do SM (azul). A diferença não parece importante face aos valores nominais. Porém, a descida de 2011 para 2012 do valor real de SM redunda numa correlação com D bem mais forte do que tínhamos visto em B: -0,83.
D) SM must be expressed in real value, not in nominal value
    
This is one of the often encountered mistakes of those lacking basic literacy in economics: the incorrect use of economic variables.
   
The values of wages, as of any prices, undergo changes (usually, depreciations) in the course of time. Consequently, if one wants to do comparisons in equal conditions, one has, in some cases, to take into account the depreciation factor in the course of time. In the case here the values assigned to SM are nominal values – values expressed in terms of the current monetary value, without accounting for inflation-deflation; thus, without taking consideration of what a given monetary value is really able to purchase. Had we been comparing two temporal series of nominal prices we would then do without the depreciation factor – we would be comparing in the same conditions. That’s not the case here. Here we must use the SM real values. (INE and PORDATA supply the depreciation factors of the consumer price index.)
   
Figure 4 shows the SM real values (blue). The differences with respect to the nominal values don’t look that important. Nonetheless, de SM decline between 2011 and 2012 results in a far stronger correlation than the one found in B: -0.83.



Fig. 4. O mesmo que fig. 1 com o SM real a azul. The same as Figure 1 with the real SM (blue).

E) A análise de um pequeno segmento temporal não autoriza a formular uma lei geral.
    
Esta é uma questão geral da validação do raciocínio indutivo. Em que medida resultados obtidos de casos particulares podem ser usados para formular uma lei geral? Existem metodologias apropriadas para lidar com este problema. Não é este, contudo, o local para as abordarmos. Vamos, simplesmente, apresentar um método empírico suficiente para o caso presente.
   
O JN «analisou» um segmento temporal de 5 anos, quase todo da legislatura PSD-CDS, de brutal austeridade e ataque aos trabalhadores. É um segmento de duração superior a uma legislatura; logo, de duração não trivial. Imaginemos que passeávamos uma janela temporal de 5 anos de 1974 a 2015 e em cada posição da janela medíamos a correlação entre o SM real e D. Obtemos a curva de correlação a azul da figura 5. Note-se a descida de 2010 a 2013 devido ao aumento brutal do desemprego num período em que o SM real desceu. Os valores negativos que ocorrem no período contra-revolucionário pós 1975, até à adesão à CEE em 1986, têm a ver com o desmantelamento contra-revolucionário dos direitos dos trabalhadores, e não com crises globais. Globalmente a curva de correlação sobe e desce caoticamente não revelando nenhum padrão regular, logo nenhuma lei geral.
   
A correlação global entre SM real e D é fraca: 0,29 (encontraríamos tal correlação em SMs e Ds aleatórios do mesmo comprimento com uma probabilidade superior a 5%).
E) The analysis of a small time segment doesn’t allow inferring a general law
    
This is a general issue concerning the validation of inductive thought. Under which conditions results obtained from individual cases can be used to formulate a general law? There are suitable methodologies to tackle this issue. It’s not here, however, the place to approach them. We will restrict ourselves to present an empirical method sufficient for the case at hand.
   
JN “analyzed” a time segment of 5 years, almost all of the PSD-CDS legislature, of brutal austerity and attack to the workers. The time span of the segment is larger than that of a normal legislature (4 years); therefore, of a non trivial extension. Let us imagine sliding a 5-year time window from 1974 through 2015 and measuring at each position of the window the correlation between the real SM and D. We obtain the blue correlation curve of Figure 5. Note the decline between 2010 and 2013 due to the huge increase of unemployment in a period of a decreasing real SM. The negative values occurring in the post 1975 counterrevolutionary period until the EEC membership in 1986 are more the result of the counterrevolutionary dismantling of workers rights than an influence of global crises. On the whole the correlation curve goes up and down chaotically without displaying any specific regular pattern and thus no general law.
   
The global correlation between the real SM and D is small: 0.29 (one would find such a correlation in randomly drawn SMs and Ds of the same length with a probability over 5%).
    

Fig. 5. Curva de correlação a azul em segmentos correntes de 5 anos, entre SM real (vermelho) e D (preto). Correlation curve (blue) in running 5-year segments, between the real SM (red) and D (black)
    
F) O salário mínimo não é uma causa do desemprego
    
O salário mínimo corresponde ao valor mínimo da força de trabalho em determinadas condições sociais; neste caso, nas condições da sociedade portuguesa.
   
A classe capitalista procura baixar o mais possível este valor, de forma a aumentar a taxa de exploração do trabalho (mais-valia produzida pelo trabalhador a dividir pelo salário) e, daí, a taxa de lucro, mesmo que isso implique o aumento do desemprego. A classe trabalhadora procura aumentar o SM, aproveitando todos os momentos em que a correlação de forças lhe é favorável. E, obviamente, procura baixar o desemprego. Um baixo SM contrai o consumo interno, prejudicando a expansão do sector produtivo nacional, com produção para o mercado interno. Este aspecto não é actualmente importante para a classe capitalista portuguesa, na sua generalidade. Além disso, este aspecto é totalmente irrelevante para a troika (embora por vezes digam o contrário), dominada pelo capital alemão e corporações europeias transnacionais que exportam bens de consumo para Portugal. E cada vez mais e dos mais básicos, mesmo os que eram de tradição portuguesa: leite, suínos, sardinha, etc. Mas o aspecto em questão é importante para a classe trabalhadora, a única classe patriótica que não pode deixar de lutar pelo futuro do país. Ao invés, as «pátrias» dos capitalistas são os offshores e as suas alianças prioritárias são com os congéneres estrangeiros representados pela troika.
   
Dito isto, é realmente «comovente» verificar a preocupação da CE-troika com os alegados efeitos nocivos do aumento do SM no desemprego. Conforme afirmou Arménio Carlos da CGTP (isto num breve clip no mesmo JN) acerca da «teoria» da CE: «é uma teoria desenvolvida pela Comissão Europeia para travar a evolução das restantes grelhas salariais», «a troika nunca conseguiu justificar as razões para ser contra o aumento do SMN» e «defende um modelo económico de baixos salários, que é desastroso».
   
As relações entre SM e D têm menos a ver com a interacção de SM sobe – lucro baixa e SM sobe – consumo aumenta – lucro aumenta, e mais a ver com os acasos da luta de classes, não existindo nenhuma lei geral de relação causal entre as duas. Por isso mesmo, e apesar das luminárias de economistas que possui, «a troika nunca conseguiu justificar as razões para ser contra o aumento do SMN».
   
Será que isto é demonstrável, ao menos empiricamente, no caso português? De facto, é. Comecemos por notar o que dissemos acima: a correlação observada entre SM e D é baixa. Note-se que uma forte correlação entre duas variáveis não implica de forma alguma a existência de causalidade, mas uma fraca correlação é frequentemente sintoma de ausência de causalidade. No caso presente, a «teoria» anunciada no título do JN era que «Alta do salário mínimo vai prolongar o desemprego». Parece razoável entender a formulação algo vaga de «prolongar o desemprego» como significando que, pelo menos nos dois anos a seguir a um aumento do SM, o número de desempregados se mantém acima de 99% do número do ano anterior (consideramos, portanto, como não significativo um desvio abaixo de 1%). Seja:
   
N = número de anos, ai, em que houve aumento de SM com respeito ao ano anterior, com i indicando o i-ésimo ano corrente;
   
P = número de ocorrências de 2 anos a seguir a ai, com «prolongamento» de desemprego (critério acima);
   
V = número de ocorrências de 2 anos a seguir a ai, em que o desemprego registou uma descida em pelo menos um deles (o contrário de P).
   
Para os dados portugueses de SM real e de D obtém-se: N = 24; P = 8; V = 16. Isto é, é mais provável encontrar a seguir a um aumento do SM um período de dois anos em que se regista pelo menos uma descida do desemprego (16/24) do que um prolongamento do desemprego (8/24). A conclusão é a mesma se usarmos SM nominal (com proporções respectivamente de 13/35 e 22/35). A «teoria» da CE-troika não se confirma.
   
(Aplicámos também um teste estatístico de causalidade, cuja explanação não cabe aqui, que também confirmou a ausência de causalidade.)
     
G) No caso português (e noutros), aos valores anuais de desempregados devem ser somados os dos emigrantes
    
É sabido que a actual crise levou à emigração de muitos jovens licenciados e quadros qualificados. Mas mesmo antes da crise a emigração tem sido elevada em Portugal. Infelizmente as estatísticas da emigração são fracas. Concretamente, faltam os valores da emigração total anterior a 1992 e entre os anos de 2004 a 2010. Os números que existem apontam para um número de emigrantes entre 20 a 30% dos desempregados desde 1992. É um enorme contingente de emigrantes que constitui uma claríssima denúncia dos sucessivos governos de direita. Os últimos do PSD-CDS inclusive aplaudiram a emigração.
   
Conforme já expusemos em artigos anteriores, muitos emigram precisamente por terem sido desempregados de longa duração. O facto de deixarem de estar registados nos centros de emprego em nada autoriza olhar com optimismo indevido os números do desemprego. Como já dissemos, se todos os desempregados emigrassem a taxa de desemprego seria de 0%.
   
Portanto, um estudo rigoroso das causas do desemprego deverá ter sempre em conta a emigração. Isto é, deverá ser um estudo das causas do desemprego-emigração. Sobretudo, em Portugal, onde a emigração é elevada.
   
Se tomarmos em conta os valores disponíveis da emigração, adicionando-os a D, verifica-se que as conclusões acima não se alteram. No que diz respeito à alegada influência causal da subida do SM real, obtemos agora os números: N = 9; P = 2; V = 7. Para o SM nominal os números são: N = 12; P = 4; V = 8. Mais uma vez, a «teoria» da CE-troika não se confirma.
F) The minimum wage is not a cause of unemployment
    
The minimum wage corresponds to the minimum value of the labor power in given social conditions; in this case, in the conditions of the Portuguese society.
   
The capitalist class tries as much as it can to lower this value, so that the rate of exploitation of the work is increased (surplus value produced by the worker divided by the wage) and from there increasing the rate of profit, even though that may result in an increase of the unemployment. The working class tries to increase the SM, profiting from all moments of a favorable correlation of forces. And, obviously, it tries to lower the unemployment. A low SM diminishes the domestic consumption and detriments the development of the domestic productive sector, producing for the domestic market. At the present moment this is not, in general, an important issue for the Portuguese capitalist class. Moreover, this is a totally irrelevant issue for the troika (though sometimes they say otherwise), dominated by German capital and transnational European corporations exporting consumption goods to Portugal. Exporting each time more, and more basic ones, even what used to be traditional Portuguese items: milk, pigs, sardines, etc. But the above aspect is important to the working class, the sole patriotic class that cannot but struggle for the future of the country. In contrast, the “countries” of the capitalists are offshores, and their priority alliances are with their foreign mates represented by the troika.
   
This being said, it is really “touching” to observe the preoccupation of the EC-troika with the alleged harmful effects on unemployment, from an SM increase. As Arménio Carlos from CGTP stated about the EC “theory” (in a brief clip in JN): “it is a theory developed by the European Committee to put a break on the evolution of other salary grids”, “the troika was never able to justify why they are against the SM increase” and “defends a low-salary economic model, which is a disaster”.
   
The links between SM and D depend less on the interplay of SM increases – profit decreases and SM increases – consumption increases – profit increases, and depend more on chance events of class struggle. A general causality law does not exist between them. For that reason and in spite of its economic luminaries “the troika was never able to justify why they are against the SM increase”.
   
Is this a demonstrable statement, at least empirically for the Portuguese case? It is, indeed. Let us start from what we said above: the observed correlation between SM and D is small. To be sure, a strong correlation between two variables does not imply at all a causality relation, but a weak correlation is often a symptom of an absence of causality. In our case, the “theory” announced by the JN title was “The minimum wage hike will prolong unemployment”. It seems reasonable to interpret the somewhat vague formulation “prolong unemployment” as signifying that, at least in two years following an SM increase, the number of unemployees stays over 99% of the previous year number (we are thus considering as being non-significant a deviation below 1%). Let:
   
N = number of years, ai, with an increase of SM relative to the previous year, with i indicating the ith running year;
   
P = number of times that a 2-year period following ai was one of “prolonged” unemployment (the criterion above);
   
V = number of times that in a 2-year period following ai an unemployment decrease was observed at least in one year (P’s complement).
   
For the Portuguese data of real SM and D one obtains: N = 24; P = 8; V = 16. That is, the probability of finding a 2-year period with at least one decrease of the unemployment following an SM increase (16/24) is higher than the one of finding a prolonged unemployment (8/24). The conclusion is the same if we use SM nominal values (the proportions are now, respectively, 13/35 and 22/35). The EC-troika “theory” is not confirmed.
   
(The absence of causality was also confirmed by a specific statistical test, whose explanation falls out of the scope of this article.)
    
G) In the Portuguese case (and in other ones), the number of annual emigrants must be added to the number of the unemployees
    
It is well-known that the present crisis led to the emigration of a large number of young graduated people and highly qualified cadres. But even before the crisis the emigration in Portugal has been high. Unfortunately, the statistics of emigration are of poor quality. Concretely, the values of the total emigration before 1992 and from 2004 through 2010 are missing. The existing data indicate a number of emigrants varying around 20 to 30% the number of unemployees since 1992. It is a huge contingent of emigrants, constituting a clear denunciation of the successive right-wing governments. The last ones of the PSD-CDS have even applauded the emigration.
   
We have already noticed in previous articles that many people emigrate precisely because they were long term unemployees. The fact that they ceased being registered at employment agencies does not authorize us to look upon the unemployment figures with unduly optimism. As we have told, if all the unemployed people emigrated the unemployment rate would fall to 0%.
   
Therefore, a rigorous study on the causes of unemployment must always take the emigration into account. That is, it must be a study on the unemployment-emigration causes. Especially in Portugal where the emigration is high.
   
Taking into account the available values of emigration, by adding them to D, does not modify the above conclusions. In what respects the alleged causal influence of the real SM increase, we now obtain the values: N = 9; P = 2; V = 7. For the nominal SM the figures are: N = 12; P = 4; V = 8. Once again the EC-troika “theory” is not confirmed.