Le français et les données agrégées

Imaginons deux francophones de langue maternelle. Le premier épouse une femme du Chili, conçoit deux enfants avec celle-ci et travaille en français. Le deuxième homme épouse une francophone de la Côte-Nord, conçoit deux enfants avec elle mais travaille en anglais.  Le premier homme apprend l’espagnol à la maison et cette langue est la principale langue du ménage. Le second homme parle le français à la maison mais l’anglais au travail.

Pouvons-nous parler d’un déclin du français? Pas du tout. Après tout, les enfants des deux hommes iront à l’école en français, la femme du premier devra apprendre le français (si elle ne l’a pas déjà fait) et le second homme apprend l’anglais. Il y a une croissance mutuellement non-exclusive des langues.

Toutefois, les statistiques agrégées dont se servent certains défenseurs de la thèse du déclin du français masqueront ces sous-réalités. D’un côté, nous verrons que le français est moins parlé à la maison et que l’anglais est plus parlé au travail. Pourtant, le français a progressé clairement. Il s’agit donc là d’un des effets pervers de l’agrégation des données.

On ne peut pas présumer que les individus qui utilisent l’anglais au travail sont les mêmes que ceux qui utilisent l’anglais (ou une autre langue) à la maison. C’est là les dangers de l’agrégation, une réalité qui peut fausser n’importe quelle régression ou analyse statistique « de base » puisque des comportements individuels peuvent « s’entre-annuler » et brouiller la réalité et les évaluations.

Cette compréhension des dangers de l’agrégation des données, utilisées si souvent par certains, est présente dans les recherches médicales, l’analyse des comportements sexuels, les évaluations du marché du travail, la microéconomie et plusieurs autres. Pourquoi cette simple constatation statistique, dont la problématique est amplifiée par le multilinguisme, n’est-elle pas acceptée au Québec?

Les progrès de l’anglais et du français: le test des définitions

Dans le débat sur la langue française, il y a un élément qui semble causer problème pour plusieurs (mais pas pour moi) et qui est à la cause de toutes les difficultés des débatteurs. L’anglais progresse…

Eh oui, dans ma position, j’ai toujours mis l’emphase sur le progrès du français (1991-2006) et la stabilisation relative (2006-2011) et les distorsions causé par le multilinguisme. Toutefois, je n’ai jamais affirmé que l’anglais n’avait pas progressé. Ma position est que les langues peuvent très bien progresser entre elles et qu’il n y a pas un jeu à somme nulle. J’ai compris récemment (en lisant Maxime Duchesne sur Globe.ca) que ce qui inquiète “l’autre camp” (je m’excuse pour ce descriptif) c’est le progrès de l’anglais. Et il est vrai que sur toutes les statistiques, l’anglais progresse.

Mais honnêtement, je m’en fous. Pourquoi donc? Parce que tout indique que les francophones, qui sont de plus en plus exogames, font du va-et-vient entre les langues tant à la maison qu’au travail. C’est pour ca que contrairement à Maxime Duchesne et Patrick Sabourin, je refuse de retirer la moitié du poids des catégories “français et anglais” et “français et autres”. Après tout, on n’est pas un “demi-francophone” parce qu’on parle l’anglais courrament. C’est pour cela que mes chiffres démontrent qu’il n y a aucun déclin à ce niveau entre 2006 et 2011.

Et encore une fois, mes collègues oublient toujours le fait le plus important dans ce débat. Puisque même, si ils ont raison selon leur estimation la plus pessimiste, le français a chuté de 81,8% à 81,2% en cinq ans comme langue la plus souvent parlée, ils ne peuvent pas expliquer comment il se fait que la connaissance du français a progressé radicalement entre 1991 et 2006 (chez tous les groupes linguistiques) et que celle de l’anglais a stagnée chez les allophones. Ils ne peuvent pas non plus expliquer pourquoi les anglophones utilisent de plus en plus le français au travail (tant régulièrement que “prédominant”) et ils ne peuvent pas expliquer non plus pourquoi les allophones font la même chose. Ils ne peuvent pas non plus expliquer pourquoi les immigrants disent qu’ils trouvent que le français est plus utile qque l’anglais) pour se chercher du travail, s’intégrer socialement, poursuivre des études, s’ajuster à la vie au Québec et se faire des nouveaux amis. Toutes leurs explications du léger déclin (selon leurs calculs les plus avantageux pour leurs positions – que je conteste encore et toujours) de 2006 à 2011 ne peuvent pas répondre à ces points.

La raison de ces progrès c’est que, comme le dit Statistiques Canada, “les immigrants du Québec étaient nombreux à déclarer que l’apprentissage de chacune des deux langues officielles était important ou très important pour eux”. Pour eux, les deux langues sont une source d’investissement en capital humain (ÉDUCATION). Pour les immigrants, le français est un outil pour accéder aux emplois (les francophones de tout sexes ont eu la croissance la plus rapide des revenus depuis 1970 – toutes choses étant égales par ailleurs) et l’anglais bonifie grandement cet investissement initial. En gros, peu importe le pays, la langue est un investissement pour les immigrants. Dans la situation multilinguistique du Québec, les immigrants sont conscients que les deux langues produisent le meilleur rendement possible, surtout qu’ils ne se sont pas familiarisés pendant aussi longtemps aux fonctionnements de leur société d’acceuil que les natifs de celle-ci.  Barry Chiswick et al. ont documenté parfaitement cette réalité pour la situation canadienne.

Le progrès de l’anglais s’explique en grande partie par cet investissement en capital humain des immigrants auquel s’ajoute celui des francophones au même chapitre. Toutefois, les immigrants apprennent de plus en plus le français aussi (dans une proportion plus grande et plus rapide). C’est pour cela que de 1991 à 2006, on a vu des progrès du français importants en même temps qu’un léger progrès de l’anglais qui se continue jusqu’à 2011. En gros, de 1991 à 2011 (sur 20 ans), le Québec s’est francisé et s’est anglicisé – donc il est devenu de plus en plus multilinguistique.

Ajoutons une hypothèse qu’aucun des apologistes “de l’autre camp” ne considère: celui des effets pervers de l’aggrégation des données. En aggrégant des données, on peut contre-annuler des observations différentes. Par exemple, imaginons qu’un francophone marrie une allemande et qu’il parle principalement allemand à la maison. Selon les statistiques, il y aura un déclin du français comme langue d’usage. Toutefois, les enfants de ce dernier iront à l’école en français – donc ils l’apprendront. Ce que les statistiques ne nous disent pas c’est si le père francophone utilisera le français dans le domaine public. Les statistiques aggrégées nous montreraient dans ce cas hypothètique un déclin du français alors que les enfants de la femme allemande parleront français quand même, que le père parlera français au travail. Toutefois, les statistiques sur le français ne nous diront rien sur ce déplacement de l’utilisation du français. Mais qui, face à une telle situation, parlerait sans rire d’un déclin du français?

Le fait est que les définitions statistiques telles qu’utilisées par “l’autre camp” exclut véritablement toute compréhension de la réalité complexe du multilinguisme causé par les interactions transcendant les lignes ethno-linguistiques. On peut se borner autant qu’on veut, mais le fait est que cette réalité est bien plus complexe que veulent le laisser croire quelques personnes.

*Quant au 85% de mon billet précédent, il s’agit seulement d’un chiffre que j’ai ajouté pour tester la sensibilité des affirmations de certains alors que le 80% est le chiffre de Statistiques Canada. À défaut d’avoir des données micro, je ne peux pas effectuer une régression et des tests de robustesse et de sensibilité aux hypothèses, alors je fais “the next best thing” en utilisant 85%.

Le calcul farfelu et la réalité

Suite à mon plus récent texte sur le français dans le Huffington Post, un autre bloggeur a décidé de s’attaquer à mes calculs et c’est louable. Selon ce dernier, mes calculs sont erronées. Pour ce faire, il faut comparer les hypothèses et surtout, les justifications pour celles-ci.

Il faut comprendre que la catégorie “autres combinaisons” est suffisament large pour avoir un effet statistiquement significatif sur les affirmations de mon jeune collègue. En effet, mon hypothèse repose sur le fait que la catégorie “autres combinaisons” exprime les combinaisons trilingues (dans lesquelles le français est présent) à 80% pour la région Métropolitaine de Montréal seulement – c’est probablement plus élevé dans le reste de la province. Quant à exclure ceux qui cohabitent dans les deux langues, c’est une erreur puisque les francophones – surtout les plus jeunes sont très exogames et se marrient en dehors de leur groupes linguistiques. Ainsi, les langues se cotoîent souvent dans les ménages faisant signe d’exogamie. Pour illustrer, mon frère s’appelle Frédéric Giguère et a marrié une allemande qui parle principalement l’allemand avec ses enfants à la maison même si ma nièce et mon neveu parlent le français et vont à l’école en français. L’exemple personnel n’est pas le meilleur, mais il illustre bien comment l’exogamie et l’évolution du marriage et de la fécondité peut affecter notre interpretation des statistiques. Ainsi, exclure 50% des catégories comme Duchesne le fait nie une partie de la réalité. Ainsi, en tenant compte de ces statistiques, voici les résultats qui montrent qu’il est virtuellement impossible de parler d’un déclin du français. En fait, puisque le 80% s’applique à la région de Montréal seulement, il est très possible que ce taux soit plus élevé en région, une simple augmentation de 80% à 85% de ce seuil montre l’absence d’un déclin alors qu’à 80%, le changement est d’un ridicule 0.03%  – une vraie crise vous admettrez.

Mais soyons honnêtes avec Duchesne, une courtoisie qu’il faut toujours étendre à tous aux fins du débat: l’anglais progresse. Il a tout fait raison de remarquer que l’anglais progresse. Mais la question n’est pas là, la question vise à savoir si l’anglais évince le français et la réponse est non. Les francophones parlent un peu plus l’anglais et ca leur assure un revenu plus élevé. Les allophones eux, souvent des immigrants, ont des nets bénéfices à parler toutes les langues officielles puisqu’elles sont un substitut (et un complément parfois) à l’acquisition de formation professionelle, technique ou universitaire (une langue maîtrisée de plus équivaut au gain de revenu d’une année de scolarité de plus). Ainsi, on voit juste que le multilinguisme brouille les cartes mais que somme toute, le déclin du français est un figment de l’imagination de certains qui veulent conclure ce qu’ils ont toujours voulu conclure.

Il y a un problème additionnel: Statistiques Canada met en garde contre les comparaisons avec les précédents recensements sauf 2006. Alors regardons si j’ai tort en utilisant seulement les recensement de 1991 à 2006. Ainsi, on remarque que les plus récentes cohortes d’immigration adoptent massivement le français à la maison comme langue d’usage. On remarque aussi que le français au travail est utilisé de plus en plus fréquemment par les travailleurs immigrants.  Pour les anglophones aussi d’ailleurs. La connaissance du français a augmenté chez tous les groupes alors que celle de l’anglais a stagné chez les allophones depuis 1991 (p.29). Selon l’OQLF, la force d’attraction relative du français a augmenté depuis 1991 (p.43).

Donc si le français a progressé massivement depuis 1991 et qu’il y a au pire, un ralentissement des progrès, ca veut juste dire que le français a progressé et qu’il a rejoint un plateau. Il n’est pas en déclin. Le multilinguisme est une réalité dont tous les économistes sont au courant et qui affecte de manière importante la compréhension du capital humain (puisque la langue est un capital humain). En étant conscient de ceci, ils sont conscients du fait qu’une langue peut très bien coexister avec d’autres langues et être utilisé courramment surtout si celle-ci est la langue du groupe dominant.

Je m’excuse si ce texte est rempli de justifications méthodologiques, normalement j’essaie de simplifier le plus possible afin de favoriser l’interaction, mais des fois il faut rectifier des absurdités et de telles élaborations sont nécessaires.

CORRECTION: une coquille s’est introduite dans mon second tableau, les scénarios devraient être “(2+3+4+6)/1” et “(2+3+4+7)/1” et non pas “(1+2+3+6)/1” et “(1+2+3+7)/1”. Il s’agit d’une coquille d’écriture, mais les calculs sont valides.

Le français à Montréal : une autre note de bas de page omise!

L’ensemble du débat sur le déclin ou sur les progrès du français revient à un seul élément : le multilinguisme.  Sans verser dans la caricature, ceux qui voit un déclin assume que le multilinguisme ne crée aucune distorsion des statistiques. Ceux qui comme moi voient un progrès affirment que le multilinguisme brouille les statistiques et qu’il faut regarder la connaissance et l’utilisation de plusieurs langues équivalentes dans un ménage. Chez les immigrants, ce point est particulièrement important – même chez les enfants des immigrants. Pour voir un déclin, il faut omettre cette réalité et aussi ne pas lire les notes en bas de page des tableaux du recensement.

Je viens d’une famille italienne d’origine et l’anglais est la première langue que j’ai appris conjointement avec l’italien (que je parle très peu fréquemment) et le français qui est ma langue de tous les jours.  Nous sommes tous des immigrants de 1ère ou 2ème génération. Mon père parle en italien à ma grand-mère et ma sœur (qui elle parle en français et a été toute son enfance à l’école française), ma mère parle en anglais et français avec moi et mon père me parle principalement en français, j’ai été à l’école en français jusqu’à la fin de mon baccalauréat. Je sors avec une Saguenéenne qui parle les deux langues avec moi à la maison et français au bureau. Mon frère a mariée une allemande qui parle allemand avec ses enfants, mais mes neveux et nièces me parlent français exclusivement et comprennent l’anglais. Avez-vous suivi? Pas besoin, c’est mon point! C’est très difficile de savoir quelle est la langue d’usage dans un tel contexte.

Lorsque ma famille a rempli le recensement, nous avons inscrit trois langues différentes comme langue d’usage puisque nous ne mesurons pas les « parts » du français, de l’anglais et de l’italien chez nous. Et il y a des milliers de familles comme nous comme je le notais hier (60,000 personnes en 2006 et plus de 100,000 en 2011). C’est assez significatif pour créer une distorsion de la réalité si on regarde uniquement la langue la plus souvent utilisée.

Par contre, si on regarde les « combinaisons » de langue, on peut capturer une partie des effets du multilinguisme. Selon les données de Statistiques Canada, il y a sept combinaisons : français uniquement, anglais uniquement, autre uniquement, français et anglais, français et autre, anglais et autre et autres combinaisons.

Entre 2006 et 2011, pour la région métropolitaine de Montréal, « anglais seulement » a diminué et « autre uniquement ». La catégorie « français uniquement » a diminué aussi – de plus de 3 points. Toutefois, « français et autre » a augmenté de 2 points, ce qui est plus rapide que « anglais et autre » et « français et anglais » a augmenté de manière important. Toutefois, « autre combinaisons » (qui inclut le trilinguisme) a augmenté de 1,2 points. Et c’est ici que l’erreur des apologistes du déclin débute. Selon Statistiques Canada, « plus de 80 % de cette catégorie est constituée des situations de trilinguisme incluant le français, l’anglais et une autre langue. » Dans la région métropolitaine de Montréal, on parle quand même de plus de 100,000 personnes en 2011, assez significatif vous admettrez.

Si on ajoute « français uniquement », « français et autre », « français et anglais » et 80% de « autre combinaisons », on remarque que le français était présent dans 77.12% des ménages en 2006 contre 77.18% en 2011, ce qui est inférieur au 77.92% de 2001, mais difficilement un « déclin » tragique considérant le changement de la composition démographique de Montréal et de son poids à l’intérieur du Québec. En somme, tout ce qui se passe c’est que les ménages montréalais mélangent agréablement les langues comme ma famille tout à fait étrange le fait.

En gros, les apologistes du déclin tombent dans le piège de base qui guette tous les statisticiens et économétriciens en herbe : celui des définitions des variables et de la bonne définition du modèle pour tirer des conclusions. Toute conclusion avec des statistiques est sensible aux hypothèses utilisées. En niant la réalité du multilinguisme, les apologistes du déclin font un peu comme le gars au limbo qui lève la barre pour pouvoir mieux passer en dessous. C’est drôle, mais ce n’est pas rigoureux!

Ne pas lire les notes en bas de page, omettre les définitions et conclure!

Suite à mon article d’hier sur le français, les réactions ont été nombreuses et malheureusement elles reviennent toutes à une note en bas de page que certains n’ont pas voulu dans les études de Statistiques Canada. Je m’explique.

Selon le tableau 4 de « Caractéristiques linguistiques des Canadiens », le français comme  langue la « plus souvent parlée » à la maison est passée de 81,8% à 81,2% entre 2006 et 2011. Ainsi, on voit un déclin. Toutefois, Statistiques Canada prend la peine de noter que « les réponses multiples à la question ‘la langue parlée la plus souvent à la maison’ ont été réparties à parts égales entre les groupes linguistiques ».  Ainsi, si vous parlez le français, l’anglais et l’italien de manière équivalente dans votre maison, on vous divisait en trois.  Lorsqu’on compare avec le tableau 2 de « Le français et la francophonie au Canada » publiée conjointement par Statistiques Canada, on voit que cette petite note en bas de page ceci cause un écart important dans le nombre de personne ayant déclarés utilisé le plus souvent le français (6 146 595 personnes contre 6 085 150 – soit un écart de 61,445 personnes en 2006 et un écart de 105 575 en 2011).

Vous admettrez toutefois que si je parle l’anglais avec ma conjointe, l’italien avec mon père et le français avec mes enfants, il est difficile de parler d’un déclin du français. Ainsi, le 81,2% claironné par certains est en fait de 82,52% en 2011 et était de 82,66% en 2006 – un déclin bien moins frappant pour l’imagination.

Et ce n’est pas tout, il faut considérer les définitions. Le tableau 4 de « Caractéristiques linguistiques des Canadiens » prend seulement la « langue la plus souvent parlée » et n’inclut pas la langue régulièrement parlée. Encore une fois, si vous êtes un adulte immigrant allophone et que vous essayez d’éduquer vos enfants pour qu’ils conservent une partie de leur héritage, il est très probable que la langue la plus souvent utilisée ne soit pas le français. Toutefois, les enfants iront à l’école en français et il est très probable que vous travailliez en français (les statistiques de StatCan montrent ceci aussi pour 2001-2006). Difficile encore une fois de parler d’un problème si tout ce qui se passe c’est une perméabilité grandissante des identités linguistiques. Par ailleurs, cela fait vingt-cinq ans que je parle en anglais avec mon père, en français avec ma mère et en italien avec mes grands-parents et je suis considéré comme « anglophone » avec l’anglais comme langue d’usage. Cependant, j’utilise « régulièrement » le français – une statistique collectée lors du recensement. En ajoutant le pourcentage personnes au Québec qui parlent « souvent » à ceux qui le parlent « régulièrement », on arrive à observer un progrès de 0,1 points entre 2006 et 2011 de 86,9% à 87%.

Pour arriver à la conclusion d’un déclin du français à partir des données du dernier recensement, il faut ignorer les notes en bas de page, omettre les définitions et conclure!

Fausses hypothèses, faux résultats

Alors que je m’apprête à publier mon livre sur la Grande Noirceur et la Révolution Tranquille, je viens finalement de comprendre comment on entretient des mythes.

En effet, j’ai longtemps été perplexe face à mes résultats en comparaison avec ceux de l’économiste Pierre Fortin de l’UQÀM qui affirme que le revenu réel par personne active au Québec a augmenté aussi vite qu’en Ontario. En somme, Fortin affirme que le Québec ne pouvait pas fermer l’écart. Ce dernier a fait l’hypothèse pour toute la période de 1926 à 1960 que les prix au Québec étaient plus bas de 10% qu’en Ontario. À première vue, je n’ai pas critiquée cette hypothèse, je trouvais simplement que prendre la population active (15 à 65 ans) n’était pas une mesure adéquate de la qualité de vie puisque les enfants de moins de 15 ans doivent aussi profiter du revenu obtenu.

Cependant, alors que je relisais un article sur les prix au Canada entre 1883 et 1923 qui utilisait les prix produits dans les rapports annuels des pénitenciers, j’ai été frappé de remarquer que l’hypothèse du 10% était fausse. En effet, entre 1883 et 1923, j’ai remarqué que les prix observés à Montréal étaient souvent plus élevés (beaucoup plus) que ceux observés pour Kingston, mais qu’ils convergeaient pour atteindre le même niveau.

Mais il s’agit seulement de Kingston ici, une ville nettement plus petite que Montréal et moins active économique, on peut donc présumer que les prix étaient plus bas. Cependant, la tendance est indicatrice, surtout au cours des années 1920. Et ensuite? Il existe d’autres indices de prix qui montrent qu’entre 1900 et 1910, les prix étaient plus élevés à Montréal qu’à Toronto (deux villes comparables) et que par la suite, les écarts étaient nettement inférieurs à 5%. En fait, plusieurs années, les prix étaient plus élevés à Montréal qu’à Toronto.

En moyenne pour les temps de paix, l’écart environne 3.5%.  Même si on compare des villes plus petites Québec avec Hamilton en Ontario (villes comparables), on remarque que les prix étaient en moyenne inférieurs d’à peine 4.5% au Québec en période de paix.En plus, en utilisant les indices de prix de Statistiques Historiques de Statistiques Canada pour les villes (disponible à partir de 1940),on peut lier les données de Montréal à une année précise de Toronto (1949 dans notre cas – où les prix de Montréal en 1955 seraient exprimés en dollars de Toronto de 1949) et estimer la différence de prix. Même si ce n’est pas une mesure parfaite, on remarque que les prix à Montréal étaient plus élevés qu’à Toronto par environ 2,4% entre 1940 et 1960. Ce n’est seulement qu’au cours des années 1960 et 1970 que les prix commenceront à être plus bas à Montréal qu’à Toronto.

Toute l’analyse des revenus réels des Québécois qui ne tient pas compte de ces différences de prix ou qui tient compte d’une mauvaise différence de prix produira une fausse image de la réalité. Le Québec n’a pas stagné relativement à l’Ontario entre 1945 et 1960. En prenant les indices de prix de Statistiques Canada (tout en comparant avec les autres indices), on remarque que le Québec a effectué un rattrapage important après avoir décliné tout au long des années avant 1945!