Chinoiseries : Quelques réflexions préliminaires sur la fréquence d’utilisation des caractères chinois (1)

Le 8 mars 2015, KG (alias Lutin Rouge) me faisait la remarque suivante, à propos du sinogramme 神 [shén], qui, dans la ma liste, se trouve à la 236ème place dans l’ordre de fréquence d’utilisation des sinogrammes : « Sur la liste que j’utilise ce caractère est classé 372ème !
Il me semble que vous aviez parlé de réordonner votre liste…
D’après vous, quelle liste serait la plus juste et la plus officielle, et où pourrait-on la trouver ? »
La réponse la plus simple consisterait à renvoyer les lecteurs de Sinoiseries à l’une des nombreuses listes qui circulent sur l’Internet chinois, par exemple ici ou . Dans ces deux listes, le sinogramme 神 est bien classé en 236ème position. Il est bon de préciser que ces deux listes (et beaucoup d’autres, identiques) se trouvent sur des sites chinois. Or, je crois deviner que la position à la 372ème place indiquée par KG vient de listes qui circulent sur le web français, par exemple ici. Alors, quid ?
Je crois qu’il est plus que temps de dissiper un malentendu : les listes qui sont données sur les sites français d’apprentissage du chinois sont « fausses ». Je m’explique : les listes de 400 ou des 800 sinogrammes donnés comme étant les plus « fréquents » ne donnent en réalité pas les sinogrammes plus fréquents stricto sensu : ce sont les sinogrammes dont la connaissance est exigée pour les lycéens français qui passent le bac, en prenant le chinois comme première ou deuxième langue étrangère. J’ai discuté de ce sujet avec une amie qui enseigne le chinois au Lycée Français de Pékin, qui m’a confirmé que la fréquence d’utilisation n’a pas été le seul critère de choix des sinogrammes composant les listes scolaires : ont été également pris en compte, dirons-nous pour faire simple, des facteurs pédagogiques et les spécificités de l’apprentissage du chinois par des locuteurs étrangers.
Cela dit, il me semble qu’il n’est pas vraiment essentiel de savoir si le sinogramme 神 doit être classé à la 236ème ou à la 372ème position. Tout d’abord, la connaissance de 400 ou de 800 sinogrammes est absolument insuffisante pour être capable de lire couramment un texte chinois à caractère général, sans même parler des textes spécialisés !
En Chine continentale, pendant les six ans que dure l’école primaire, tous les enfants sont sensés apprendre plus de 2000 sinogrammes ! À Taiwan, ce nombre est porté à plus de 3500. Autrement dit, un élève français de terminale qui passe l’épreuve de chinois comme première langue étrangère et qui est sensé connaître 800 (en réalité, un peu plus) sinogrammes, a, du point du nombre de sinogrammes connus, un niveau très, très inférieur à celui d’un élève chinois de sixième. Notons en passant que l’ordre dans lequel les sinogrammes sont appris par les écoliers, qu’ils soient continentaux ou formosans, n’est en rien l’ordre de fréquence d’utilisation.
(Pour ce qui est de l’ordre des sinogrammes en fonction de leur fréquence d’utilisation, je vous invite à consulter cette page, qui reprend des données publiées par l’Université Tsinghua (清华大学 [qīnghuá dàxué]). Cette liste donne les 6763 sinogrammes les plus fréquemment utilisés en Chine continentale.)
En Chine continentale, il existe donc une liste officielle des 2500 « sinogrammes courants » (常用字 [chángyòngzì]), complétée d’une liste de 1000 « sinogrammes un peu moins courants » (次常用字 [cìchángyòngzì]). (Je vous invite à consulter cette liste ici.) À l’issue de leurs études secondaires, les lycéens chinois sont sensés connaître ces 3500 sinogrammes, qui constituent la base qui permet de lire à peu près tout texte écrit en chinois contemporain, pour peu qu’il ne soit pas trop spécialisé.
Ceux qui douteraient du caractère officiel de cette liste peuvent se reporter ici pour avoir la liste des 2500 sinogrammes les plus courants, et ici pour les listes des 1000 un peu moins courants. Ces deux listes se trouvent sur le site du Ministère de l’Education.
A l’épisode suivant, je me propose de développer le sujet, en parlant des limites de ces listes de fréquences d’utilisation, et des facteurs qui pourraient venir les corriger.
(La seconde partie de ce billet se trouve ici.)

Publicités
Cet article, publié dans Caractères, Chinoiseries, Divers, est tagué , , , , , . Ajoutez ce permalien à vos favoris.

2 commentaires pour Chinoiseries : Quelques réflexions préliminaires sur la fréquence d’utilisation des caractères chinois (1)

  1. Daniel dit :

    Réflexion intéressante.
    En effet si on se penche un peu en détail sur ces listes, il est très facile de les mettre en défaut.
    Je pense que la notion de fréquence et intéressante seulement pour les 100 ou 200 premiers mots les plus utilisés. Ensuite peu importe que tel caractère soit 500e ou 527e, étant donné que chaque apprenant aura ses propres domaines de prédilection.

    Mais ces listes proposent plutôt la fréquence des caractères écrits, et non la fréquence de mots à l’oral. Ce qui est bien dommage, car éloigné de la réalité quotidienne. D’autre part c’est souvent la même liste qui a du être établi dans les années 1990 et qui n »évolue pas.

    Il serait bien plus intéressant de disposer des mots les plus fréquents à l’oral plutôt que les caractères. Et surtout des mots actuels de la jeunesse chinoise. Comment est-il possible qu’on ne trouve pas dans les 100 premiers caractères, le caractère 手 shou (main) du mot 手提 shouji (portable).

    • pascalzh dit :

      Je pense pour ma part que ces listes de fréquences d’utilisation des caractères ont un intérêt très limité pour ce qui est de l’apprentissage de l’écrit. De plus, lorsque l’on voit le programme officiel d’apprentissage des sinogrammes en primaire en Chine, on s’aperçoit que l’ordre dans lequel les sinogrammes sont appris n’a absolument rien à voir avec l’ordre des fréquences d’utilisation.
      Je pense en outre qu’il est un peu malhonnête, intellectuellement, de faire croire que les 800 ou 900 sinogrammes qu’apprennent les élèves pendant leur scolarité jusqu’à la terminale suffisent pour leur permettre de lire 80 ou 90% des textes chinois contemporains, même non spécialisés. Les élèves qui sortent du primaire en Chine continentale connaissent 2000 ou 2500 caractères, en théorie, et cela ne leur suffit absolument pas pour les besoins de leurs études. Alors 800, 900, ou même 1000…
      Vous avez raison quand vous dites que ces listes sont contestables, et, surtout, qu’elles ne tiennent aucun compte de l’oral. Une fois encore, je crois que l’apprentissage du chinois (et des autres langues étrangères) dans la scolarité française pose problème. Je n’étais absolument pas capable de parler chinois correctement après quatre ans de chinois « intensif » aux Langues’O, et les étudiants qui avait appris le chinois au lycée avant d’entrer en fac n’avaient plus aucun avantage sur les grands débutants dès le seconde semestre de la première année.
      Je ne connais pas de liste qui donnerait les mots les plus fréquents utilisés à l’oral, mais il est vrai que je n’ai pas beaucoup cherché. Je prendrai un peu de temps pour voir si on peut trouver ça quelque part.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s