Canalblog
Suivre ce blog Administration + Créer mon blog
Publicité
Premiers pas virtuels vers le chinois...
Archives
Visiteurs
Depuis la création 5 043
20 octobre 2011

Ecriture chinoise Données de psychologie expérimentale

Viviane Alleton du même auteur Les études des psychologues sur l’écriture chinoise tendent à montrer que les processus cognitifs mis en œuvre pour lire celle-ci sont plus proches qu’on ne l’imaginait de ceux observés pour les écritures alphabétiques....
Publicité
20 octobre 2011

Segmentation multiple d’un flux de données textuelles pour la modélisation statistique du langage

Dans cet article, nous traitons du problème de la modélisation statistique du langage pour les langues peu dotées et sans segmentation entre les mots. Tandis que le manque de données textuelles a un impact sur la performance des modèles, les erreurs introduites...
20 octobre 2011

Ministère de la Sécurité de l'État (Chine)

Le ministère de la Sécurité de l'État (Guoanbu, en chinois simplifié : 国家安全部, en pinyin : Guójiā Ānquánbù), appelé aussi MSS (Chinese Ministry of State Security) est l’agence de sécurité et probablement les services secrets de la République populaire...
17 octobre 2011

Nouvelle affaire d'espionnage chinois en France

«Une opération d'espionnage délibérée». Pour les enquêteurs de la direction centrale du renseignemenrt intérieur (DCRI), les deux stagiaires chinois surpris le mois dernier en Lorraine en train de photographier un prototype de moteur dans la société française...
11 octobre 2011

L’ère numérique

La question des codages Premières tentatives et tentatives nationales Les premiers ordinateurs fonctionnent avec les caractères occidentaux, une multitude de codages spécifiques à une compagnie (Adobe, Sony) font leur apparition. Un fichier ne peut alors...
Publicité
6 octobre 2011

Viviane Alleton

Viviane Alleton
6 octobre 2011

ALLETON, V. (1994). Le nombre de syllabes d’un

ALLETON, V. (1994). Le nombre de syllabes d’un mot est-il pertinent en chinois contemporain ? HUANG, Z., YANG, J. (黃志強, 楊劍橋) (1990). Lun hanyu shuangyinjiehua de yuanyin 論漢語詞彙雙音節化的原因(Étude du dissyllabisme des mots chinois). 復旦學報 (社會科學版) Fudan Journal...
6 octobre 2011

GB2312 GB18030 Big 5

GB2312 est un jeu de caractères utilisé en Chine. Il attribue un code de 16 bits pour un sinogramme simplifié, soit deux octets. Mais certains caractères rares ne peuvent pas être représentés avec ce système. GB18030 a donc été créé et il supporte les...
6 octobre 2011

Penn Chinese Treebank

Le Penn Chinese Treebank contient des corpus segmentés, étiquetés de POS de 500 milliers de mots chinois. Les ressources des corpus proviennent de l’agence de presse Xinhua, Sinorama news magazine et Hong Kong News. http://www.cis.upenn.edu/~chinese/ctb.html...
6 octobre 2011

Segmenteurs Hylanda et ICTCLAS

Source : Li-Chi WU1 lucielichi@gmail.com (SYLED, Université Sorbonne Nouvelle Paris III) L’entreprise Hylanda à Tianjin fait des études sur le traitement automatique de la langue chinoise dans la fouille de textes. Elle développe également des produits...
Publicité
1 2 > >>
Publicité
Publicité