Passer au contenu principal
Accueil - Assistance OCLC

Jeux de caractères valides pour les alphabets pris en charge

Jeux de caractères valides pour les alphabets non latins pris en charge dans Gestion des notices.

Arabe, CJK (chinois, japonais et coréen), cyrillique, grec et hébreu

Les jeux de caractères pour ces alphabets sont répertoriés dans les Spécifications MARC 21 pour les jeux de caractères (https://www.marc21.ca/M21/M9210.html). Ces jeux de caractères MARC-8 sont des sous-ensembles de caractères Unicode approuvés pour une utilisation dans le catalogage MARC 21. 

Les alphabets définis par les jeux de caractères MARC-8 sont pris en charge pour les notices bibliographiques et pour les variantes de vedettes dans les notices d'autorité. 

La liste suivante indique la portée des caractères valides dans les applications de catalogage d'OCLC pour les alphabets arabes (y compris le persan), CJK, cyrilliques, grec et hébreu : 

  • Arabe de base = 33(hex) [graphique ASCII : 3] 
  • Arabe étendu = 34(hex) [graphique ASCII : 4] 
  • Chinois, japonais, coréen (EACC) = 31(hex) [graphique ASCII : 1] 
  • Cyrillique de base = 4E(hex) [graphique ASCII : N] 
  • Cyrillique étendu = 51(hex) [graphique ASCII : Q] 
  • Grec de base = 53(hex) [graphique ASCII : S] 
  • Hébreu de base = 32(hex) [graphique ASCII : 2]  

 Note. - Dans les notices bibliographiques, l'application insère respectivement la notation (3, (4, $1, (N, (Q, (S ou (2 dans la zone 066 pour indiquer quel(s) alphabet(s) sont utilisés dans une notice. Si plusieurs alphabets sont utilisés, les notations sont insérées individuellement, chacune dans une sous-zone c distincte.  

Arménien, bengali, devanagari, éthiopien, syriaque, tamoul et thaï

Ces alphabets sont pris en charge uniquement pour les notices bibliographiques. 

Il n'existe pas de jeux de caractères MARC-8 définis pour l'arménien, le bengali, le devanagari, l'éthiopien, le syriaque, le tamoul ou le thaï. De plus, Gestion des notices prend également en charge les caractères cyrilliques en dehors du jeu de caractères MARC-8 (en anglais). OCLC a implanté les codes d'identification d'alphabets suivants pour ces écritures basées sur les Codes pour la représentation des noms d’écritures

La liste suivante montre les plages de caractères Unicode UTF-8 qui définissent les caractères valides pour ces écritures dans Gestion des notices : 

  • Armn = arménien (plage de caractères U+0530 à U+058F) 
  • Beng = bengali (plage de caractères U+0980 à U+09FF) 
  • Cyrl = jeu de caractères cyrilliques (en dehors du jeu de caractères MARC-8) (en anglais) 
  • Deva = Devanagari (plage de caractères U+0900 à U+097F) 
  • Ethi = éthiopien (plage de caractères U+1200 à U+1399, U+2D80 à U+2DDF, U+AB00 à U+AB2F) 
  • Syrc = syriaque (plage de caractères U+0700 à U+074F) 
  • Taml = Tamoul (plage de caractères U+0B80 à U+0BFF) 
  • Thaï = Thaï (plage de caractères U+0E00 à U+0E7F) 

 Note.- Gestion des notices insère respectivement Armn, Beng, Cyrl, Deva, Ethi, Syrc, Taml ou Thai dans la zone 066 d'une notice bibliographique pour indiquer l'utilisation de l'écriture. Si plusieurs écritures sont utilisées, les notations sont insérées individuellement, chacune dans une sous-zone c distincte. 

Limitations d'utilisation des alphabets arménien, bengali, cyrillique (en dehors du jeu de caractères MARC-8), devanagari, éthiopien, syriaque, tamoul et thaï

  • Pour exporter des notices contenant des alphabets arménien, bengali, cyrillique (en dehors du jeu de caractères MARC-8 (en anglais)), devanagari, éthiopien, syriaque, tamoul et thaï, vous devez sélectionner l'option de jeu de caractères Unicode UTF-8 dans :  
    • Préférences utilisateur > Exportation - Notices bibliographiques > Général; sélectionnez le format MARC 21 avec UTF Unicode 

Étant donné que les alphabets arménien, bengali, cyrillique (en dehors du jeu de caractères MARC-8 (en anglais)), devanagari, éthiopien, syriaque, tamoul et thaï ne font pas partie des caractères MARC-8, vous ne pouvez pas exporter ou importer ces écritures à l'aide de l'option de jeu de caractères MARC-8. 
 
Étant donné que les caractères MARC-8 font partie d'Unicode UTF-8, vous pouvez exporter ou importer en toute sécurité des notices en arabe, CJK, cyrillique (en dehors du jeu de caractères MARC-8), grec et hébreu à l'aide de l'option de jeu de caractères MARC-8 ou UTF-8 Unicode. 

  • Les alphabets arménien, bengali, cyrillique (en dehors du jeu de caractères MARC-8 (en anglais)), devanagari, éthiopien, syriaque, tamoul et thaï ne sont pas pris en charge pour les variantes de vedettes dans les notices d'autorité.

Caractères non valides dans Gestion des notices

Tous les caractères qui ne sont pas inclus dans les listes ci-dessus de caractères définis ou qui ne peuvent pas être insérés via Insérer diacritique sont invalides. Pour inclure des caractères non latins dont vous avez besoin, mais qui ne sont pas valides dans Gestion des notices, vous pouvez : 

  • Saisissez le caractère dans la notice, exportez la notice vers votre système local à l'aide du format d'exportation Unicode, puis supprimez le caractère avant de traiter la notice dans WorldCat. 

Ou 

  • Saisissez le nom du caractère entre crochets, en utilisant la norme Unicode si disponible (par exemple, saisissez [schwa]), ou pour les caractères CJK, saisissez la lecture du caractère (par exemple, saisissez [yin]). 

Pour référence, consultez les tables Unicode (https://fr.wikipedia.org/wiki/Table_...de_(0000-0FFF)), qui contiennent un index des noms de caractères. 

Note. - L'accès Z39.50 aux notices WorldCat prend également en charge les jeux de caractères MARC-8 et Unicode UTF-8. Voir Catalogage Z39.50 pour plus d'informations sur la prise en charge des alphabets non latins dans Z39.50. 

Les alphabets multiples dans une seule notice sont valides

Utilisez autant d'alphabets non latins pris en charge que nécessaire n'importe où dans une notice, y compris dans la même zone.