Notes d'installation de WorldCat Discovery - Recherche et tri en thaï - Accueil

Introduction

Les notes d'installation suivantes concernent la prise en charge de la recherche et du tri en langue thaïe dans WorldCat Discovery mise en place en août 2024.

WorldCat Discovery comprend maintenant les améliorations suivantes en matière de recherche et de tri pour la langue thaïe standard attendue par les locuteurs natifs :

Recherche

Les phrases sont symbolisées afin d'identifier les mots thaïs individuels lors de la construction et de l'analyse des requêtes pour les index de mots.
Nous tenons à jour une liste de mots thaïs communs que nous combinons avec des mots adjacents lorsque nous construisons des index de mots et analysons des requêtes d'index de mots.

Tri

Nous appliquons la collation Unicode pour trier le script thaï avec les caractères de tous les autres systèmes d'écriture.

Ces améliorations à la recherche et au tri en langue thaïe complémentent l'interface utilisateur en thaï de WorldCat Discovery.

Fonctionnalités de recherche et de tri pour le thaï standard

Recherche

Les utilisateurs de votre bibliothèque qui cherchent des mots ou des phrases en thaï standard obtiennent maintenant des résultats de recherche qui répondent aux attentes des locuteurs natifs. Notamment :

Normalisation

Nous n'appliquons pas de normalisation aux index thaïs. Nous traitons toujours tous les symboles vocaliques et diacritiques thaïs comme significatifs et ne les ignorons jamais.

Exception - Caractères avec marques de tonalité : composées/décomposées

Nous indexons les caractères thaïs qui ont des marques de tonalité dans les formes composées et décomposées.

Exemple :

Lorsqu'il est saisi sous forme composée dans un terme de recherche, le caractère correspondra à la fois à la forme composée et à la forme décomposée dans l'index et vice versa : si la recherche est effectuée sous forme décomposée, elle correspondra à la fois à la forme décomposée et à la forme composée.

Segmentation en unités lexicales

Étant donné que les phrases en script thaï sont écrites sans espace entre les mots, pour reconnaître et indexer les mots thaïs individuels, nous appliquons la segmentation pour construire tous les index de mots thaïs et pour analyser les requêtes d'index de mots. Nous n'appliquons pas la segmentation pour les index de phrases ou les requêtes d'index de phrases.

L'indexation des mots thaïs individuels permet une recherche par index de mots qui permet de récupérer les notices contenant les termes de la requête n'importe où dans les zones indexées appropriées.

Exemple

	Thaï	Traduction en anglais
Requête	ti:สนทนาภาษาจีน	Chinese conversation
Requête avec segmentation	· สนทนา · ภาษา · จีน	· talk/converse · language · China
Titre de la notice correspondante	สนทนา 3 ภาษา ไทย-อังกฤษ-จีน โต้ตอบอย่างมั่นใจ พิชิตงานบริการในโรงแรม	Conversation in three languages: Thai-English-Chinese. Respond confidently and conquer service jobs in hotels.
Titre de la notice avec segmentation	สนทนา 3 ภาษา ไทย อังกฤษ จีน โต้ตอบ อย่าง มั่นใจ พิชิต งาน บริการ บริการ_ใน ใน ใน_โรงแรม โรงแรม	Talk/Converse 3 language Thai England China respond at/manner confident conquer work service service_in in in_hotel hotel

Mots courants

Si l'on se réfère à la liste des mots thaïs standards courants ci-dessous, plutôt que de les traiter comme des mots vides, ce qui reviendrait à les ignorer pour l'indexation et la mise en correspondance, nous les combinons avec les mots adjacents lorsque nous construisons des index de mots et analysons les requêtes d'index de mots.

Lorsqu'un mot thaï courant est ignoré (traité comme un mot vide), le mot adjacent qui reste peut avoir un sens différent de celui qu'il aurait s'il était combiné/adjacent à un mot courant. Cette différence de sens peut conduire à la récupération de notices non pertinentes. Dans les cas où le sens d'un mot aurait changé si nous avions supprimé le mot courant adjacent, le fait de le combiner avec le mot courant adjacent permet de désambiguïser son sens, ce qui améliore la précision de la recherche en réduisant la récupération de notices non pertinentes.

Nous appliquons le traitement des mots courants décrit ci-dessus lors de la création et de la recherche dans les index suivants :

se: Series (Collection)
ti: Title (Titre)
kw: Keyword (Mot-clé)

Exemple

Mot courant traité comme un mot vide

Requête ti:มาตราการ (mesures/procédure)
Segmenté en มาตรา et การ
Le mot courant การ est supprimé comme mot vide laissant seulement มาตรา.
มาตรา a une signification différente (article ou clause de loi) de มาตราการ (mesures/procédure) et renvoie donc à des notices qui ne sont pas pertinentes pour la requête ti:มาตราการ

Mot courant traité comme un mot adjacent

Requête ti:มาตราการ (mesures/procédure)
Segmenté en มาตรา_การ (parce que การ est défini comme un mot courant)
Notices avec zones de titre contenant มาตราการ
Titres segmentés en มาตรา มาตรา_การ การ
Uniquement les notices contenant มาตราการ sont récupérées.

Liste de mots courants en thaï

กว่า

กับ

การ

ก็

ขณะ

ของ

ความ

คือ

จะ

จึง

ซึ่ง

ด้วย

ตั้งแต่

ต่างๆ

ถึง

ถ้า

ทั้ง

ทั้งนี้

ที่

นั้น

นี้

ว่า

หรือ

หาก

อะไร

อาจ

อีก

เช่น

เนื่องจาก

เป็นการ

เพื่อ

เมื่อ

เลย

เอง

แต่

และ

แล้ว

โดย

ใน

ไว้

Tri

Nous trions les zones d'auteur, de titre et de cote en thaï standard en utilisant l'ordre de classement par défaut de l'algorithme de classement Unicode que nous appliquons à tous les jeux de caractères et à toutes les langues.

Le tri alphabétique est disponible dans WorldCat Discovery lors de l'utilisation de ces fonctionnalités :

Tri des résultats de recherche :

Auteur (A à Z)
Titre (A-Z)

Le filtre de recherche Auteur a été élargi avec Voir plus :

Le filtre Auteur affiche les auteurs triés par nombre de notices correspondantes (par ordre décroissant). Si l'option Voir plus est sélectionnée, les auteurs sont alors triés par ordre alphabétique.
Si les résultats élargis et triés alphabétiquement comprend les noms d'auteur en divers jeux de caractères, les noms en caractères latins sont affichés en premier, suivis des noms dans d'autres jeux de caractères.

Survol du rayon depuis l'écran des détails sur le document :

Survol du rayon en utilisant le tri des cotes. Le tri par cote permet généralement de différencier les documents ayant la même cote à l'aide d'un suffixe alphabétique. Par exemple, QV772 ร451 serait trié avant QV772 ล148ย parce que ร est trié avant ล.

Liens importants

Sites Web des produits

Plus d'informations sur le produit sont disponibles ici.

Heures de bureau

Heures de bureau pour WorldCat Discovery

Aide et documentation

De la documentation et de l'assistance pour ce produit et les produits associés sont disponibles. Consultez les liens ci-dessous.

Si vous avez d'autres questions, veuillez contacter le service d'assistance technique d'OCLC par téléphone au 1-800-848-5800, du lundi au vendredi de 8 h à 19 h (heure de l'Est), ou par courriel à l'adresse support@oclc.org. Pour toute demande d'assistance au Royaume-Uni et en Irlande, veuillez contacter le service d'assistance technique au +44-(0)114-281 60 42, ou par courriel à l'adresse support-uk@oclc.org. L'assistance technique est disponible de 9 h à 17 h 30 (heure du Royaume-Uni).

Ajout de l'ID de demande lors du signalement d'un problème

Lorsque vous signalez un problème avec WorldCat Discovery, l'ajout de l'ID de demande est extrêmement utile. L'ID de demande est affiché dans le bas de l'écran dans lequel le problème s'est produit. L'ajout de cette information nous permet de retracer les événements qui ont mené au problème.

Request ID screen.jpg

Normalisation

Segmentation en unités lexicales

Mots courants

Need help?

Follow OCLC

Support

Related sites

Stay in the know.